AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Seed-VC - 零样本实现声音克隆和转换的技术

Seed-VC 是一种零样本声音转换技术，基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练，只需提供1到30秒的参考语音样本，实现声音的克...

AI Projects12/18/2025

Phidias - 检索增强的3D内容生成模型，支持多模态输入

Phidias是一个先进的3D内容生成模型，将检索增强生成（RAG）的概念引入到3D建模领域。模型能基于用户提供的或从大型数据库中检索到的3D参考模型，辅助生成新...

AI Projects12/18/2025

Movie Gen - Meta推出文本驱动的AI视频生成与编辑工具

Movie Gen 是 Meta 推出的AI视频生成工具，能根据文本提示生成和编辑视频，为视频配上同步音频。技术包括创建长达16秒的高清视频、为现有视频配上音频、编辑...

AI Projects12/18/2025

Mini-LLaVA - 基于Llama 3.1的轻量级多模态大语言模型

Mini-LLaVA是一款轻量级的多模态大语言模型，由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本和视频输入，实现高效的多模态数据处理。Min...

AI Projects12/18/2025

MemoryScope - 为LLM聊天机器人配备的长期记忆系统

MemoryScope是一个为大型语言模型（LLM）聊天机器人设计的长期记忆系统。通过构建一个框架，使机器人记住用户的基础信息、习惯和偏好，提供个性化的交互体验...

AI Projects12/18/2025

CogView3 - 智谱AI推出的开源AI图像生成模型

CogView3是清华大学联合智谱AI推出的开源AI图像生成模型，采用中继扩散技术。模型分阶段生成图像，首先创建低分辨率图像，然后通过中继超分辨率技术提升至高...

AI Projects12/18/2025

RTranslator - 开源的离线、实时、多语言翻译应用程序

RTranslator 是一款开源、免费、离线实时翻译应用程序，专为 Android 设备设计。基于先进的AI技术，包括 Meta 的 NLLB 翻译模型和 OpenAI 的 Whisper 语音识...

AI Projects12/18/2025

Molmo 72B - 开源的多模态AI模型，基于Qwen2-72B模型，超越Llama 3.2

Molmo 72B是由艾伦人工智能研究所（Ai2）推出的一个开源多模态AI模型，专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型，使用OpenAI的CLIP作为视觉...

AI Projects12/18/2025

ProX - 提高大语言模型预训练数据质量的框架

ProX（Programming Every Example）是一个旨在提高大型语言模型预训练数据质量的框架。与传统依赖人类专家制定规则的方法不同，ProX将数据清洗任务视为编程问...

AI Projects12/18/2025

OutofFocus - 文本驱动图像生成或编辑的AI工具

OutofFocus是一个基于AI技术的图像编辑工具，基于Gradio平台为用户提供一个直观的界面操作和编辑图片。工具的核心功能是接受用户的文本提示，运用自然语言处...

AI Projects12/18/2025

TeleChat2-115B - 中国电信AI研究院推出的开源星辰语义大模型

TeleChat2-115B是由中国电信人工智能研究院（TeleAI）研发的大型语言模型，属于星辰语义大模型系列。基于国产算力进行训练，采用10万亿Tokens的中英文高质量...

AI Projects12/18/2025

GroundingBooth - Adobe联合多所高校推出主题和文本到图像的定制框架

GroundingBooth 是一个先进的文本到图像定制框架，由华盛顿大学圣路易斯分校、Adobe和普渡大学的研究团队共同推出。基于文本-图像对齐模块和遮罩交叉注意力层...

AI Projects12/18/2025

markmap - 解析Markdown生成可视化思维导图的工具

markmap 是一个将 Markdown 文本转换为思维导图的工具。基于 Markdown 的语法结构，实时生成可视化的思维导图，帮助用户直观的组织和展示信息。markmap 轻量...

AI Projects12/18/2025

OLMoE - 完全开源的大语言模型，基于混合专家（MoE）架构

OLMoE（Open Mixture-of-Experts Language Models）是一个完全开源的大型语言模型，基于混合专家（MoE）架构。OLMoE基于5万亿个token进行预训练，拥有70亿总...

AI Projects12/18/2025

WebDesignAgent - 自动化网页设计AI工具，零门槛搭建各类型网站

WebDesignAgent是一个自动化的网页设计工具，基于AI技术帮助用户轻松创建网站。用户提供简单的文本描述或上传图片，WebDesignAgent生成功能齐全、设计精美的...

AI Projects12/18/2025

ChatMLX - 高性能MacOS聊天应用，基于MLX框架实现与数据实时交互

ChatMLX是一个基于大型语言模型（LLM）的高性能MacOS聊天应用，基于MLX框架实现与数据的交互。应用通过自然语言处理技术，让用户与数据进行对话，支持文本文...

AI Projects12/18/2025

CDial-GPT - 清华推出的大型中文短文本对话数据集和对话生成模型

CDial-GPT是清华大学研究团队推出的大型中文短文本对话数据集LCCC及基于数据集的预训练对话生成模型。LCCC数据集经过严格的清洗流程，包含基础版（LCCC-base...

AI Projects12/18/2025

RD-Agent - 微软亚洲研究院推出开源的自动化研究与开发工具

RD-Agent是一个开源的自动化研究与开发（R&D）工具，由微软亚洲研究院推出。基于AI技术推动数据驱动的AI研发过程，专注于简化模型和数据的开发。RD-Agent...

AI Projects12/18/2025

FLUX1.1 - Black Forest Labs团队推出的超写实AI图像生成模型，代号“蓝莓”

FLUX1.1 Pro是Black Forest Labs团队最新推出的升级版AI图像生成模型，代号“蓝莓”，提供比前代快6倍的生成速度，同时保持了图像的及时性和多样性。FLUX1.1目...

AI Projects12/18/2025

Realtime API - OpenAI推出的实时语音交互API

Realtime API是OpenAI推出的一种低延迟、多模态的对话式API，支持文本和音频作为输入和输出。Realtime API允许开发者构建接近实时的交互体验，例如语音对语音...

AI Projects12/18/2025

Laminar - 分析与优化LLM应用程序的开源平台

Laminar是一个开源的可观测性和分析平台，专为大型语言模型（LLM）应用程序设计。Laminar提供一套完整的工具追踪、评估、注释和分析LLM数据，使开发者深入理...

AI Projects12/18/2025

MIP-Adapter - 阿里开源多参考图像融合的个性化图像生成技术

MIP-Adapter是一种个性化图像生成技术，由阿里巴巴集团推出并开源。基于IP-Adapter模型，进一步扩展其能力，支持同时处理多个参考图像，生成更准确和高质量的...

AI Projects12/18/2025

CapsWriter-Offline - AI语音转文字工具，PC端离线实时工作

CapsWriter-Offline是一款高效的PC端离线语音输入和字幕转录工具，支持用户通过简单的按键操作实现实时语音转文字。软件适合快速记录和转写大量语音信息的场...

AI Projects12/18/2025

HelloBench - 评估LLMs长文本生成能力的开源基准测试工具

HelloBench是一个用于评估大型语言模型（LLMs）长文本生成能力的开源基准测试。HelloBench包含五个基于布鲁姆分类法的子任务：开放式问答、摘要、聊天、文本...

←1...42 43 44 45 46 47 48...137 →

AI News

AI Projects12/18/2025

Seed-VC - 零样本实现声音克隆和转换的技术

AI Projects12/18/2025

Phidias - 检索增强的3D内容生成模型，支持多模态输入

AI Projects12/18/2025

Movie Gen - Meta推出文本驱动的AI视频生成与编辑工具

AI Projects12/18/2025

Mini-LLaVA - 基于Llama 3.1的轻量级多模态大语言模型

AI Projects12/18/2025

MemoryScope - 为LLM聊天机器人配备的长期记忆系统

AI Projects12/18/2025

CogView3 - 智谱AI推出的开源AI图像生成模型

AI Projects12/18/2025

RTranslator - 开源的离线、实时、多语言翻译应用程序

RTranslator 是一款开源、免费、离线实时翻译应用程序，专为 Android 设备设计。基于先进的AI技术，包括 Meta 的 NLLB 翻译模型和 OpenAI 的 Whisper 语音识...

AI Projects12/18/2025

Molmo 72B - 开源的多模态AI模型，基于Qwen2-72B模型，超越Llama 3.2

AI Projects12/18/2025

ProX - 提高大语言模型预训练数据质量的框架

AI Projects12/18/2025

OutofFocus - 文本驱动图像生成或编辑的AI工具

AI Projects12/18/2025

TeleChat2-115B - 中国电信AI研究院推出的开源星辰语义大模型

AI Projects12/18/2025

GroundingBooth - Adobe联合多所高校推出主题和文本到图像的定制框架

AI Projects12/18/2025

markmap - 解析Markdown生成可视化思维导图的工具

AI Projects12/18/2025

OLMoE - 完全开源的大语言模型，基于混合专家（MoE）架构

OLMoE（Open Mixture-of-Experts Language Models）是一个完全开源的大型语言模型，基于混合专家（MoE）架构。OLMoE基于5万亿个token进行预训练，拥有70亿总...

AI Projects12/18/2025

WebDesignAgent - 自动化网页设计AI工具，零门槛搭建各类型网站

AI Projects12/18/2025

ChatMLX - 高性能MacOS聊天应用，基于MLX框架实现与数据实时交互

AI Projects12/18/2025

CDial-GPT - 清华推出的大型中文短文本对话数据集和对话生成模型

AI Projects12/18/2025

RD-Agent - 微软亚洲研究院推出开源的自动化研究与开发工具

AI Projects12/18/2025

FLUX1.1 - Black Forest Labs团队推出的超写实AI图像生成模型，代号“蓝莓”

AI Projects12/18/2025

Realtime API - OpenAI推出的实时语音交互API

AI Projects12/18/2025

Laminar - 分析与优化LLM应用程序的开源平台

AI Projects12/18/2025

MIP-Adapter - 阿里开源多参考图像融合的个性化图像生成技术

AI Projects12/18/2025

CapsWriter-Offline - AI语音转文字工具，PC端离线实时工作

AI Projects12/18/2025

All Categories

AI News

Seed-VC - 零样本实现声音克隆和转换的技术

Phidias - 检索增强的3D内容生成模型，支持多模态输入

Movie Gen - Meta推出文本驱动的AI视频生成与编辑工具

Mini-LLaVA - 基于Llama 3.1的轻量级多模态大语言模型

MemoryScope - 为LLM聊天机器人配备的长期记忆系统

CogView3 - 智谱AI推出的开源AI图像生成模型

RTranslator - 开源的离线、实时、多语言翻译应用程序

Molmo 72B - 开源的多模态AI模型，基于Qwen2-72B模型，超越Llama 3.2

ProX - 提高大语言模型预训练数据质量的框架

OutofFocus - 文本驱动图像生成或编辑的AI工具

TeleChat2-115B - 中国电信AI研究院推出的开源星辰语义大模型

GroundingBooth - Adobe联合多所高校推出主题和文本到图像的定制框架

markmap - 解析Markdown生成可视化思维导图的工具

OLMoE - 完全开源的大语言模型，基于混合专家（MoE）架构

WebDesignAgent - 自动化网页设计AI工具，零门槛搭建各类型网站

ChatMLX - 高性能MacOS聊天应用，基于MLX框架实现与数据实时交互

CDial-GPT - 清华推出的大型中文短文本对话数据集和对话生成模型

RD-Agent - 微软亚洲研究院推出开源的自动化研究与开发工具

FLUX1.1 - Black Forest Labs团队推出的超写实AI图像生成模型，代号“蓝莓”

Realtime API - OpenAI推出的实时语音交互API

Laminar - 分析与优化LLM应用程序的开源平台

MIP-Adapter - 阿里开源多参考图像融合的个性化图像生成技术

CapsWriter-Offline - AI语音转文字工具，PC端离线实时工作

HelloBench - 评估LLMs长文本生成能力的开源基准测试工具

AI News

Seed-VC - 零样本实现声音克隆和转换的技术

Phidias - 检索增强的3D内容生成模型，支持多模态输入

Movie Gen - Meta推出文本驱动的AI视频生成与编辑工具

Mini-LLaVA - 基于Llama 3.1的轻量级多模态大语言模型

MemoryScope - 为LLM聊天机器人配备的长期记忆系统

CogView3 - 智谱AI推出的开源AI图像生成模型

RTranslator - 开源的离线、实时、多语言翻译应用程序

Molmo 72B - 开源的多模态AI模型，基于Qwen2-72B模型，超越Llama 3.2

ProX - 提高大语言模型预训练数据质量的框架

OutofFocus - 文本驱动图像生成或编辑的AI工具

TeleChat2-115B - 中国电信AI研究院推出的开源星辰语义大模型

GroundingBooth - Adobe联合多所高校推出主题和文本到图像的定制框架

markmap - 解析Markdown生成可视化思维导图的工具

OLMoE - 完全开源的大语言模型，基于混合专家（MoE）架构

WebDesignAgent - 自动化网页设计AI工具，零门槛搭建各类型网站

ChatMLX - 高性能MacOS聊天应用，基于MLX框架实现与数据实时交互

CDial-GPT - 清华推出的大型中文短文本对话数据集和对话生成模型

RD-Agent - 微软亚洲研究院推出开源的自动化研究与开发工具

FLUX1.1 - Black Forest Labs团队推出的超写实AI图像生成模型，代号“蓝莓”

Realtime API - OpenAI推出的实时语音交互API

Laminar - 分析与优化LLM应用程序的开源平台

MIP-Adapter - 阿里开源多参考图像融合的个性化图像生成技术

CapsWriter-Offline - AI语音转文字工具，PC端离线实时工作

HelloBench - 评估LLMs长文本生成能力的开源基准测试工具