AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects1/25/2026

FlowAct-R1 - 字节推出的实时交互数字人视频生成框架

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架，仅需单张参考图和音频，支持流式生成无限时长的全身动态视频。

AI Projects1/25/2026

Agentation - AI编程协作工具，可视化反馈问题转为代码

Agentation 是开源的AI编程协作工具，能解决开发者与 AI 编程助手之间沟通效率低下的问题。工具通过让用户直接在网页上标注问题，将视觉反馈转化为代码可读的...

AI Projects1/24/2026

Qwen3-TTS - 阿里通义开源的系列语音生成模型

Qwen3-TTS是Qwen开源的系列语音生成模型，具备强大的音色克隆、创造和语音控制能力。模型基于创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器，实现高效语音...

AI Projects1/23/2026

Being-H0.5 - 卢宗青团队开源的通用机器人模型

Being-H0.5 是卢宗青团队推出的通用机器人模型，能通过人类先验知识和统一的动作对齐，解决机器人在不同形态硬件间的策略迁移问题。

AI Projects1/23/2026

LightOnOCR-2-1B - LightOnAI推出的OCR模型

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型，参数量仅 1B，在复杂文档处理中表现卓越，擅长学术论文、数学公式和复杂表格的识别。

AI Projects1/23/2026

AgentCPM-Report - 清华联合面壁智能等开源的写作智能体

AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合推出的本地化深度调研智能体，基于8B参数的MiniCPM4.1模型。

AI Projects1/23/2026

VibeVoice-ASR - 微软开源的长音频语音识别模型

VibeVoice-ASR 是微软开源的先进语音识别模型，专为处理长达60分钟的长音频设计。模型能一次性处理整段音频，保持全局上下文，避免传统模型分段处理导致的上...

AI Projects1/22/2026

Model1 - DeepSeek代码库更新的新模型版本

Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型，可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。

AI Projects1/22/2026

Chroma 1.0 - FlashLabs开源的实时端到端语音对话模型

Chroma 1.0 是FlashLabs首个开源的实时端到端语音对话模型，兼具低延迟交互、高保真个性化语音克隆和强对话能力。模型通过紧密耦合语音理解与生成，采用1:2文...

AI Projects1/22/2026

Step3-VL-10B - 阶跃星辰开源的多模态小模型

Step3-VL-10B 是阶跃星辰推出的仅含 10B 参数的开源多模态模型，在视觉感知、逻辑推理、数学竞赛和通用对话等任务中达到 200B 参数模型的性能水平。

AI Projects1/22/2026

EmbodiChain - 跨维智能开源的具身智能学习平台

EmbodiChain 是跨维智能开源的具身智能学习平台，通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务，结合在线数据流和自我修复...

AI Projects1/22/2026

json-render - Vercel开源的AI生成UI渲染可控方案

json-render是 Vercel 开源的项目，解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog，约束 AI 只能生成符合特定 Schema 的 JSON 数据，用前...

AI Projects1/21/2026

COTA - 超参数科技推出的新型游戏智能体

COTA是超参数科技推出的新型游戏智能体，基于大语言模型（LLM）驱动，具备认知、操作、战术和辅助能力。COTA突破传统强化学习与监督学习模式，通过架构创新实...

AI Projects1/21/2026

x-Algorithm - 马斯克开源的x平台推荐算法

x-Algorithm是马斯克开源的x平台推荐算法，为“为你”信息流提供个性化内容的核心系统。结合用户关注账号的帖子（In-Network）和通过机器学习检索的全球内容（O...

AI Projects1/21/2026

PersonaPlex - 英伟达推出的全双工语音对语音AI模型

NVIDIA PersonaPlex 是英伟达推出的全双工对话AI模型，具备同时听和说的能力，能处理自然对话中的打断、停顿和回应。用户可通过语音和文本提示自定义角色和声...

AI Projects1/21/2026

GLM-4.7-Flash - 智谱开源的混合思考模型

GLM-4.7-Flash 是智谱开源、免费的混合思考模型，具有300亿参数和30亿激活参数。模型在性能与效率上达到平衡，尤其在编程、中文写作、翻译等多场景表现出色，...

AI Projects1/20/2026

VerseCrafter - 复旦联合腾讯开源的动态真实视频世界模型

VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型，具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练...

AI Projects1/20/2026

NovaSR - 开源音频超分模型，能将低音质转换为高音质音频

NovaSR 是开源的音频超分辨率模型，仅有 52KB 能将 16kHz 的低采样率音频（如电话音质）提升到 48kHz 的高采样率音频（如录音室级音质）。模型通过神经网络预...

AI Projects1/20/2026

Playwriter - 开源AI浏览器自动化工具，人机协作无缝切换

Playwriter 是开源的 Chrome 插件，基于微软 Playwright 打造，专为 AI 操作浏览器设计。工具通过插件形式无缝接入 Chrome，将 AI 的能力直接嵌入用户的浏览...

AI Projects1/19/2026

Prompt Manager - 开源AI提示词管理工具，智能分类

Prompt Manager （PromptX）是高效管理 AI 提示词的工具，专为提升 AI 工作效率设计。工具支持个人提示词的创建、编辑、分类和版本管理。通过智能分类和全局...

AI Projects1/19/2026

FrogBoss - 微软开源的系列编程模型

FrogBoss 是微软研究院推出的系列编程模型。模型通过创新的复杂漏洞生成方法（BugPilot）进行训练，该方法通过让语言模型代理（LLM）在代码库中添加新功能来...

AI Projects1/18/2026

OpenWork - 开源AI桌面工作流平台，Claude Cowork平替

OpenWork 是开源的桌面应用程序，为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建，提供简洁的引导式操作界面。

AI Projects1/17/2026

TranslateGemma - 谷歌开源的系列翻译模型

TranslateGemma 是谷歌推出的基于 Gemma 3 的新一代开源系列翻译模型。模型通过监督微调和强化学习相结合的方式，支持 55 种语言的高质量翻译，显著提升翻译...

AI Projects1/17/2026

FLUX.2 [klein] - Black Forest Labs开源的图像生成模型

FLUX.2 [klein] 是 Black Forest Labs 开源的高效图像生成与编辑模型。模型具备亚秒级推理速度，能在 0.5 秒内完成高质量图像生成和编辑，支持文生图、图生图...

←1...21 22 23 24 25 26 27...137 →

AI News

AI Projects1/25/2026

FlowAct-R1 - 字节推出的实时交互数字人视频生成框架

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架，仅需单张参考图和音频，支持流式生成无限时长的全身动态视频。

AI Projects1/25/2026

Agentation - AI编程协作工具，可视化反馈问题转为代码

AI Projects1/24/2026

Qwen3-TTS - 阿里通义开源的系列语音生成模型

AI Projects1/23/2026

Being-H0.5 - 卢宗青团队开源的通用机器人模型

Being-H0.5 是卢宗青团队推出的通用机器人模型，能通过人类先验知识和统一的动作对齐，解决机器人在不同形态硬件间的策略迁移问题。

AI Projects1/23/2026

LightOnOCR-2-1B - LightOnAI推出的OCR模型

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型，参数量仅 1B，在复杂文档处理中表现卓越，擅长学术论文、数学公式和复杂表格的识别。

AI Projects1/23/2026

AgentCPM-Report - 清华联合面壁智能等开源的写作智能体

AI Projects1/23/2026

VibeVoice-ASR - 微软开源的长音频语音识别模型

AI Projects1/22/2026

Model1 - DeepSeek代码库更新的新模型版本

Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型，可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。

AI Projects1/22/2026

Chroma 1.0 - FlashLabs开源的实时端到端语音对话模型

AI Projects1/22/2026

Step3-VL-10B - 阶跃星辰开源的多模态小模型

Step3-VL-10B 是阶跃星辰推出的仅含 10B 参数的开源多模态模型，在视觉感知、逻辑推理、数学竞赛和通用对话等任务中达到 200B 参数模型的性能水平。

AI Projects1/22/2026

EmbodiChain - 跨维智能开源的具身智能学习平台

AI Projects1/22/2026

json-render - Vercel开源的AI生成UI渲染可控方案

json-render是 Vercel 开源的项目，解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog，约束 AI 只能生成符合特定 Schema 的 JSON 数据，用前...

AI Projects1/21/2026

COTA - 超参数科技推出的新型游戏智能体

AI Projects1/21/2026

x-Algorithm - 马斯克开源的x平台推荐算法

AI Projects1/21/2026

PersonaPlex - 英伟达推出的全双工语音对语音AI模型

AI Projects1/21/2026

GLM-4.7-Flash - 智谱开源的混合思考模型

AI Projects1/20/2026

VerseCrafter - 复旦联合腾讯开源的动态真实视频世界模型

VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型，具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练...

AI Projects1/20/2026

NovaSR - 开源音频超分模型，能将低音质转换为高音质音频

AI Projects1/20/2026

Playwriter - 开源AI浏览器自动化工具，人机协作无缝切换

Playwriter 是开源的 Chrome 插件，基于微软 Playwright 打造，专为 AI 操作浏览器设计。工具通过插件形式无缝接入 Chrome，将 AI 的能力直接嵌入用户的浏览...

AI Projects1/19/2026

Prompt Manager - 开源AI提示词管理工具，智能分类

AI Projects1/19/2026

FrogBoss - 微软开源的系列编程模型

AI Projects1/18/2026

OpenWork - 开源AI桌面工作流平台，Claude Cowork平替

OpenWork 是开源的桌面应用程序，为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建，提供简洁的引导式操作界面。

AI Projects1/17/2026

TranslateGemma - 谷歌开源的系列翻译模型

AI Projects1/17/2026

All Categories

AI News

FlowAct-R1 - 字节推出的实时交互数字人视频生成框架

Agentation - AI编程协作工具，可视化反馈问题转为代码

Qwen3-TTS - 阿里通义开源的系列语音生成模型

Being-H0.5 - 卢宗青团队开源的通用机器人模型

LightOnOCR-2-1B - LightOnAI推出的OCR模型

AgentCPM-Report - 清华联合面壁智能等开源的写作智能体

VibeVoice-ASR - 微软开源的长音频语音识别模型

Model1 - DeepSeek代码库更新的新模型版本

Chroma 1.0 - FlashLabs开源的实时端到端语音对话模型

Step3-VL-10B - 阶跃星辰开源的多模态小模型

EmbodiChain - 跨维智能开源的具身智能学习平台

json-render - Vercel开源的AI生成UI渲染可控方案

COTA - 超参数科技推出的新型游戏智能体

x-Algorithm - 马斯克开源的x平台推荐算法

PersonaPlex - 英伟达推出的全双工语音对语音AI模型

GLM-4.7-Flash - 智谱开源的混合思考模型

VerseCrafter - 复旦联合腾讯开源的动态真实视频世界模型

NovaSR - 开源音频超分模型，能将低音质转换为高音质音频

Playwriter - 开源AI浏览器自动化工具，人机协作无缝切换

Prompt Manager - 开源AI提示词管理工具，智能分类

FrogBoss - 微软开源的系列编程模型

OpenWork - 开源AI桌面工作流平台，Claude Cowork平替

TranslateGemma - 谷歌开源的系列翻译模型

FLUX.2 [klein] - Black Forest Labs开源的图像生成模型

AI News

FlowAct-R1 - 字节推出的实时交互数字人视频生成框架

Agentation - AI编程协作工具，可视化反馈问题转为代码

Qwen3-TTS - 阿里通义开源的系列语音生成模型

Being-H0.5 - 卢宗青团队开源的通用机器人模型

LightOnOCR-2-1B - LightOnAI推出的OCR模型

AgentCPM-Report - 清华联合面壁智能等开源的写作智能体

VibeVoice-ASR - 微软开源的长音频语音识别模型

Model1 - DeepSeek代码库更新的新模型版本

Chroma 1.0 - FlashLabs开源的实时端到端语音对话模型

Step3-VL-10B - 阶跃星辰开源的多模态小模型

EmbodiChain - 跨维智能开源的具身智能学习平台

json-render - Vercel开源的AI生成UI渲染可控方案

COTA - 超参数科技推出的新型游戏智能体

x-Algorithm - 马斯克开源的x平台推荐算法

PersonaPlex - 英伟达推出的全双工语音对语音AI模型

GLM-4.7-Flash - 智谱开源的混合思考模型

VerseCrafter - 复旦联合腾讯开源的动态真实视频世界模型

NovaSR - 开源音频超分模型，能将低音质转换为高音质音频

Playwriter - 开源AI浏览器自动化工具，人机协作无缝切换

Prompt Manager - 开源AI提示词管理工具，智能分类

FrogBoss - 微软开源的系列编程模型

OpenWork - 开源AI桌面工作流平台，Claude Cowork平替

TranslateGemma - 谷歌开源的系列翻译模型

FLUX.2 [klein] - Black Forest Labs开源的图像生成模型