AI 资讯

全部快讯教程百科 AI项目 AI应用集

AI项目2026/7/2

Claude Sonnet 5 - Anthropic推出的最强智能体模型

Claude Sonnet 5是Anthropic推出的 Sonnet 系列中智能体能力最强的模型，支持制定计划、调用浏览器和终端等工具并自主运行。

AI项目2026/7/2

yuxinlu1 Gemma4-12B - 开源的编程与 Agentic 模型系列

yuxinlu1 Gemma4-12B 是个人开发者逯雨基于 Google Gemma 4 12B 指令模型微调的开源编程与 Agentic 模型系列，包含 V1 代码版和 V2 Agentic 版。

AI项目2026/7/2

RedKnot - 小红书开源的长文本推理加速引擎

RedKnot 是小红书开源的长文本 LLM 推理加速引擎，将 KV Cache 按注意力头维度解耦，离线分类为需全局重算的全局头与可局部复用的局部头，配合 SegPagedAtten...

AI项目2026/7/2

虎牙VAM 1.0 - 虎牙推出的实时多模态数字人基础模型

虎牙VAM 1.0（Vivid Avatar Model）是虎牙推出的基于DiT架构的实时多模态数字人基础模型，一张照片可生成能说话、能唱歌跳舞的AI数字人。

AI项目2026/7/1

Wan-Streamer - 阿里开源的实时全双工多模态基础模型

Wan-Streamer 是阿里达摩院开源的端到端实时全双工多模态基础模型，通过统一因果 Transformer 架构将文本、音频、视频的输入输出 token 整合为同一条因果序列...

AI项目2026/7/1

LongCat-2.0 - 美团开源的新一代万亿参数语言模型

LongCat-2.0 是美团开源的大规模 MoE 语言模型，拥有 1.6 万亿总参数，每 token 激活约 480 亿，基于 AI ASIC 超算集群完成训练与部署。

AI项目2026/6/30

VibeThinker-3B - 微博开源的 30 亿参数密集推理模型

VibeThinker-3B是新浪微博团队开源的 30 亿参数密集推理模型，基于 Qwen2.5-Coder-3B 构建，通过升级版 Spectrum-to-Signal 后训练流程，在数学、编程等可验...

AI项目2026/6/30

Agent-Reach - 开源 AI Agent 工具，能一键获取互联网内容

Agent-Reach 是开源免费的 AI Agent 互联网能力脚手架。工具通过一句话指令可为 Claude Code、Cursor、OpenClaw 等主流 Agent 一键安装联网能力，支持 Twitte...

AI项目2026/6/30

BrowserBC - Einsia AI 旗下开源的浏览器操作轨迹生成 Skill

BrowserBC 是 Einsia AI 旗下 Navers Lab 发布的开源项目，核心目标是将人类在浏览器中的操作轨迹转化为可复用的自然语言技能（Skill），让 Web Agent 能'克...

AI项目2026/6/29

FastContext -微软开源的轻量级代码仓库探索模型

FastContext 是微软开源的轻量级代码仓库探索模型，专为编程 Agent 设计。模型将仓库浏览与任务求解解耦，主 Agent 通过自然语言查询委托 FastContext 执行只...

AI项目2026/6/29

Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型

Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型，定位为'美学优先'的创意协作者。专注于视觉美学一致性、风格迁移和创意控制，而非单纯的提示词精...

AI项目2026/6/29

HTML Anything - nexu-io 团队开源的 HTML 编辑器

HTML Anything 是 nexu-io 团队开源的 Agent 时代 HTML 编辑器，内置 75 套 Skill 模板覆盖杂志、演示、海报、小红书卡片等 9 种交付形态，可自动识别本地 18...

AI项目2026/6/29

DSpark - DeepSeek 联合北京大学开源的推测解码加速框架

DSpark 是 DeepSeek 联合北京大学开源的推测解码加速框架，专门解决大模型自回归生成速度慢、像'挤牙膏'的痛点。采用半自回归生成架构，通过轻量级 Markov 头...

AI项目2026/6/28

Penpot - 开源的设计与代码协作平台，多人实时协作

Penpot 是开源的设计与代码协作平台，基于 SVG、CSS、HTML 等开放标准构建，可在浏览器中完成 UI 设计与交互原型制作。平台支持多人实时协作、W3C Design Tok...

AI项目2026/6/28

GPT-5.6 - OpenAI 推出的最新一代大语言模型系列

GPT-5.6 是 OpenAI 推出的最新一代大语言模型，目前受美国政府监管要求仅以'有限预览'形式向少数可信合作伙伴开放。系列首次采用天文学命名体系，推出三档型...

AI项目2026/6/28

PhoneBuddy - 腾讯混元开源的 4B 参数手机 Agent 模型

PhoneBuddy 是腾讯混元团队开源的 4B 参数手机 Agent 模型，核心研究如何在真实手机场景中训练可用的 AI Agent。

AI项目2026/6/28

Mistral OCR 4 - Mistral AI 推出的最新一代文档理解模型

Mistral OCR 4 是 Mistral AI 推出的最新一代文档理解模型。模型支持从 PDF、图片、演示文稿等复杂文档中提取文本，能返回带边框定位、区域类型分类和置信度...

AI项目2026/6/26

SkillOpt - 微软开源的Agent技能文档优化工具

SkillOpt是微软开源的Agent技能文档优化工具。工具将深度学习训练逻辑引入文本空间，把skill.md视为可训练参数，通过轨迹分析生成编辑方向，用文本学习率约束...

AI项目2026/6/26

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

Confucius4-TTS 是网易有道开源的 1.3B 参数多语言语音合成引擎。模型只需 3 秒参考音频可零样本克隆音色，无需参考文本，支持中、英、日、韩等 14 种语言跨...

AI项目2026/6/26

MMSkills - 上海交大与小红书联合推出的多模态技能框架

MMSkills 是上海交通大学与小红书联合推出的面向通用视觉 Agent 的多模态技能框架，支持将可复用技能从纯文本步骤扩展为包含文本流程、运行时状态卡片和多视...

AI项目2026/6/25

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

豆包音频生成模型1.0是火山引擎推出的端到端音频创作模型，支持文本或音频作为参考输入生成目标音频。模型单条Prompt可编排多角色对白、情绪语气、背景音乐与...

AI项目2026/6/25

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

Baichuan-M4是百川智能联合清华大学推出的新一代医疗增强大模型，在 HealthBench 综合、Hard、Professional 三个权威榜单同时位列世界第一，幻觉率低至 3.3% ...

AI项目2026/6/25

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

JoyAI-VL-Interaction 是京东 Joy Future Academy 开源的实时视频视觉语言交互模型，是全球首个全栈开源的 interaction 模型系统。

AI项目2026/6/25

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

Qwen-AgentWorld 是通义千问团队推出的首个语言世界模型，通过长思维链推理模拟 MCP、搜索、终端、软件工程、Android、Web、操作系统共 7 大智能体环境。

←1 2 3 4 5 6 7...137 →

AI 资讯

AI项目2026/7/2

Claude Sonnet 5 - Anthropic推出的最强智能体模型

Claude Sonnet 5是Anthropic推出的 Sonnet 系列中智能体能力最强的模型，支持制定计划、调用浏览器和终端等工具并自主运行。

AI项目2026/7/2

yuxinlu1 Gemma4-12B - 开源的编程与 Agentic 模型系列

yuxinlu1 Gemma4-12B 是个人开发者逯雨基于 Google Gemma 4 12B 指令模型微调的开源编程与 Agentic 模型系列，包含 V1 代码版和 V2 Agentic 版。

AI项目2026/7/2

RedKnot - 小红书开源的长文本推理加速引擎

AI项目2026/7/2

虎牙VAM 1.0 - 虎牙推出的实时多模态数字人基础模型

虎牙VAM 1.0（Vivid Avatar Model）是虎牙推出的基于DiT架构的实时多模态数字人基础模型，一张照片可生成能说话、能唱歌跳舞的AI数字人。

AI项目2026/7/1

Wan-Streamer - 阿里开源的实时全双工多模态基础模型

AI项目2026/7/1

LongCat-2.0 - 美团开源的新一代万亿参数语言模型

LongCat-2.0 是美团开源的大规模 MoE 语言模型，拥有 1.6 万亿总参数，每 token 激活约 480 亿，基于 AI ASIC 超算集群完成训练与部署。

AI项目2026/6/30

VibeThinker-3B - 微博开源的 30 亿参数密集推理模型

VibeThinker-3B是新浪微博团队开源的 30 亿参数密集推理模型，基于 Qwen2.5-Coder-3B 构建，通过升级版 Spectrum-to-Signal 后训练流程，在数学、编程等可验...

AI项目2026/6/30

Agent-Reach - 开源 AI Agent 工具，能一键获取互联网内容

Agent-Reach 是开源免费的 AI Agent 互联网能力脚手架。工具通过一句话指令可为 Claude Code、Cursor、OpenClaw 等主流 Agent 一键安装联网能力，支持 Twitte...

AI项目2026/6/30

BrowserBC - Einsia AI 旗下开源的浏览器操作轨迹生成 Skill

BrowserBC 是 Einsia AI 旗下 Navers Lab 发布的开源项目，核心目标是将人类在浏览器中的操作轨迹转化为可复用的自然语言技能（Skill），让 Web Agent 能'克...

AI项目2026/6/29

FastContext -微软开源的轻量级代码仓库探索模型

AI项目2026/6/29

Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型

AI项目2026/6/29

HTML Anything - nexu-io 团队开源的 HTML 编辑器

HTML Anything 是 nexu-io 团队开源的 Agent 时代 HTML 编辑器，内置 75 套 Skill 模板覆盖杂志、演示、海报、小红书卡片等 9 种交付形态，可自动识别本地 18...

AI项目2026/6/29

DSpark - DeepSeek 联合北京大学开源的推测解码加速框架

AI项目2026/6/28

Penpot - 开源的设计与代码协作平台，多人实时协作

AI项目2026/6/28

GPT-5.6 - OpenAI 推出的最新一代大语言模型系列

AI项目2026/6/28

PhoneBuddy - 腾讯混元开源的 4B 参数手机 Agent 模型

PhoneBuddy 是腾讯混元团队开源的 4B 参数手机 Agent 模型，核心研究如何在真实手机场景中训练可用的 AI Agent。

AI项目2026/6/28

Mistral OCR 4 - Mistral AI 推出的最新一代文档理解模型

AI项目2026/6/26

SkillOpt - 微软开源的Agent技能文档优化工具

AI项目2026/6/26

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

AI项目2026/6/26

MMSkills - 上海交大与小红书联合推出的多模态技能框架

AI项目2026/6/25

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

AI项目2026/6/25

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

Baichuan-M4是百川智能联合清华大学推出的新一代医疗增强大模型，在 HealthBench 综合、Hard、Professional 三个权威榜单同时位列世界第一，幻觉率低至 3.3% ...

AI项目2026/6/25

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

JoyAI-VL-Interaction 是京东 Joy Future Academy 开源的实时视频视觉语言交互模型，是全球首个全栈开源的 interaction 模型系统。

AI项目2026/6/25

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

Qwen-AgentWorld 是通义千问团队推出的首个语言世界模型，通过长思维链推理模拟 MCP、搜索、终端、软件工程、Android、Web、操作系统共 7 大智能体环境。

全部分类

AI 资讯

Claude Sonnet 5 - Anthropic推出的最强智能体模型

yuxinlu1 Gemma4-12B - 开源的编程与 Agentic 模型系列

RedKnot - 小红书开源的长文本推理加速引擎

虎牙VAM 1.0 - 虎牙推出的实时多模态数字人基础模型

Wan-Streamer - 阿里开源的实时全双工多模态基础模型

LongCat-2.0 - 美团开源的新一代万亿参数语言模型

VibeThinker-3B - 微博开源的 30 亿参数密集推理模型

Agent-Reach - 开源 AI Agent 工具，能一键获取互联网内容

BrowserBC - Einsia AI 旗下开源的浏览器操作轨迹生成 Skill

FastContext -微软开源的轻量级代码仓库探索模型

Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型

HTML Anything - nexu-io 团队开源的 HTML 编辑器

DSpark - DeepSeek 联合北京大学开源的推测解码加速框架

Penpot - 开源的设计与代码协作平台，多人实时协作

GPT-5.6 - OpenAI 推出的最新一代大语言模型系列

PhoneBuddy - 腾讯混元开源的 4B 参数手机 Agent 模型

Mistral OCR 4 - Mistral AI 推出的最新一代文档理解模型

SkillOpt - 微软开源的Agent技能文档优化工具

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

MMSkills - 上海交大与小红书联合推出的多模态技能框架

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

AI 资讯

Claude Sonnet 5 - Anthropic推出的最强智能体模型

yuxinlu1 Gemma4-12B - 开源的编程与 Agentic 模型系列

RedKnot - 小红书开源的长文本推理加速引擎

虎牙VAM 1.0 - 虎牙推出的实时多模态数字人基础模型

Wan-Streamer - 阿里开源的实时全双工多模态基础模型

LongCat-2.0 - 美团开源的新一代万亿参数语言模型

VibeThinker-3B - 微博开源的 30 亿参数密集推理模型

Agent-Reach - 开源 AI Agent 工具，能一键获取互联网内容

BrowserBC - Einsia AI 旗下开源的浏览器操作轨迹生成 Skill

FastContext -微软开源的轻量级代码仓库探索模型

Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型

HTML Anything - nexu-io 团队开源的 HTML 编辑器

DSpark - DeepSeek 联合北京大学开源的推测解码加速框架

Penpot - 开源的设计与代码协作平台，多人实时协作

GPT-5.6 - OpenAI 推出的最新一代大语言模型系列

PhoneBuddy - 腾讯混元开源的 4B 参数手机 Agent 模型

Mistral OCR 4 - Mistral AI 推出的最新一代文档理解模型

SkillOpt - 微软开源的Agent技能文档优化工具

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

MMSkills - 上海交大与小红书联合推出的多模态技能框架

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

Qwen-AgentWorld - 通义千问推出的原生语言世界模型