AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects1/16/2026

AgentCPM-Explore - 清华联合面壁智能开源的智能体模型

AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数，在多个长程任务评测基准上超越同...

AI Projects1/16/2026

ArenaRL - 通义与高德开源的开放域对比式强化学习方法

ArenaRL 是通义 DeepResearch 团队联合高德开源的，面向开放域智能体的对比式强化学习方法。ArenaRL通过引入锦标赛机制，将传统的绝对打分转变为组内相对排序...

AI Projects1/16/2026

Step-Audio-R1.1 - 阶跃星辰开源的原生语音推理模型

Step-Audio-R1.1 是阶跃星辰推出的全球首个开源原生语音推理模型。模型以96.4%的准确率登顶全球权威语音推理榜单，超越众多一线模型。模型具备深度语音推理、...

AI Projects1/15/2026

司农 - 南京农业大学开源的农业领域大模型

司农（司农大语言模型）是南京农业大学推出的面向农业领域的垂直大模型。模型依托南农的学科优势，收集了涵盖多农业学科的超40亿token数据，包括书籍、论文、...

AI Projects1/15/2026

OctoCodingBench - MiniMax开源的Coding Agent评测集

OctoCodingBench是MiniMax开源的针对Coding Agent的指令遵循能力的评测集。OctoCodingBench通过模拟真实软件开发场景，从系统约束、用户指令、项目规范、技能...

AI Projects1/15/2026

MedGemma 1.5 - 谷歌开源的多模态AI医疗模型

MedGemma 1.5 是谷歌开源的多模态AI医学模型，专为处理医学影像和文本数据设计。模型支持高维医学影像（如CT和MRI）、全切片病理影像、纵向影像分析、解剖定...

AI Projects1/15/2026

GLM-Image - 智谱联合华为开源的多模态图像生成模型

GLM-Image 是智谱联合华为开源的新一代多模态图像生成模型，基于昇腾 Atlas 800T A2 设备和昇思 MindSpore 框架训练，是首个全流程国产芯片训练的 SOTA 模型。

AI Projects1/15/2026

VidBee - 开源音视频下载工具，支持YouTube、Bilibili平台

VidBee 是开源的视频下载工具，基于强大的 yt-dlp 引擎开发。工具能帮助用户轻松下载全球 1000 多个网站的音视频内容，包含热门的 YouTube、Bilibili，和小众...

AI Projects1/15/2026

BabyVision - UniPat AI团队推出的多模态理解评测集

BabyVision是 UniPat AI团队推出的多模态理解评测集，评估多模态语言模型（MLLMs）和图像生成模型在视觉推理任务上的表现。包含两个主要赛道：MLLM评估和生成...

AI Projects1/15/2026

PixVerse R1 - 爱诗科技推出的全球首个通用实时世界模型

PixVerse R1 是爱诗科技（PixVerse）推出的全球首个通用实时世界模型，标志着AI视频生成从“预录制”迈向“实时动态生成”的重大突破。R1通过三大核心技术实现创...

AI Projects1/15/2026

Engram - DeepSeek联合北大推出的条件记忆模块

Engram 是DeepSeek团队联合北京大学推出的条件记忆模块，能提升大语言模型（LLM）的性能。Engram通过引入现代化的 -gram 嵌入表，将静态知识存储在独立的内存...

AI Projects1/15/2026

Baichuan-M3 - 百川智能开源的新一代医疗增强大语言模型

Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型。模型在问诊能力、医疗幻觉控制以及Healthbench和Healthbench Hard评测中均排名第一，超越了O...

AI Projects1/14/2026

女娲智能体OS - 首个产品级开源的通用智能体操作系统

女娲智能体OS（Nuwax Agent OS）是全球首个产品级开源的通用智能体操作系统。女娲智能体OS支持将AI从单纯的对话工具转变为企业的智能执行者，通过自主执行引...

AI Projects1/14/2026

Oh My OpenCode - AI编程助手增强插件，自动调度任务

Oh My OpenCode 是为 AI 编程助手设计的开源增强插件，能让 AI （如OpenCode ）像真正的开发团队一样高效协作，提升编程体验。工具通过集成多种 AI 模型（如 ...

AI Projects1/13/2026

Spirit-v1.5 - 千寻智能推出的具身智能基础模型

Spirit-v1.5 是千寻智能推出的具身智能基础模型。模型采用多样化、开放式的数据采集方式，摒弃传统“干净数据”的限制，让模型在预训练阶段接触更丰富的动作和...

AI Projects1/12/2026

Obsidian-skills - Obsidian推出的开源AI工具包

Obsidian-skills 是 Obsidian 团队开发的一组开源工具，帮助用户更好地将 AI 工具（如 Claude Code）与 Obsidian 笔记系统结合使用。包含三大核心技能：obsid...

AI Projects1/12/2026

DeepTutor - 香港大学开源的AI学习助手

DeepTutor 是香港大学数据科学实验室开源的 AI 学习助手，通过多智能体架构和知识图谱技术，将复杂的知识体系转化为高效的学习体验。

AI Projects1/12/2026

Nemotron Speech ASR - 英伟达开源的语音识别模型

Nemotron Speech ASR 是英伟达开源的专注于低延迟、实时流式语音识别的模型。通过缓存感知架构，将已处理的语音特征缓存，仅对新音频帧进行计算，实现单句转...

AI Projects1/12/2026

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

FantasyWorld是高德地图（AMAP）和北京邮电大学合作开发的创新性3D世界建模框架，专注于通过统一的视频和3D预测生成高质量的3D场景。框架通过在冻结的视频基...

AI Projects1/10/2026

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

Qwen3-VL-Embedding 是阿里通义推出的多模态信息检索模型，专为处理文本、图像、可视化文档和视频等多种模态输入而设计。模型基于强大的 Qwen3-VL 架构，能将...

AI Projects1/10/2026

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

Qwen3-VL-Reranker 是阿里通义基于 Qwen3-VL 构建的跨模态理解模型，专为多模态信息检索设计。模型接收任意模态组合的查询与文档对（如图文查询匹配图文文档...

AI Projects1/10/2026

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

VoiceSculptor 是西北工业大学、语图智能等机构推出的音色设计模型，能通过自然语言指令实现对语音合成的细粒度控制。

AI Projects1/10/2026

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

ChatDev 2.0 是清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具。工具通过可视化交互，让用户通过“拖拽 + 配置”快速构建多智能...

AI Projects1/9/2026

EvoCUA - 美团开源的通用多模态计算机操作模型

EvoCUA（Evolving Computer Use Agent）是美团开源的多模态模型，专注于计算机使用自动化任务。EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、Power...

←1...22 23 24 25 26 27 28...137 →

AI News

AI Projects1/16/2026

AgentCPM-Explore - 清华联合面壁智能开源的智能体模型

AI Projects1/16/2026

ArenaRL - 通义与高德开源的开放域对比式强化学习方法

AI Projects1/16/2026

Step-Audio-R1.1 - 阶跃星辰开源的原生语音推理模型

AI Projects1/15/2026

司农 - 南京农业大学开源的农业领域大模型

AI Projects1/15/2026

OctoCodingBench - MiniMax开源的Coding Agent评测集

OctoCodingBench是MiniMax开源的针对Coding Agent的指令遵循能力的评测集。OctoCodingBench通过模拟真实软件开发场景，从系统约束、用户指令、项目规范、技能...

AI Projects1/15/2026

MedGemma 1.5 - 谷歌开源的多模态AI医疗模型

AI Projects1/15/2026

GLM-Image - 智谱联合华为开源的多模态图像生成模型

AI Projects1/15/2026

VidBee - 开源音视频下载工具，支持YouTube、Bilibili平台

AI Projects1/15/2026

BabyVision - UniPat AI团队推出的多模态理解评测集

AI Projects1/15/2026

PixVerse R1 - 爱诗科技推出的全球首个通用实时世界模型

AI Projects1/15/2026

Engram - DeepSeek联合北大推出的条件记忆模块

AI Projects1/15/2026

Baichuan-M3 - 百川智能开源的新一代医疗增强大语言模型

AI Projects1/14/2026

女娲智能体OS - 首个产品级开源的通用智能体操作系统

AI Projects1/14/2026

Oh My OpenCode - AI编程助手增强插件，自动调度任务

AI Projects1/13/2026

Spirit-v1.5 - 千寻智能推出的具身智能基础模型

AI Projects1/12/2026

Obsidian-skills - Obsidian推出的开源AI工具包

Obsidian-skills 是 Obsidian 团队开发的一组开源工具，帮助用户更好地将 AI 工具（如 Claude Code）与 Obsidian 笔记系统结合使用。包含三大核心技能：obsid...

AI Projects1/12/2026

DeepTutor - 香港大学开源的AI学习助手

DeepTutor 是香港大学数据科学实验室开源的 AI 学习助手，通过多智能体架构和知识图谱技术，将复杂的知识体系转化为高效的学习体验。

AI Projects1/12/2026

Nemotron Speech ASR - 英伟达开源的语音识别模型

AI Projects1/12/2026

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

AI Projects1/10/2026

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

AI Projects1/10/2026

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

AI Projects1/10/2026

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

VoiceSculptor 是西北工业大学、语图智能等机构推出的音色设计模型，能通过自然语言指令实现对语音合成的细粒度控制。

AI Projects1/10/2026

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

AI Projects1/9/2026

EvoCUA - 美团开源的通用多模态计算机操作模型

EvoCUA（Evolving Computer Use Agent）是美团开源的多模态模型，专注于计算机使用自动化任务。EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、Power...

All Categories

AI News

AgentCPM-Explore - 清华联合面壁智能开源的智能体模型

ArenaRL - 通义与高德开源的开放域对比式强化学习方法

Step-Audio-R1.1 - 阶跃星辰开源的原生语音推理模型

司农 - 南京农业大学开源的农业领域大模型

OctoCodingBench - MiniMax开源的Coding Agent评测集

MedGemma 1.5 - 谷歌开源的多模态AI医疗模型

GLM-Image - 智谱联合华为开源的多模态图像生成模型

VidBee - 开源音视频下载工具，支持YouTube、Bilibili平台

BabyVision - UniPat AI团队推出的多模态理解评测集

PixVerse R1 - 爱诗科技推出的全球首个通用实时世界模型

Engram - DeepSeek联合北大推出的条件记忆模块

Baichuan-M3 - 百川智能开源的新一代医疗增强大语言模型

女娲智能体OS - 首个产品级开源的通用智能体操作系统

Oh My OpenCode - AI编程助手增强插件，自动调度任务

Spirit-v1.5 - 千寻智能推出的具身智能基础模型

Obsidian-skills - Obsidian推出的开源AI工具包

DeepTutor - 香港大学开源的AI学习助手

Nemotron Speech ASR - 英伟达开源的语音识别模型

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

EvoCUA - 美团开源的通用多模态计算机操作模型

AI News

AgentCPM-Explore - 清华联合面壁智能开源的智能体模型

ArenaRL - 通义与高德开源的开放域对比式强化学习方法

Step-Audio-R1.1 - 阶跃星辰开源的原生语音推理模型

司农 - 南京农业大学开源的农业领域大模型

OctoCodingBench - MiniMax开源的Coding Agent评测集

MedGemma 1.5 - 谷歌开源的多模态AI医疗模型

GLM-Image - 智谱联合华为开源的多模态图像生成模型

VidBee - 开源音视频下载工具，支持YouTube、Bilibili平台

BabyVision - UniPat AI团队推出的多模态理解评测集

PixVerse R1 - 爱诗科技推出的全球首个通用实时世界模型

Engram - DeepSeek联合北大推出的条件记忆模块

Baichuan-M3 - 百川智能开源的新一代医疗增强大语言模型

女娲智能体OS - 首个产品级开源的通用智能体操作系统

Oh My OpenCode - AI编程助手增强插件，自动调度任务

Spirit-v1.5 - 千寻智能推出的具身智能基础模型

Obsidian-skills - Obsidian推出的开源AI工具包

DeepTutor - 香港大学开源的AI学习助手

Nemotron Speech ASR - 英伟达开源的语音识别模型

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

EvoCUA - 美团开源的通用多模态计算机操作模型