AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Agentic Reasoning - 牛津大学推出增强LLM推理能力的框架

Agentic Reasoning是牛津大学推出的增强大型语言模型（LLM）推理能力的框架。基于整合外部工具（如网络搜索、代码执行和结构化记忆）解决复杂的多步骤推理问...

AI Projects12/18/2025

瑞智病理大模型 - 瑞金联合华为推出的多模态互动式病理大模型

瑞智病理大模型（RuiPath）是上海交通大学医学院附属瑞金医院与华为共同推出的临床级国产多模态互动式病理大模型。模型覆盖了中国每年全癌种发病人数90%的常...

AI Projects12/18/2025

Step-Audio-TTS-3B - 高性能 TTS 模型，能生成特定情感和说唱风格的语音

Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音（TTS）模型，具有强大的语音合成能力。基于海量合成数据训练，参数量达到30亿，能生成自然流畅...

AI Projects12/18/2025

CLaMP 3- 清华团队推出的音乐信息检索框架

CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习，将乐谱（如ABC符号）、音频（如MERT特征）和表演信...

AI Projects12/18/2025

SWE-Lancer - OpenAI 推出的大模型基准测试

SWE-Lancer 是 OpenAI 推出的大模型基准测试，评估前沿语言模型（LLMs）在自由职业软件工程任务中的表现。包含来自 Upwork 的 1400 多个任务，总价值达 100 ...

AI Projects12/18/2025

DynamicCity - 上海 AI Lab 推出的4D动态场景生成框架

DynamicCity 是上海AI Lab推出的大规模动态场景生成的4D生成框架。DynamicCity 专注于生成具有语义信息的动态 LiDAR 场景，能处理大规模空间（80×80×6.4 m³）...

AI Projects12/18/2025

MoBA - Moonshot AI 提出的新型注意力机制

MoBA（Mixture of Block Attention）是 Moonshot AI 提出的新型注意力机制，提高大型语言模型（LLMs）处理长上下文任务的效率。通过将上下文划分为多个块（bl...

AI Projects12/18/2025

ToddlerBot - 斯坦福大学开源的机器学习与人形机器人平台

ToddlerBot是斯坦福大学开源的用在运动操作的开源机器学习与人形机器人平台，为高效收集大规模、高质量的训练数据设计。ToddlerBot具备30个主动自由度，用Dyn...

AI Projects12/18/2025

Phantom - 字节跳动推出的主体一致视频生成框架

Phantom是字节跳动智能创作团队推出的用在主体一致视频生成（Subject-to-Video, S2V）的框架。基于跨模态对齐技术，结合文本和图像提示，从参考图像中提取主...

AI Projects12/18/2025

Aider - 开源AI编程助手，基于命令行指定自动完成代码修改

Aider 是开源的AI辅助编程工具，基于终端与大型语言模型（LLM）配合，实现高效代码编辑和开发。Aider支持多种编程语言，如 Python、JavaScript、TypeScript ...

AI Projects12/18/2025

TongGeometry - 北京通院联合北大AI研究院推出的几何模型

TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型，专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于高效的搜...

AI Projects12/18/2025

Magma - 微软研究院联合华盛顿等高校推出的多模态AI基础模型

Magma 是微软研究院推出的新型多模态AI基础模型，能为多模态人工智能代理（AI agents）提供通用能力。Magma能理解和执行多模态输入的任务，覆盖数字和物理环...

AI Projects12/18/2025

流畅阅读 - 开源AI浏览器翻译插件，支持双语对照显示

流畅阅读（FluentRead）是开源的浏览器翻译插件，致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术，支持多种翻译引擎，包括传统机器翻译和AI...

AI Projects12/18/2025

Muse - 微软研究院推出的生成式AI模型

Muse是微软推出的首个用在游戏创意生成的生成式AI模型，基于“World and Human Action Model”（WHAM）。Muse能生成游戏视觉效果和控制器操作，基于学习人类玩...

AI Projects12/18/2025

HealthGPT - 浙大联合阿里等机构推出的医学视觉语言模型

HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言模型（Med-LVLM），通过异构知识适应技术实现医学视觉理解和生成任务...

AI Projects12/18/2025

PaliGemma 2 mix - 谷歌DeepMind推出的升级版视觉语言模型

PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言模型（VLM）。集成了多种视觉和语言处理能力，支持图像描述、目标检测、图像分割、OCR以及文档理解等...

AI Projects12/18/2025

FlexTok - Apple 联合 EPFL 推出的图像处理技术

FlexTok 是瑞士洛桑联邦理工学院（EPFL）和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列（token sequences），以灵活的长度描...

AI Projects12/18/2025

Helix - Figure 推出的端到端通用控制模型

Helix 是 Figure 推出的通用视觉-语言-动作（VLA）模型，用于人形机器人的控制。Helix首创性地实现对机器人整个上身（包括手腕、躯干、头部和手指）的高速率...

AI Projects12/18/2025

BioEmu - 微软推出的生成式深度学习系统

BioEmu是微软研究院推出的生成式深度学习系统，高效模拟蛋白质的动态结构和平衡态构象。能在单个GPU上每小时生成数千种蛋白质结构样本，效率远超传统的分子动...

AI Projects12/18/2025

OSUM - 西北工业大学开源的语音理解模型

OSUM（Open Speech Understanding Model）是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSUM结合Whisper编码器和Qwen2 LLM，...

AI Projects12/18/2025

Crawl4LLM - 清华和卡内基梅隆大学联合开源的智能爬虫系统

Crawl4LLM 是清华大学和卡内基梅隆大学联合开源的智能爬虫系统，提升大语言模型（LLM）预训练效率。Crawl4LLM基于智能评估网页对 LLM 预训练的价值，优先抓取...

AI Projects12/18/2025

AI co-scientist - 谷歌推出多智能体协作的 AI 科研助手

AI co-scientist 是谷歌推出的多智能体AI系统，作为虚拟科研机器人，协助科研人员搞定各种繁琐的科研任务，包括科研选题、文献检索和实验设计。AI co-scienti...

AI Projects12/18/2025

协和·太初 - 北京协和与中科院共同推出的罕见病领域AI大模型

协和·太初是北京协和医院与中国科学院自动化研究所共同研发的国内首个罕见病领域AI大模型，正式进入临床应用。模型基于我国罕见病知识库的多年积累和中国人群...

AI Projects12/18/2025

HiveChat - 开源 AI 聊天机器人，支持Deepseek等主流 AI 模型

HiveChat 是为中小团队设计的 AI 聊天应用，支持多种主流 AI 模型，如 OpenAI、Claude、Gemini 和 Deepseek 等。HiveChat具备 LaTeX 和 Markdown 渲染、图像...

←1...81 82 83 84 85 86 87...137 →

AI News

AI Projects12/18/2025

All Categories

AI News

Agentic Reasoning - 牛津大学推出增强LLM推理能力的框架

瑞智病理大模型 - 瑞金联合华为推出的多模态互动式病理大模型

Step-Audio-TTS-3B - 高性能 TTS 模型，能生成特定情感和说唱风格的语音

CLaMP 3- 清华团队推出的音乐信息检索框架

SWE-Lancer - OpenAI 推出的大模型基准测试

DynamicCity - 上海 AI Lab 推出的4D动态场景生成框架

MoBA - Moonshot AI 提出的新型注意力机制

ToddlerBot - 斯坦福大学开源的机器学习与人形机器人平台

Phantom - 字节跳动推出的主体一致视频生成框架

Aider - 开源AI编程助手，基于命令行指定自动完成代码修改

TongGeometry - 北京通院联合北大AI研究院推出的几何模型

Magma - 微软研究院联合华盛顿等高校推出的多模态AI基础模型

流畅阅读 - 开源AI浏览器翻译插件，支持双语对照显示

Muse - 微软研究院推出的生成式AI模型

HealthGPT - 浙大联合阿里等机构推出的医学视觉语言模型

PaliGemma 2 mix - 谷歌DeepMind推出的升级版视觉语言模型

FlexTok - Apple 联合 EPFL 推出的图像处理技术

Helix - Figure 推出的端到端通用控制模型

BioEmu - 微软推出的生成式深度学习系统

OSUM - 西北工业大学开源的语音理解模型

Crawl4LLM - 清华和卡内基梅隆大学联合开源的智能爬虫系统

AI co-scientist - 谷歌推出多智能体协作的 AI 科研助手

协和·太初 - 北京协和与中科院共同推出的罕见病领域AI大模型

HiveChat - 开源 AI 聊天机器人，支持Deepseek等主流 AI 模型

AI News

Agentic Reasoning - 牛津大学推出增强LLM推理能力的框架

瑞智病理大模型 - 瑞金联合华为推出的多模态互动式病理大模型

Step-Audio-TTS-3B - 高性能 TTS 模型，能生成特定情感和说唱风格的语音

CLaMP 3- 清华团队推出的音乐信息检索框架

SWE-Lancer - OpenAI 推出的大模型基准测试

DynamicCity - 上海 AI Lab 推出的4D动态场景生成框架

MoBA - Moonshot AI 提出的新型注意力机制

ToddlerBot - 斯坦福大学开源的机器学习与人形机器人平台

Phantom - 字节跳动推出的主体一致视频生成框架

Aider - 开源AI编程助手，基于命令行指定自动完成代码修改

TongGeometry - 北京通院联合北大AI研究院推出的几何模型

Magma - 微软研究院联合华盛顿等高校推出的多模态AI基础模型

流畅阅读 - 开源AI浏览器翻译插件，支持双语对照显示

Muse - 微软研究院推出的生成式AI模型

HealthGPT - 浙大联合阿里等机构推出的医学视觉语言模型

PaliGemma 2 mix - 谷歌DeepMind推出的升级版视觉语言模型

FlexTok - Apple 联合 EPFL 推出的图像处理技术

Helix - Figure 推出的端到端通用控制模型

BioEmu - 微软推出的生成式深度学习系统

OSUM - 西北工业大学开源的语音理解模型

Crawl4LLM - 清华和卡内基梅隆大学联合开源的智能爬虫系统

AI co-scientist - 谷歌推出多智能体协作的 AI 科研助手

协和·太初 - 北京协和与中科院共同推出的罕见病领域AI大模型

HiveChat - 开源 AI 聊天机器人，支持Deepseek等主流 AI 模型