AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Ovis2 - 阿里国际推出的多模态大语言系列模型

Ovis2 是阿里巴巴国际团队推出的新型多模态大语言模型，基于结构化嵌入对齐解决视觉与文本模态间的差异。Ovis2继承、优化了 Ovis 系列架构，强化小规模模型的...

AI Projects12/18/2025

AgentSociety - 清华大学推出的社会模拟器

AgentSociety 是清华大学推出的基于大语言模型（LLM）的社会模拟器，通过构建具有“类人心智”的智能体来模拟复杂的社会行为和现象。结合社会学理论，赋予智能...

AI Projects12/18/2025

Sitcom-Crafter - 北航联合港中文等高校推出的 3D 人类动作生成系统

Sitcom-Crafter 是北京航空航天大学、香港中文大学（深圳）、悉尼科技大学、中山大学等高校联合推出的 3D 场景中人类动作生成系统。基于用户提供的长剧情指导...

AI Projects12/18/2025

Migician - 北交大联合清华、华中科大推出的多模态视觉定位模型

Migician是北京交通大学、华中科技大学和清华大学的研究团队联合推出的多模态大语言模型（MLLM），专门用在自由形式的多图像定位（Multi-Image Grounding, MI...

AI Projects12/18/2025

ComfyUI-Copilot - 阿里推出基于 ComfyUI 的 AI 智能助手

ComfyUI-Copilot 是阿里巴巴国际数字商业集团（AIDC-AI）推出基于 ComfyUI 框架深度开发的 AI 智能助手。ComfyUI-Copilot给予自然语言交互，为用户提供节点推...

AI Projects12/18/2025

Auto-Deep-Research - 香港大学开源的全自动个人 AI 助理

Auto-Deep-Research 是香港大学黄超教授实验室开源的全自动个人 AI 助理，作为 OpenAI Deep Research 的开源替代方案。基于 AutoAgent 框架开发，专注于深度...

AI Projects12/18/2025

OOMOL - 基于 VSCode 的 AI 工作流集成开发环境

OOMOL （悟墨）是基于 VSCode 打造的现代化集成开发环境（IDE），专为工作流自动化而设计。通过拖拽式图形化界面，让用户能直观地搭建复杂的工作流，无需编程...

AI Projects12/18/2025

Evo 2 - Acr研究所联合英伟达、斯坦福等推出的生物学AI模型

Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型，用于基因组建模和设计，覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发...

AI Projects12/18/2025

Indic Parler-TTS - 开源多语言TTS模型，专注于合成印度语和英语

Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音（TTS）模型，专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parl...

AI Projects12/18/2025

GRUtopia 2.0 - 上海 AI Lab 推出的通用具身智能仿真平台

GRUtopia 2.0（桃源2.0）是上海人工智能实验室发布的通用具身智能仿真平台。平台在GRUtopia 1.0的基础上进行了全面升级，具备三大核心创新：通用模块化框架、...

AI Projects12/18/2025

BioMedGPT-R1 - 清华联合水木分子推出的多模态生物医药大模型

BioMedGPT-R1 是清华大学AI产业研究院（AIR）与北京水木分子生物科技有限公司联合推出的升级版多模态生物医药开源大模型。BioMedGPT-R1基于 DeepSeek R1 技术...

AI Projects12/18/2025

SigLIP 2 - 谷歌 DeepMind 推出的多语言视觉语言编码器模型

SigLIP 2 是Google DeepMind 提出先进的多语言视觉-语言模型，是 SigLIP 的升级版本，提升图像与文本之间的对齐能力。通过改进的训练方法和架构，显著增强了...

AI Projects12/18/2025

AvatarGO - 南洋理工联合上海 AI Lab 等推出的4D人体与物体交互生成框架

AvatarGO 是南洋理工大学S-Lab、上海 AI Lab，香港大学联合推出的新型框架，用在从文本输入直接生成可动画化的 4D 人体与物体交互场景。通过零样本（zero-sho...

AI Projects12/18/2025

Moonlight-16B-A3B - 月之暗面开源的 MoE 模型

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型，具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...

AI Projects12/18/2025

FlashMLA - DeepSeek 开源的高效 MLA 解码内核，专为Hopper 架构 GPU 设计

FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA（Multi-Head Linear Attention）解码内核，专为处理可变长度序列设计。通过优化 KV...

AI Projects12/18/2025

MagicArticulate - 南洋理工和字节推出的静态 3D 模型转骨架生成框架

MagicArticulate 是南洋理工大学和字节跳动Seed实验室推出的自动将静态 3D 模型转换为可动画化资产的框架。MagicArticulate基于自回归生成骨架，预测蒙皮权重...

AI Projects12/18/2025

TANGLED - 上海科大联合华中科大等推出的3D发型生成方法

TANGLED是上海科技大学、Deemos Technology和华中科技大学联合推出的3D发型生成方法，支持从任意风格和视角的图像中生成高质量的3D发丝。TANGLED基于三个核心...

AI Projects12/18/2025

Llasa TTS - 香港科技大学开源的文本转语音模型

Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音（TTS）模型，支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化（VQ）编解码器和单个 Tr...

AI Projects12/18/2025

AingDesk - 开源AI客户端工具，一键部署上百款 AI 模型到个人电脑

AingDesk 是开源的客户端软件，帮助用户快速将上百款 AI 模型部署到个人电脑上。通过一键部署功能，简化复杂的模型安装过程，没有技术背景的用户也能轻松上手...

AI Projects12/18/2025

LazyLLM - 商汤大装置开源的多智能体应用开发平台

LazyLLM 是开源的低代码平台，帮助开发者快速、低成本地构建多智能体大语言模型应用。通过极简的开发流程，支持一键式部署和跨平台操作，降低了 AI 应用开发...

AI Projects12/18/2025

memobase - 基于用户画像的长期记忆系统

memobase 是开源的基于用户画像的长期记忆系统，专为生成式人工智能（GenAI）应用设计。memobase能为虚拟助手、教育工具等应用提供用户记忆功能，帮助AI记住...

AI Projects12/18/2025

MeteoRA - 南大推出高效可扩展的多任务嵌入框架

MeteoRA 是南京大学计算机科学与技术系的研究团队推出的用于大型语言模型（LLM）的多任务嵌入框架，将多个任务特定的 LoRA（低秩适配器）集成到一个基础模型...

AI Projects12/18/2025

MME-CoT - 港中文等机构推出评估视觉推理能力的基准框架

MME-CoT 是香港中文大学（深圳）、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机构共同推出的用于评估大型多模态模...

AI Projects12/18/2025

Claude 3.7 Sonnet - Anthropic 推出的首款混合推理模型

Claude 3.7 Sonnet 是 Anthropic 公司推出的全球首款混合推理模型，具备“标准模式”和“扩展思考模式”两种运行方式。标准模式下，Claude 3.7 Sonnet能快速生成...

←1...82 83 84 85 86 87 88...137 →

AI News

AI Projects12/18/2025

Ovis2 - 阿里国际推出的多模态大语言系列模型

AI Projects12/18/2025

AgentSociety - 清华大学推出的社会模拟器

AI Projects12/18/2025

Sitcom-Crafter - 北航联合港中文等高校推出的 3D 人类动作生成系统

AI Projects12/18/2025

Migician - 北交大联合清华、华中科大推出的多模态视觉定位模型

AI Projects12/18/2025

ComfyUI-Copilot - 阿里推出基于 ComfyUI 的 AI 智能助手

ComfyUI-Copilot 是阿里巴巴国际数字商业集团（AIDC-AI）推出基于 ComfyUI 框架深度开发的 AI 智能助手。ComfyUI-Copilot给予自然语言交互，为用户提供节点推...

AI Projects12/18/2025

Auto-Deep-Research - 香港大学开源的全自动个人 AI 助理

Auto-Deep-Research 是香港大学黄超教授实验室开源的全自动个人 AI 助理，作为 OpenAI Deep Research 的开源替代方案。基于 AutoAgent 框架开发，专注于深度...

AI Projects12/18/2025

OOMOL - 基于 VSCode 的 AI 工作流集成开发环境

AI Projects12/18/2025

Evo 2 - Acr研究所联合英伟达、斯坦福等推出的生物学AI模型

AI Projects12/18/2025

Indic Parler-TTS - 开源多语言TTS模型，专注于合成印度语和英语

Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音（TTS）模型，专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parl...

AI Projects12/18/2025

GRUtopia 2.0 - 上海 AI Lab 推出的通用具身智能仿真平台

AI Projects12/18/2025

BioMedGPT-R1 - 清华联合水木分子推出的多模态生物医药大模型

AI Projects12/18/2025

SigLIP 2 - 谷歌 DeepMind 推出的多语言视觉语言编码器模型

AI Projects12/18/2025

AvatarGO - 南洋理工联合上海 AI Lab 等推出的4D人体与物体交互生成框架

AI Projects12/18/2025

Moonlight-16B-A3B - 月之暗面开源的 MoE 模型

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型，具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...

AI Projects12/18/2025

FlashMLA - DeepSeek 开源的高效 MLA 解码内核，专为Hopper 架构 GPU 设计

FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA（Multi-Head Linear Attention）解码内核，专为处理可变长度序列设计。通过优化 KV...

AI Projects12/18/2025

MagicArticulate - 南洋理工和字节推出的静态 3D 模型转骨架生成框架

AI Projects12/18/2025

TANGLED - 上海科大联合华中科大等推出的3D发型生成方法

AI Projects12/18/2025

Llasa TTS - 香港科技大学开源的文本转语音模型

AI Projects12/18/2025

AingDesk - 开源AI客户端工具，一键部署上百款 AI 模型到个人电脑

AI Projects12/18/2025

LazyLLM - 商汤大装置开源的多智能体应用开发平台

AI Projects12/18/2025

memobase - 基于用户画像的长期记忆系统

AI Projects12/18/2025

MeteoRA - 南大推出高效可扩展的多任务嵌入框架

AI Projects12/18/2025

MME-CoT - 港中文等机构推出评估视觉推理能力的基准框架

AI Projects12/18/2025

All Categories

AI News

Ovis2 - 阿里国际推出的多模态大语言系列模型

AgentSociety - 清华大学推出的社会模拟器

Sitcom-Crafter - 北航联合港中文等高校推出的 3D 人类动作生成系统

Migician - 北交大联合清华、华中科大推出的多模态视觉定位模型

ComfyUI-Copilot - 阿里推出基于 ComfyUI 的 AI 智能助手

Auto-Deep-Research - 香港大学开源的全自动个人 AI 助理

OOMOL - 基于 VSCode 的 AI 工作流集成开发环境

Evo 2 - Acr研究所联合英伟达、斯坦福等推出的生物学AI模型

Indic Parler-TTS - 开源多语言TTS模型，专注于合成印度语和英语

GRUtopia 2.0 - 上海 AI Lab 推出的通用具身智能仿真平台

BioMedGPT-R1 - 清华联合水木分子推出的多模态生物医药大模型

SigLIP 2 - 谷歌 DeepMind 推出的多语言视觉语言编码器模型

AvatarGO - 南洋理工联合上海 AI Lab 等推出的4D人体与物体交互生成框架

Moonlight-16B-A3B - 月之暗面开源的 MoE 模型

FlashMLA - DeepSeek 开源的高效 MLA 解码内核，专为Hopper 架构 GPU 设计

MagicArticulate - 南洋理工和字节推出的静态 3D 模型转骨架生成框架

TANGLED - 上海科大联合华中科大等推出的3D发型生成方法

Llasa TTS - 香港科技大学开源的文本转语音模型

AingDesk - 开源AI客户端工具，一键部署上百款 AI 模型到个人电脑

LazyLLM - 商汤大装置开源的多智能体应用开发平台

memobase - 基于用户画像的长期记忆系统

MeteoRA - 南大推出高效可扩展的多任务嵌入框架

MME-CoT - 港中文等机构推出评估视觉推理能力的基准框架

Claude 3.7 Sonnet - Anthropic 推出的首款混合推理模型

AI News

Ovis2 - 阿里国际推出的多模态大语言系列模型

AgentSociety - 清华大学推出的社会模拟器

Sitcom-Crafter - 北航联合港中文等高校推出的 3D 人类动作生成系统

Migician - 北交大联合清华、华中科大推出的多模态视觉定位模型

ComfyUI-Copilot - 阿里推出基于 ComfyUI 的 AI 智能助手

Auto-Deep-Research - 香港大学开源的全自动个人 AI 助理

OOMOL - 基于 VSCode 的 AI 工作流集成开发环境

Evo 2 - Acr研究所联合英伟达、斯坦福等推出的生物学AI模型

Indic Parler-TTS - 开源多语言TTS模型，专注于合成印度语和英语

GRUtopia 2.0 - 上海 AI Lab 推出的通用具身智能仿真平台

BioMedGPT-R1 - 清华联合水木分子推出的多模态生物医药大模型

SigLIP 2 - 谷歌 DeepMind 推出的多语言视觉语言编码器模型

AvatarGO - 南洋理工联合上海 AI Lab 等推出的4D人体与物体交互生成框架

Moonlight-16B-A3B - 月之暗面开源的 MoE 模型

FlashMLA - DeepSeek 开源的高效 MLA 解码内核，专为Hopper 架构 GPU 设计

MagicArticulate - 南洋理工和字节推出的静态 3D 模型转骨架生成框架

TANGLED - 上海科大联合华中科大等推出的3D发型生成方法

Llasa TTS - 香港科技大学开源的文本转语音模型

AingDesk - 开源AI客户端工具，一键部署上百款 AI 模型到个人电脑

LazyLLM - 商汤大装置开源的多智能体应用开发平台

memobase - 基于用户画像的长期记忆系统

MeteoRA - 南大推出高效可扩展的多任务嵌入框架

MME-CoT - 港中文等机构推出评估视觉推理能力的基准框架

Claude 3.7 Sonnet - Anthropic 推出的首款混合推理模型