AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Qwen2.5-Max - 阿里通义千问推出的MoE模型

Qwen2.5-Max是阿里云推出的超大规模MoE（Mixture of Experts）模型，使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越，超越了DeepSeek V3、...

AI Projects12/18/2025

MobileVD - 首个针对移动设备优化的视频扩散模型

MobileVD（Mobile Video Diffusion）是首个针对移动设备优化的视频扩散模型，Qualcomm AI Research团队开发。模型基于Stable Video Diffusion（SVD）的时空UN...

AI Projects12/18/2025

YuE - 港科大联合 M-A-P 推出的开源AI音乐生成模型

YuE 是香港科技大学和 Multimodal Art Projection 团队联合开发的开源 AI 音乐生成模型。能将歌词转化为完整的歌曲，支持多种音乐风格，包括流行、金属、爵士...

AI Projects12/18/2025

VARGPT - 北大推出的多模态理解生成统一模型

VARGPT是创新的多模态大语言模型，专注于视觉理解和生成任务。基于自回归框架，将视觉生成与理解统一在一个模型中，避免任务切换的复杂性。VARGPT在LLaVA架构...

AI Projects12/18/2025

CityDreamer4D - 南洋理工推出的无边界 4D 城市建模框架

CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体（如车辆）与静态场景（如建筑和道路）分离，通过三个模块—...

AI Projects12/18/2025

SpeechGPT 2.0-preview - 复旦大学推出的端到端实时语音交互模型

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交互系统，基于百万小时级中文语音数据训练，采用端到端架构，实现了语音与文本模态的高度...

AI Projects12/18/2025

LalaEval - 港中文联合货拉拉推出面向特定领域的模型评估框架

LalaEval是香港中文大学和货拉拉数据科学团队共同推出的面向特定领域大语言模型（LLMs）的人类评估框架，框架通过一套完整的端到端协议，涵盖领域规范、标准...

AI Projects12/18/2025

Aligner - 北大推出的残差修正模型对齐技术

Aligner是北京大学团队提出的大语言模型对齐技术，通过学习对齐答案与未对齐答案之间的修正残差来提升模型性能。采用自回归的 seq2seq 模型，在问题-答案-修...

AI Projects12/18/2025

OpenAI o3-mini - OpenAI 推出的全新推理模型

OpenAI o3-mini是OpenAI正式发布的全新推理模型。是OpenAI推理系列中最新、成本效益最高的模型，专为科学、数学和编程等技术领域优化。支持三种推理强度（低...

AI Projects12/18/2025

EICopilot - 百度推出基于AI智能体的企业信息搜索与探索工具

EICopilot是百度研究院推出的基于AI智能体的企业信息搜索与探索工具。通过大型语言模型（LLM）驱动的智能体，帮助企业用户在大规模知识图谱中高效检索和解读...

AI Projects12/18/2025

Mistral Small 3 - Mistral AI 推出的开源大语言模型

Mistral Small 3 是 Mistral AI 发布的开源大型语言模型，有240亿参数，基于 Apache 2.0 许可证开源。专为低延迟任务设计，支持多语言（包括英语、中文、日语...

AI Projects12/18/2025

CoA - 谷歌推出的多智能体协作框架

CoA（Chain-of-Agents）是谷歌推出的多智能体协作框架，用于解决大语言模型（LLM）在处理长文本任务时面临的上下文限制问题。CoA框架将长文本分割成多个较短...

AI Projects12/18/2025

Oumi - 开源 AI 平台，支持 1000 万到 4050 亿参数模型训练

Oumi 是完全开源的 AI 平台，简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练，涵盖文本和多模态模型（如 Lla...

AI Projects12/18/2025

IC-Portrait - ETH联合浙大等推出的个性化肖像生成框架

IC-Portrait是新型的个性化肖像生成框架，解决用户资料图像多样性（如外观和光照条件差异）带来的挑战。通过将肖像生成任务分解为“光照感知拼接”和“视角一致...

AI Projects12/18/2025

SyncAnimation - 南科大等推出的实时音频驱动生成头部运动框架

SyncAnimation是实时端到端的音频驱动框架，用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频同步的上半身姿态和面部表情，包括嘴唇动作，实现高...

AI Projects12/18/2025

BitsAI-CR - 字节跳动推出的自动化代码审查工具

BitsAI-CR是字节跳动团队推出的基于大型语言模型（LLM）的自动化代码审查工具，通过两阶段处理流程实现高效代码审查：RuleChecker 负责基于 219 条规则检测潜...

AI Projects12/18/2025

DiffSplat - 北大联合字节推出的 3D 生成框架

DiffSplat是新型的 3D 生成方法，从文本提示和单视图图像快速生成 3D 高斯点阵（Gaussian Splats）。通过微调预训练的文本到图像扩散模型，基于强大的 2D 先...

AI Projects12/18/2025

X-Prompt - 用于多模态视频目标分割的通用框架

X-Prompt是用于多模态视频目标分割的通用框架，解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数据的视频目标分...

AI Projects12/18/2025

VideoReward - 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型

VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据，涵盖视觉质量、运动质量和文本对齐三个...

AI Projects12/18/2025

MILS - Meta AI 推出的零样本生成高质量多模态描述方法

MILS（Multimodal Iterative LLM Solver）是Meta AI提出的无需训练即可赋予大型语言模型（LLM）多模态能力的方法。通过多步推理，提示LLM生成候选输出，对每...

AI Projects12/18/2025

OpenDeepResearcher - 开源 AI 研究工具，自动完成搜索、评估、提取和报告生成

OpenDeepResearcher 是开源的 AI 研究工具，能帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理，自动从网络中获取相关数据，生成综合报告。...

AI Projects12/18/2025

OCRmyPDF - 专为 PDF 文件转换为可搜索、可复制的文档AI工具

OCRmyPDF 是开源的命令行工具，专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层，将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工...

AI Projects12/18/2025

node-DeepResearch - Deep Research开源复现版 AI Agent，支持多步推理和复杂查询

node-DeepResearch 是开源的 AI 智能体项目，基于持续搜索和阅读网页，用 Gemini 语言模型和 Jina Reader 工具，逐步推理、回答复杂问题，直到找到答案或超出...

AI Projects12/18/2025

OmniHuman - 字节跳动推出的单张照片生成全身动态视频生成框架

OmniHuman 是字节跳动推出的端到端多模态条件化人类视频生成框架，能基于单张人类图像和运动信号（如音频、视频或两者的组合）生成逼真的人类视频。OmniHuman...

←1...75 76 77 78 79 80 81...137 →

AI News

AI Projects12/18/2025

All Categories

AI News

Qwen2.5-Max - 阿里通义千问推出的MoE模型

MobileVD - 首个针对移动设备优化的视频扩散模型

YuE - 港科大联合 M-A-P 推出的开源AI音乐生成模型

VARGPT - 北大推出的多模态理解生成统一模型

CityDreamer4D - 南洋理工推出的无边界 4D 城市建模框架

SpeechGPT 2.0-preview - 复旦大学推出的端到端实时语音交互模型

LalaEval - 港中文联合货拉拉推出面向特定领域的模型评估框架

Aligner - 北大推出的残差修正模型对齐技术

OpenAI o3-mini - OpenAI 推出的全新推理模型

EICopilot - 百度推出基于AI智能体的企业信息搜索与探索工具

Mistral Small 3 - Mistral AI 推出的开源大语言模型

CoA - 谷歌推出的多智能体协作框架

Oumi - 开源 AI 平台，支持 1000 万到 4050 亿参数模型训练

IC-Portrait - ETH联合浙大等推出的个性化肖像生成框架

SyncAnimation - 南科大等推出的实时音频驱动生成头部运动框架

BitsAI-CR - 字节跳动推出的自动化代码审查工具

DiffSplat - 北大联合字节推出的 3D 生成框架

X-Prompt - 用于多模态视频目标分割的通用框架

VideoReward - 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型

MILS - Meta AI 推出的零样本生成高质量多模态描述方法

OpenDeepResearcher - 开源 AI 研究工具，自动完成搜索、评估、提取和报告生成

OCRmyPDF - 专为 PDF 文件转换为可搜索、可复制的文档AI工具

node-DeepResearch - Deep Research开源复现版 AI Agent，支持多步推理和复杂查询

OmniHuman - 字节跳动推出的单张照片生成全身动态视频生成框架

AI News

Qwen2.5-Max - 阿里通义千问推出的MoE模型

MobileVD - 首个针对移动设备优化的视频扩散模型

YuE - 港科大联合 M-A-P 推出的开源AI音乐生成模型

VARGPT - 北大推出的多模态理解生成统一模型

CityDreamer4D - 南洋理工推出的无边界 4D 城市建模框架

SpeechGPT 2.0-preview - 复旦大学推出的端到端实时语音交互模型

LalaEval - 港中文联合货拉拉推出面向特定领域的模型评估框架

Aligner - 北大推出的残差修正模型对齐技术

OpenAI o3-mini - OpenAI 推出的全新推理模型

EICopilot - 百度推出基于AI智能体的企业信息搜索与探索工具

Mistral Small 3 - Mistral AI 推出的开源大语言模型

CoA - 谷歌推出的多智能体协作框架

Oumi - 开源 AI 平台，支持 1000 万到 4050 亿参数模型训练

IC-Portrait - ETH联合浙大等推出的个性化肖像生成框架

SyncAnimation - 南科大等推出的实时音频驱动生成头部运动框架

BitsAI-CR - 字节跳动推出的自动化代码审查工具

DiffSplat - 北大联合字节推出的 3D 生成框架

X-Prompt - 用于多模态视频目标分割的通用框架

VideoReward - 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型

MILS - Meta AI 推出的零样本生成高质量多模态描述方法

OpenDeepResearcher - 开源 AI 研究工具，自动完成搜索、评估、提取和报告生成

OCRmyPDF - 专为 PDF 文件转换为可搜索、可复制的文档AI工具

node-DeepResearch - Deep Research开源复现版 AI Agent，支持多步推理和复杂查询

OmniHuman - 字节跳动推出的单张照片生成全身动态视频生成框架