AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

DiffRhythm（中文名称：谛韵）是西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型（Latent Diffusion）技术，能快速生成包...

AI Projects12/18/2025

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型（MLLMs）与人类偏好的对齐能力设计的高质量数据...

AI Projects12/18/2025

TrendPublish - AI内容发布工具，支持智能总结和自动发布

TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集，从 Twitter/X、网站等渠道获取信息，用 DeepseekAI、千问等 AI 服务进行智能总结、关...

AI Projects12/18/2025

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

Proxy Lite 是开源的轻量级视觉语言模型（VLM），参数量为3B，支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器，完成网页交互、数据抓取、表单填写等...

AI Projects12/18/2025

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型，基于自然对话实现多样化的视觉生成任务。WeGen结合多模态...

AI Projects12/18/2025

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的，无需训练的图像生成与编辑框架，支持用户基于手绘草图直观地控制图像生成...

AI Projects12/18/2025

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token，与文本token共享同一词汇空间，让大型...

AI Projects12/18/2025

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

X-Dancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的研究人员共同推出的音乐驱动的人像舞蹈视频生成框架，支持从单张静态图像生成多样化且逼真的全身...

AI Projects12/18/2025

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2（Accident Video Diffusion for Accident Video Description）是清华大学联合香港科技大学、吉林大学、南京理工大学、北京理工大学、复旦大学等机构推出...

AI Projects12/18/2025

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

Kiss3DGen是创新的3D资产生成框架，通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle Image”，将多视图图像及对应...

AI Projects12/18/2025

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

Archon 是专注于构建和优化 AI 智能体的开源项目。通过自主生成代码和优化智能体性能，展示了现代 AI 开发的核心理念。Archon 的核心功能包括智能体的快速构...

AI Projects12/18/2025

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景，用多智能体协作系统（包括主持人、嘉宾和编剧）自动生成丰富且结...

AI Projects12/18/2025

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是创新的文本到矢量图形（SVG）生成框架，通过结合大型语言模型（LLMs）和图像扩散模型，实现高质量 SVG 图形的自动化创作。通过多阶段流程，首先基...

AI Projects12/18/2025

QwQ-32B - 阿里通义千问开源的最新推理模型

QwQ-32B 是阿里巴巴开源的新型推理模型，参数量为 320 亿。基于大规模强化学习（RL）训练，在数学推理、编程等任务上表现出色，性能比肩 6710 亿参数的 DeepS...

AI Projects12/18/2025

Light-R1 - 360智脑开源的长思维链推理模型

Light-R1是360智脑开源的AI模型，专注于数学领域的长思维链推理，具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct，用7万条数学数据和两阶段课程学习（SF...

AI Projects12/18/2025

SpatialVLA - 上海 AI Lab 联合上科大等推出的空间具身通用操作模型

SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型，基于百万真实数据预训练，为机器人赋予通用的3...

AI Projects12/18/2025

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

TheoremExplainAgent（TEA）是滑铁卢大学、Votee AI等机构开源的多模态代理系统，基于生成长篇动画视频帮助人们更好地理解数学和科学定理。TheoremExplainAge...

AI Projects12/18/2025

Aya Vision - Cohere 推出多模态、多语言的视觉模型

Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型，提升全球范围内的多语言和多模态通信能力。支持 23 种语言，能执行图像描述生成、视觉问答、文本翻译...

AI Projects12/18/2025

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型，基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务，如图文检索和组合图像检...

AI Projects12/18/2025

混元图生视频 - 腾讯混元开源的图生视频模型

混元图生视频是腾讯混元推出的开源图生视频模型，用户可以通过上传一张图片进行简短描述，让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效...

AI Projects12/18/2025

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Granite 3.2 是IBM开源的多模态AI模型系列，具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本， Granite 3.2 Instruct 提供实验性链式推理能力...

AI Projects12/18/2025

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

Resume Matcher 是开源的 AI 简历优化工具，帮助求职者提升简历通过自动化筛选系统（ATS）的概率。Resume Matcher基于解析简历和职位描述，提取关键技能、经...

AI Projects12/18/2025

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

OpenManus 是MetaGPT 团队推出的开源复刻版 Manus，提供无需邀请码的 AI Agent 。OpenManus基于模块化设计，支持多种语言模型和工具链，能执行代码、处理文件...

AI Projects12/18/2025

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型，能实现对语言、音频和视觉信息的全方位感知与交...

←1...86 87 88 89 90 91 92...137 →

AI News

AI Projects12/18/2025

All Categories

AI News

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

TrendPublish - AI内容发布工具，支持智能总结和自动发布

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

QwQ-32B - 阿里通义千问开源的最新推理模型

Light-R1 - 360智脑开源的长思维链推理模型

SpatialVLA - 上海 AI Lab 联合上科大等推出的空间具身通用操作模型

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

Aya Vision - Cohere 推出多模态、多语言的视觉模型

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

混元图生视频 - 腾讯混元开源的图生视频模型

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

AI News

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

TrendPublish - AI内容发布工具，支持智能总结和自动发布

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

QwQ-32B - 阿里通义千问开源的最新推理模型

Light-R1 - 360智脑开源的长思维链推理模型

SpatialVLA - 上海 AI Lab 联合上科大等推出的空间具身通用操作模型

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

Aya Vision - Cohere 推出多模态、多语言的视觉模型

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

混元图生视频 - 腾讯混元开源的图生视频模型

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互