AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型，基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文 SOTA 效...

AI Projects12/18/2025

FastVLM - 苹果推出的高效视觉语言模型

FastVLM是苹果推出的高效的视觉语言模型（VLM），能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器，有效减少视觉token数量，显著...

AI Projects12/18/2025

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域带来了重大突破。无需...

AI Projects12/18/2025

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

PrimitiveAnything是腾讯人工智能平台部（AIPD）和清华大学联合开发的新型3D形状生成框架。将复杂的3D形状分解为简单的基元元素，通过自回归方式生成这些基元...

AI Projects12/18/2025

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链，集成超过30万条光子芯片相关专利、文献和行业数据资源，具备...

AI Projects12/18/2025

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

Xianyu AutoAgent 是为闲鱼平台设计的智能客服机器人系统。支持实现7×24小时自动化值守，多专家协同决策、智能议价及上下文感知对话。基于上下文感知技术，管...

AI Projects12/18/2025

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

Matrix-Game是昆仑万维开源的工业界首个10B+空间智能大模型，是Matrix-Zero世界模型中的可交互视频生成大模型。模型基于两阶段训练策略，根据用户输入生成连...

AI Projects12/18/2025

GitFriend - AI GitHub助手，自动生成定制化README文件

GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具，能简化 GitHub 的使用流程，提升开发效率。GitFriend支持基于 AI 聊天功能为用户...

AI Projects12/18/2025

Muyan-TTS - 开源文本转语音模型，零样本语音合成

Muyan-TTS 是为播客场景设计的开源文本转语音（TTS）模型。模型预训练超过10万小时的播客音频数据，能实现零样本语音合成，无需大量目标说话人的语音数据可生...

AI Projects12/18/2025

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

Chinese-LiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集，包含100小时的语音、视频和手动转录文本，创新性地融合了唇读视频和演讲...

AI Projects12/18/2025

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

ViLAMP（VIdeo-LAnguage Model with Mixed Precision）是蚂蚁集团和中国人民大学联合推出的视觉语言模型，专门用在高效处理长视频内容。基于混合精度策略，对...

AI Projects12/18/2025

Seed1.5-VL - 字节跳动Seed推出的视觉语言多模态大模型

Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型，具备强大的通用多模态理解和推理能力，推理成本显著降低。模型由一个 532M 参数的视觉编...

AI Projects12/18/2025

Co-Sight - 中兴通讯开源的超级智能体项目

Co-Sight是中兴通讯开源的超级智能体项目，为协同视觉分析平台及智能自动化底座。采用多智能体架构，构建“数字团队”协同体系，通过DAG任务引擎驱动，实现任务...

AI Projects12/18/2025

MCPHub - 一站式MCP服务器聚合平台

MCPHub是一站式MCP（模型上下文协议）服务器聚合平台。支持将多个MCP服务器整合到不同的流式HTTP（SSE）端点，基于直观的Web界面和强大的协议处理能力，简化A...

AI Projects12/18/2025

HealthBench - OpenAI推出的开源医疗测试基准

HealthBench是OpenAI推出的医疗开源测试基准，用在评估大型语言模型（LLMs）在医疗保健领域的表现和安全性。HealthBench包含5000个模型与用户或医疗专业人员...

AI Projects12/18/2025

Seedance 1.0 lite - 火山引擎推出的视频生成模型

Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本，支持文生视频和图生视频两种生成方式，支持生成5秒或10秒、480p或720p分辨率的视频。

AI Projects12/18/2025

Nexus-Gen - 魔搭联合华东师范等机构开源的全模态图像生成模型

Nexus-Gen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型，支持同时完成图像理解、生成和编辑任务。Nexus-Gen融合强大的语言模型与扩散模型的能...

AI Projects12/18/2025

StreamBridge - 苹果联合复旦推出的端侧视频大语言模型框架

StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型（Video-LLMs）框架，能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减压缩策略...

AI Projects12/18/2025

Step1X-3D - 阶跃星辰联合LightIllusions开源的3D资产生成框架

Step1X-3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程，从超过 500 万个 3D 资产中筛选出 200 万个高质量数...

AI Projects12/18/2025

OpenVision - 加州大学开源的视觉编码器家族

OpenVision是加州大学圣克鲁兹分校（UCSC）推出的完全开放、高效且灵活的高级视觉编码器家族，专注于多模态学习。提供从5.9M到632.1M参数的多种规模模型，适...

AI Projects12/18/2025

FLUX-Text - 阿里推出的多语言场景文本编辑框架

FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架，基于扩散模型（Diffusion Model）和轻量级字形嵌入模块。框架基于注入字形条件信息，提升复杂场景下文...

AI Projects12/18/2025

MCA-Ctrl - 中科院和中科大推出的图像定制生成框架

MCA-Ctrl（Multi-party Collaborative Attention Control）是中科院计算所和中国科学院大学的推出的图像定制生成框架，基于文本和复杂视觉条件实现高质量的图...

AI Projects12/18/2025

AgentCPM-GUI - 清华联合面壁智能开源的端侧GUI智能体模型

AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ，针对中文应用优化。模型基于 MiniCPM-V（80 亿参数）构建，能接受智能手机截图作为输...

AI Projects12/18/2025

AG-UI - AI Agent与前端应用交互的开源协议

AG-UI（Agent-User Interaction Protocol）是开源的、轻量级的、基于事件的协议，支持标准化AI Agent 与前端应用之间的交互。AG-UI定义16种标准事件类型，支...

←1...102 103 104 105 106 107 108...137 →

AI News

AI Projects12/18/2025

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型，基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文 SOTA 效...

AI Projects12/18/2025

FastVLM - 苹果推出的高效视觉语言模型

AI Projects12/18/2025

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域带来了重大突破。无需...

AI Projects12/18/2025

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

AI Projects12/18/2025

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

AI Projects12/18/2025

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

AI Projects12/18/2025

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

AI Projects12/18/2025

GitFriend - AI GitHub助手，自动生成定制化README文件

GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具，能简化 GitHub 的使用流程，提升开发效率。GitFriend支持基于 AI 聊天功能为用户...

AI Projects12/18/2025

Muyan-TTS - 开源文本转语音模型，零样本语音合成

AI Projects12/18/2025

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

AI Projects12/18/2025

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

ViLAMP（VIdeo-LAnguage Model with Mixed Precision）是蚂蚁集团和中国人民大学联合推出的视觉语言模型，专门用在高效处理长视频内容。基于混合精度策略，对...

AI Projects12/18/2025

Seed1.5-VL - 字节跳动Seed推出的视觉语言多模态大模型

AI Projects12/18/2025

Co-Sight - 中兴通讯开源的超级智能体项目

AI Projects12/18/2025

MCPHub - 一站式MCP服务器聚合平台

AI Projects12/18/2025

HealthBench - OpenAI推出的开源医疗测试基准

AI Projects12/18/2025

Seedance 1.0 lite - 火山引擎推出的视频生成模型

AI Projects12/18/2025

Nexus-Gen - 魔搭联合华东师范等机构开源的全模态图像生成模型

AI Projects12/18/2025

StreamBridge - 苹果联合复旦推出的端侧视频大语言模型框架

AI Projects12/18/2025

Step1X-3D - 阶跃星辰联合LightIllusions开源的3D资产生成框架

Step1X-3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程，从超过 500 万个 3D 资产中筛选出 200 万个高质量数...

AI Projects12/18/2025

OpenVision - 加州大学开源的视觉编码器家族

AI Projects12/18/2025

FLUX-Text - 阿里推出的多语言场景文本编辑框架

AI Projects12/18/2025

MCA-Ctrl - 中科院和中科大推出的图像定制生成框架

MCA-Ctrl（Multi-party Collaborative Attention Control）是中科院计算所和中国科学院大学的推出的图像定制生成框架，基于文本和复杂视觉条件实现高质量的图...

AI Projects12/18/2025

AgentCPM-GUI - 清华联合面壁智能开源的端侧GUI智能体模型

AI Projects12/18/2025

AG-UI - AI Agent与前端应用交互的开源协议

AG-UI（Agent-User Interaction Protocol）是开源的、轻量级的、基于事件的协议，支持标准化AI Agent 与前端应用之间的交互。AG-UI定义16种标准事件类型，支...

All Categories

AI News

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

FastVLM - 苹果推出的高效视觉语言模型

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

GitFriend - AI GitHub助手，自动生成定制化README文件

Muyan-TTS - 开源文本转语音模型，零样本语音合成

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

Seed1.5-VL - 字节跳动Seed推出的视觉语言多模态大模型

Co-Sight - 中兴通讯开源的超级智能体项目

MCPHub - 一站式MCP服务器聚合平台

HealthBench - OpenAI推出的开源医疗测试基准

Seedance 1.0 lite - 火山引擎推出的视频生成模型

Nexus-Gen - 魔搭联合华东师范等机构开源的全模态图像生成模型

StreamBridge - 苹果联合复旦推出的端侧视频大语言模型框架

Step1X-3D - 阶跃星辰联合LightIllusions开源的3D资产生成框架

OpenVision - 加州大学开源的视觉编码器家族

FLUX-Text - 阿里推出的多语言场景文本编辑框架

MCA-Ctrl - 中科院和中科大推出的图像定制生成框架

AgentCPM-GUI - 清华联合面壁智能开源的端侧GUI智能体模型

AG-UI - AI Agent与前端应用交互的开源协议

AI News

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

FastVLM - 苹果推出的高效视觉语言模型

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

GitFriend - AI GitHub助手，自动生成定制化README文件

Muyan-TTS - 开源文本转语音模型，零样本语音合成

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

Seed1.5-VL - 字节跳动Seed推出的视觉语言多模态大模型

Co-Sight - 中兴通讯开源的超级智能体项目

MCPHub - 一站式MCP服务器聚合平台

HealthBench - OpenAI推出的开源医疗测试基准

Seedance 1.0 lite - 火山引擎推出的视频生成模型

Nexus-Gen - 魔搭联合华东师范等机构开源的全模态图像生成模型

StreamBridge - 苹果联合复旦推出的端侧视频大语言模型框架

Step1X-3D - 阶跃星辰联合LightIllusions开源的3D资产生成框架

OpenVision - 加州大学开源的视觉编码器家族

FLUX-Text - 阿里推出的多语言场景文本编辑框架

MCA-Ctrl - 中科院和中科大推出的图像定制生成框架

AgentCPM-GUI - 清华联合面壁智能开源的端侧GUI智能体模型

AG-UI - AI Agent与前端应用交互的开源协议