AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

OWL - 开源多智能体协作系统，动态交互实现任务自动化

OWL（Optimized Workforce Learning）是基于CAMEL-AI框架开发的多智能体协作系统，通过智能体之间的动态交互实现高效的任务自动化。通过角色分配和任务分解，...

AI Projects12/18/2025

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

AI Projects12/18/2025

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型，基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存...

AI Projects12/18/2025

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型（dLLM），是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...

AI Projects12/18/2025

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

GCDance（Genre-Controlled 3D Full Body Dance Generation Driven by Music）是英国萨里大学和江南大学推出的3D舞蹈生成框架，能根据音乐和文本提示生成符合...

AI Projects12/18/2025

LaWGPT - 南京大学推出的中文法律大语言模型

LaWGPT 是南京大学推出的中文法律大语言模型，基于 LLaMA 模型进行二次预训练，融入大量中文法律知识。专注于法律领域，能理解和生成与法律相关的文本，适用...

AI Projects12/18/2025

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

autoMate是基于AI和RPA的本地自动化工具，用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型，用户无需编程知识，用自然语言描述任务，能完成计...

AI Projects12/18/2025

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

URO-Bench 是面向端到端语音对话模型（SDMs）的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务，全面评估语音对话模型的性能。

AI Projects12/18/2025

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

Nanobrowser 是开源的 Chrome 扩展工具，专注于 AI 驱动的网页自动化。Nanobrowser基于多智能体系统实现复杂的网页任务，如信息提取、自动化操作等。用户用自...

AI Projects12/18/2025

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

DINO-XSeek 是 IDEA 研究院推出的多模态目标检测模型，结合视觉感知和自然语言理解能力。DINO-XSeek基于复杂的语言描述精准定位图像中的目标，识别目标的属性...

AI Projects12/18/2025

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

AppAgentX 是西湖大学推出的新型自我进化式 GUI（图形用户界面）代理框架，基于从执行历史中抽象出高级动作提升代理在智能手机交互中的效率和智能性。AppAgen...

AI Projects12/18/2025

GO-1 - 智元机器人推出的首个通用具身基座模型

GO-1（Genie Operator-1，智元启元大模型）是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action（ViLLA）架构，由VLM（多模态大...

AI Projects12/18/2025

Gemini Embedding - 谷歌推出的文本嵌入模型

Gemini Embedding 是 Google 推出的先进的文本嵌入模型，基于将文本转化为高维数值向量，捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练，具...

AI Projects12/18/2025

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型，通过两个多模态循环（text-to-image-to-text 和 image-to-text-to-image）实现不同...

AI Projects12/18/2025

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性，如无法同时生成多个不同姿态...

AI Projects12/18/2025

Heygem - 硅基智能推出的开源数字人模型

Heygem 是硅基智能推出的开源数字人模型，专为 Windows 系统设计。基于先进的AI技术，仅需 1 秒视频或 1 张照片，能在 30 秒内完成数字人形象和声音克隆，在 ...

AI Projects12/18/2025

LanDiff - 浙大联合月之暗面推出的文本到视频生成混合框架

LanDiff是用于高质量的文本到视频（T2V）生成的创新混合框架，结合了自回归语言模型（LLM）和扩散模型（Diffusion Model）的优势，通过粗到细的生成方式，有...

AI Projects12/18/2025

FoxBrain - 鸿海研究院推出的推理大语言模型

FoxBrain 是鸿海研究院推出的繁体中文大型语言模型（LLM），具有强大的推理能力。基于 Meta Llama 3.1 架构，拥有 70B 参数，专注于数学和逻辑推理领域。FoxB...

AI Projects12/18/2025

COMET - 字节开源的通信优化系统

COMET是字节跳动推出的针对Mixture-of-Experts（MoE）模型的优化系统，能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术，COMET将通信...

AI Projects12/18/2025

VideoPainter - 港中文联合腾讯等机构推出的视频修复和编辑框架

VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架，专门用在处理任意长度的视频内容。VideoPainter基于双分支...

AI Projects12/18/2025

TrajectoryCrafter - 腾讯和港中文推出的单目视频自由运镜技术

TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的，用在单目视频的相机轨迹重定向方法，支持在后期自由调整视频的相机位置和角度，轻松改变视频中的...

AI Projects12/18/2025

LanPaint - 零训练 AI 图像修复工具

LanPaint 是为Stable Diffusion 模型设计的高质量图像修复工具，无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果，支持无缝且...

AI Projects12/18/2025

START - 阿里联合中科大推出的自学推理模型

START（Self-Taught Reasoner with Tools）是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型，结合外部工具（如Python代码执行器）提升大型语...

AI Projects12/18/2025

SeedFoley - 字节推出的端到端视频音效生成模型

SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型，为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型，实现音效与...

←1...87 88 89 90 91 92 93...137 →

AI News

AI Projects12/18/2025

OWL - 开源多智能体协作系统，动态交互实现任务自动化

AI Projects12/18/2025

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

AI Projects12/18/2025

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

AI Projects12/18/2025

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型（dLLM），是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...

AI Projects12/18/2025

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

GCDance（Genre-Controlled 3D Full Body Dance Generation Driven by Music）是英国萨里大学和江南大学推出的3D舞蹈生成框架，能根据音乐和文本提示生成符合...

AI Projects12/18/2025

LaWGPT - 南京大学推出的中文法律大语言模型

AI Projects12/18/2025

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

AI Projects12/18/2025

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

URO-Bench 是面向端到端语音对话模型（SDMs）的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务，全面评估语音对话模型的性能。

AI Projects12/18/2025

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

AI Projects12/18/2025

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

AI Projects12/18/2025

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

AI Projects12/18/2025

GO-1 - 智元机器人推出的首个通用具身基座模型

GO-1（Genie Operator-1，智元启元大模型）是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action（ViLLA）架构，由VLM（多模态大...

AI Projects12/18/2025

Gemini Embedding - 谷歌推出的文本嵌入模型

Gemini Embedding 是 Google 推出的先进的文本嵌入模型，基于将文本转化为高维数值向量，捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练，具...

AI Projects12/18/2025

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型，通过两个多模态循环（text-to-image-to-text 和 image-to-text-to-image）实现不同...

AI Projects12/18/2025

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

AI Projects12/18/2025

Heygem - 硅基智能推出的开源数字人模型

AI Projects12/18/2025

LanDiff - 浙大联合月之暗面推出的文本到视频生成混合框架

AI Projects12/18/2025

FoxBrain - 鸿海研究院推出的推理大语言模型

AI Projects12/18/2025

COMET - 字节开源的通信优化系统

AI Projects12/18/2025

VideoPainter - 港中文联合腾讯等机构推出的视频修复和编辑框架

AI Projects12/18/2025

TrajectoryCrafter - 腾讯和港中文推出的单目视频自由运镜技术

AI Projects12/18/2025

LanPaint - 零训练 AI 图像修复工具

AI Projects12/18/2025

START - 阿里联合中科大推出的自学推理模型

AI Projects12/18/2025

All Categories

AI News

OWL - 开源多智能体协作系统，动态交互实现任务自动化

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

LaWGPT - 南京大学推出的中文法律大语言模型

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

GO-1 - 智元机器人推出的首个通用具身基座模型

Gemini Embedding - 谷歌推出的文本嵌入模型

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

Heygem - 硅基智能推出的开源数字人模型

LanDiff - 浙大联合月之暗面推出的文本到视频生成混合框架

FoxBrain - 鸿海研究院推出的推理大语言模型

COMET - 字节开源的通信优化系统

VideoPainter - 港中文联合腾讯等机构推出的视频修复和编辑框架

TrajectoryCrafter - 腾讯和港中文推出的单目视频自由运镜技术

LanPaint - 零训练 AI 图像修复工具

START - 阿里联合中科大推出的自学推理模型

SeedFoley - 字节推出的端到端视频音效生成模型

AI News

OWL - 开源多智能体协作系统，动态交互实现任务自动化

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

LaWGPT - 南京大学推出的中文法律大语言模型

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

GO-1 - 智元机器人推出的首个通用具身基座模型

Gemini Embedding - 谷歌推出的文本嵌入模型

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

Heygem - 硅基智能推出的开源数字人模型

LanDiff - 浙大联合月之暗面推出的文本到视频生成混合框架

FoxBrain - 鸿海研究院推出的推理大语言模型

COMET - 字节开源的通信优化系统

VideoPainter - 港中文联合腾讯等机构推出的视频修复和编辑框架

TrajectoryCrafter - 腾讯和港中文推出的单目视频自由运镜技术

LanPaint - 零训练 AI 图像修复工具

START - 阿里联合中科大推出的自学推理模型

SeedFoley - 字节推出的端到端视频音效生成模型