AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Open Code Reasoning - 英伟达开源的代码推理AI模型

Open Code Reasoning（OCR）是英伟达开源的代码推理AI模型，基于Nemotron架构，专为提升代码推理和生成能力设计。OCR包含32B、14B和7B三种模型版本，分别适用...

AI Projects12/18/2025

KuaiMod - 快手推出的自动化短视频质量判别框架

KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架，能高效识别和过滤有害及低质量内容。框架借鉴普通法（Common Law）体系，基于案例驱动的方式动...

AI Projects12/18/2025

VITA-Audio - 开源的端到端多模态语音大模型，低延迟、推理快

VITA-Audio 是开源的端到端多模态语音大模型，具有低延迟、推理速度快的特点。通过轻量级的多模态交叉标记预测（MCTP）模块，可在首次前向传播中生成音频输出...

AI Projects12/18/2025

Parakeet TDT 0.6B - 英伟达开源的自动语音识别模型

Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别（ASR）模型。采用FastConformer编码器和TDT解码器架构，通过预测文本标记及其持续时间加速推理，减少计算...

AI Projects12/18/2025

FunGPT - 开源AI情感调节项目，基于InternLM2.5系列模型

FunGPT 是基于 InternLM2.5 系列大模型开发的开源项目，专为情感调节设计。具备两大核心功能：甜言蜜语模式和犀利怼语模式。甜言蜜语模式能用温暖的话语和独...

AI Projects12/18/2025

DMind - 专为Web3领域优化的大模型

DMind是DMind研究机构发布的专为Web3领域优化的大型语言模型。针对区块链、去中心化金融和智能合约等场景深度优化，使用Web3数据微调采用RLHF技术对齐。

AI Projects12/18/2025

Dolphin - 字节跳动开源的文档解析大模型

Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法，第一阶段生成文档布局元素序列，第二阶段用元素作为锚点并...

AI Projects12/18/2025

Playwright MCP - 微软推出的AI浏览器自动化工具

Playwright MCP 是微软推出的轻量级浏览器自动化工具，基于 Model Context Protocol (MCP) 协议。工具基于 Playwright 的可访问性树实现与网页的交互，无需依...

AI Projects12/18/2025

RelightVid - 上海 AI Lab联合复旦等高校推出的视频重照明模型

RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型，支持根据文本提示、背景视...

AI Projects12/18/2025

HRAvatar - 清华联合IDEA推出的单目视频生成3D头像技术

HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术，支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术，基...

AI Projects12/18/2025

Pocket Flow - 开源的轻量级AI应用开发框架，仅用100行代码实现

Pocket Flow 是极简的 LLM（大型语言模型）框架，仅用 100 行代码实现，具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强...

AI Projects12/18/2025

Aurora - 微软推出的大气基础模型

Aurora是微软研究院推出的13亿参数的大气基础模型，基于从海量大气数据中提取有价值信息，用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训...

AI Projects12/18/2025

DeepWiki MCP - Cognition Labs推出的MCP服务工具

DeepWiki MCP 是Cognition Labs推出的远程服务器，基于开放标准的 Model Context Protocol（MCP）。DeepWiki MCP为 AI 应用提供访问和搜索 GitHub 代码库文档...

AI Projects12/18/2025

Gemini Diffusion - 谷歌推出的文本扩散模型

Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同，基于逐步细化噪声生成输出，能快速迭代纠正错误，让Gemini Diffusion...

AI Projects12/18/2025

3DTown - 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架

3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术，将输入图像分解为重叠区域，...

AI Projects12/18/2025

Sparc3D - 南洋理工等机构推出的3D模型生成框架

Sparc3D是南洋理工大学联合Sensory Universe和帝国理工学院推出的用在高分辨率3D模型生成框架，解决传统3D生成方法中细节丢失和效率低下的问题。框架结合稀疏...

AI Projects12/18/2025

LeVo - 腾讯AI实验室推出的AI唱歌模型

LeVo是腾讯AI实验室推出的AI唱歌模型，具备强大的音色克隆能力，仅需3秒音频即可精准复制目标音色，包括音调、情感和韵律，无需大量训练数据。LeVo支持分轨生...

AI Projects12/18/2025

Hailuo 02 - MiniMax推出的全新AI视频生成模型，排名超越可灵和Veo 3

Hailuo 02 是 MiniMax 公司推出的全新AI视频生成模型，是Hailuo 01的升级版本。这个模型目前在图生视频、文生视频的榜单位于第二，超越快手的可灵以及谷歌的V...

AI Projects12/18/2025

OmniFlow - 松下联合加州大学推出的多模态AI模型

OmniFlow是松下与加州大学洛杉矶分校（UCLA）合作推出的多模态AI模型。模型能实现文本、图像和音频之间的任意到任意（Any-to-Any）生成任务，例如将文本转换...

AI Projects12/18/2025

Bright Data MCP - 基于MCP的实时网络数据抓取工具

Bright Data MCP 是强大的模型上下文协议（MCP）服务器，专为公共网络访问设计。Bright Data MCP能让大型语言模型（LLMs）、agents 和应用程序实时访问、发现...

AI Projects12/18/2025

SurveyForge - AI自动化学术综述生成框架

SurveyForge是上海AI Lab联合复旦大学、上海交通大学等机构推出的创新框架，用在自动化生成高质量学术综述。框架基于两阶段设计，大纲生成和内容生成。在大纲...

AI Projects12/18/2025

EmbodiedGen - 用于具身智能应用的生成式3D世界引擎

EmbodiedGen 是用于具身智能（Embodied AI）应用的生成式 3D 世界引擎和工具包。能快速生成高质量、低成本且物理属性合理的 3D 资产和交互环境，帮助研究人员...

AI Projects12/18/2025

EX-4D - 字节跳动Pico团队推出的4D视频生成框架

EX-4D是字节跳动（ByteDance）旗下Pico团队推出的新型4D视频生成框架，能从单目视频输入生成极端视角下的高质量4D视频。框架基于独特的深度防水网格（DW-Mesh...

AI Projects12/18/2025

LinGen - Meta联合普林斯顿大学推出的文本到视频生成框架

LinGen是普林斯顿大学和Meta共同推出的新型文本到视频生成框架。框架基于线性复杂度的MATE模块（包含MA-branch和TE-branch），替换传统Diffusion Transformer...

←1...115 116 117 118 119 120 121...137 →

AI News

AI Projects12/18/2025

All Categories

AI News

Open Code Reasoning - 英伟达开源的代码推理AI模型

KuaiMod - 快手推出的自动化短视频质量判别框架

VITA-Audio - 开源的端到端多模态语音大模型，低延迟、推理快

Parakeet TDT 0.6B - 英伟达开源的自动语音识别模型

FunGPT - 开源AI情感调节项目，基于InternLM2.5系列模型

DMind - 专为Web3领域优化的大模型

Dolphin - 字节跳动开源的文档解析大模型

Playwright MCP - 微软推出的AI浏览器自动化工具

RelightVid - 上海 AI Lab联合复旦等高校推出的视频重照明模型

HRAvatar - 清华联合IDEA推出的单目视频生成3D头像技术

Pocket Flow - 开源的轻量级AI应用开发框架，仅用100行代码实现

Aurora - 微软推出的大气基础模型

DeepWiki MCP - Cognition Labs推出的MCP服务工具

Gemini Diffusion - 谷歌推出的文本扩散模型

3DTown - 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架

Sparc3D - 南洋理工等机构推出的3D模型生成框架

LeVo - 腾讯AI实验室推出的AI唱歌模型

Hailuo 02 - MiniMax推出的全新AI视频生成模型，排名超越可灵和Veo 3

OmniFlow - 松下联合加州大学推出的多模态AI模型

Bright Data MCP - 基于MCP的实时网络数据抓取工具

SurveyForge - AI自动化学术综述生成框架

EmbodiedGen - 用于具身智能应用的生成式3D世界引擎

EX-4D - 字节跳动Pico团队推出的4D视频生成框架

LinGen - Meta联合普林斯顿大学推出的文本到视频生成框架

AI News

Open Code Reasoning - 英伟达开源的代码推理AI模型

KuaiMod - 快手推出的自动化短视频质量判别框架

VITA-Audio - 开源的端到端多模态语音大模型，低延迟、推理快

Parakeet TDT 0.6B - 英伟达开源的自动语音识别模型

FunGPT - 开源AI情感调节项目，基于InternLM2.5系列模型

DMind - 专为Web3领域优化的大模型

Dolphin - 字节跳动开源的文档解析大模型

Playwright MCP - 微软推出的AI浏览器自动化工具

RelightVid - 上海 AI Lab联合复旦等高校推出的视频重照明模型

HRAvatar - 清华联合IDEA推出的单目视频生成3D头像技术

Pocket Flow - 开源的轻量级AI应用开发框架，仅用100行代码实现

Aurora - 微软推出的大气基础模型

DeepWiki MCP - Cognition Labs推出的MCP服务工具

Gemini Diffusion - 谷歌推出的文本扩散模型

3DTown - 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架

Sparc3D - 南洋理工等机构推出的3D模型生成框架

LeVo - 腾讯AI实验室推出的AI唱歌模型

Hailuo 02 - MiniMax推出的全新AI视频生成模型，排名超越可灵和Veo 3

OmniFlow - 松下联合加州大学推出的多模态AI模型

Bright Data MCP - 基于MCP的实时网络数据抓取工具

SurveyForge - AI自动化学术综述生成框架

EmbodiedGen - 用于具身智能应用的生成式3D世界引擎

EX-4D - 字节跳动Pico团队推出的4D视频生成框架

LinGen - Meta联合普林斯顿大学推出的文本到视频生成框架