AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

GameFactory 是香港大学和快手科技联合提出的创新框架，解决游戏视频生成中的场景泛化难题。框架基于预训练的视频扩散模型，结合开放域视频数据和小规模高质...

AI Projects12/18/2025

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

Step-2 mini 是阶跃星辰推出的轻量级极速大模型，基于新一代自研 Attention 架构 MFA 开发。仅用 3% 的参数量就保留了 Step-2 超过 80% 的性能，显著提升了生...

AI Projects12/18/2025

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

FramePainter 是基于 AI 的交互式图像编辑工具，通过结合视频扩散模型和直观的草图控制，让用户能通过简单的绘制、点击或拖动操作来指示编辑意图，实现对图像...

AI Projects12/18/2025

百聆 - AI语音对话助手，端到端时延低至800ms

百聆(Bailing)是开源的语音对话助手，基于语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术实现与用户的自然语音对话，实现类...

AI Projects12/18/2025

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的，无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征转移到详细的设计图纸上，辅助设...

AI Projects12/18/2025

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术，通过模拟不同光照条件下的合成数据进行训练，能将人像照片重新渲染为具有...

AI Projects12/18/2025

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

X-Dyna 是基于扩散模型的动画生成框架，基于驱动视频中的面部表情和身体动作，将单张人类图像动画化，生成具有真实感和环境感知能力的动态效果。核心是 Dynam...

AI Projects12/18/2025

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型，对标OpenAI的o1正式版。DeepSeek-R1推理模型通过大规模强化学习技术进行后训练，仅需极少...

AI Projects12/18/2025

k1.5 - Kimi推出的多模态思考模型

k1.5 是月之暗面科技推出的最新多模态思考模型，具备强大的推理和多模态处理能力。模型在 short-CoT（短链思维）模式下，数学、代码、视觉多模态和通用能力大...

AI Projects12/18/2025

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架，通过模拟人类的迭代扩展和反思过程，突破大型语言模型在机器写作中的知识边界。框架...

AI Projects12/18/2025

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数，是在专有数据集上训练的，数据集包含从4000个临床实践的500...

AI Projects12/18/2025

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

Roop-Unleashed 是基于 Roop 的开源项目，专注于深度伪造（Deepfake）技术的实现与优化。用户无需进行复杂的训练过程，可快速实现图像和视频中的面部替换。通...

AI Projects12/18/2025

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法，核心为浦像HDR（UltraFusion HDR）。算法结合了AIGC技术和HDR技术...

AI Projects12/18/2025

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习（RL）训练的推理模型，未使用任何监督微调（SFT）数据。在推理任务上表现出色，在 AIME 2024 数...

AI Projects12/18/2025

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目，探索深度生成模型是否能仅通过未标注的视频数据学习复杂的知识，包括规则、...

AI Projects12/18/2025

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉任务，具备强大的图像识别、感知、推理和指令跟随能力，...

AI Projects12/18/2025

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架

3DIS-FLUX是基于深度学习的多实例生成框架，通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构建和FLUX模型的扩散变换器架构，分为两阶段...

AI Projects12/18/2025

DITTO-2 - Adobe 联合加大推出的音乐生成模型

DITTO-2 是 Adobe 和加州大学研究人员联合推出的新型音乐生成模型，通过优化扩散模型的推理时间，实现快速且可控的音乐生成。模型基于扩散模型的推理时间优化...

AI Projects12/18/2025

DiffEditor - 北大联合腾讯推出的细粒度图像编辑工具

DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型（Diffusion Model）的图像编辑工具，通过引入图像提示（image prompts）和文本提示...

AI Projects12/18/2025

Textoon - 阿里通义实验室推出的文本提示生成2D卡通人物工具

Textoon 是阿里巴巴集团通义实验室推出的创新项目，首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型，能在一分钟内生成多样化...

AI Projects12/18/2025

子曰-o1 - 网易有道推出国内首个输出分步式讲解的推理模型

子曰-o1是网易有道发布的国内首个输出分步式讲解的推理模型。模型采用14B轻量级架构，专为消费级显卡设计，能在低显存设备上稳定运行。通过思维链技术，模拟...

AI Projects12/18/2025

豆包大模型1.5 - 字节跳动推出的最新版大模型

豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构，等效于7倍激活参数的Dense模型性能，综合得分在知识、代码、推理、中文等多个测评基...

AI Projects12/18/2025

OmniManip - 智元机器人联合北大推出的通用机器人操作框架

OmniManip 是北京大学与智元机器人联合实验室开发的通用机器人操作框架，通过结合视觉语言模型（VLM）的高层次推理能力和精确的三维操作能力，实现机器人在非...

AI Projects12/18/2025

WebWalker - 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具

WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型（LLMs）在网页浏览任务中性能的工具。通过模拟网页导航任务，帮助模型更好地处理长上...

←1...73 74 75 76 77 78 79...137 →

AI News

AI Projects12/18/2025

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

AI Projects12/18/2025

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

AI Projects12/18/2025

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

AI Projects12/18/2025

百聆 - AI语音对话助手，端到端时延低至800ms

AI Projects12/18/2025

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

AI Projects12/18/2025

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

AI Projects12/18/2025

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

AI Projects12/18/2025

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

AI Projects12/18/2025

k1.5 - Kimi推出的多模态思考模型

AI Projects12/18/2025

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

AI Projects12/18/2025

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

AI Projects12/18/2025

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

AI Projects12/18/2025

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

AI Projects12/18/2025

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

AI Projects12/18/2025

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

AI Projects12/18/2025

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

AI Projects12/18/2025

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架

AI Projects12/18/2025

DITTO-2 - Adobe 联合加大推出的音乐生成模型

AI Projects12/18/2025

DiffEditor - 北大联合腾讯推出的细粒度图像编辑工具

AI Projects12/18/2025

Textoon - 阿里通义实验室推出的文本提示生成2D卡通人物工具

AI Projects12/18/2025

子曰-o1 - 网易有道推出国内首个输出分步式讲解的推理模型

AI Projects12/18/2025

豆包大模型1.5 - 字节跳动推出的最新版大模型

AI Projects12/18/2025

OmniManip - 智元机器人联合北大推出的通用机器人操作框架

AI Projects12/18/2025

All Categories

AI News

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

百聆 - AI语音对话助手，端到端时延低至800ms

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

k1.5 - Kimi推出的多模态思考模型

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架

DITTO-2 - Adobe 联合加大推出的音乐生成模型

DiffEditor - 北大联合腾讯推出的细粒度图像编辑工具

Textoon - 阿里通义实验室推出的文本提示生成2D卡通人物工具

子曰-o1 - 网易有道推出国内首个输出分步式讲解的推理模型

豆包大模型1.5 - 字节跳动推出的最新版大模型

OmniManip - 智元机器人联合北大推出的通用机器人操作框架

WebWalker - 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具

AI News

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

百聆 - AI语音对话助手，端到端时延低至800ms

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

k1.5 - Kimi推出的多模态思考模型

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架

DITTO-2 - Adobe 联合加大推出的音乐生成模型

DiffEditor - 北大联合腾讯推出的细粒度图像编辑工具

Textoon - 阿里通义实验室推出的文本提示生成2D卡通人物工具

子曰-o1 - 网易有道推出国内首个输出分步式讲解的推理模型

豆包大模型1.5 - 字节跳动推出的最新版大模型

OmniManip - 智元机器人联合北大推出的通用机器人操作框架

WebWalker - 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具