AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

AnimateAnything是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateAnything能精确操作视频，包括控制相机轨迹、文本提示和用户动作注...

AI Projects12/18/2025

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段，实现对图像中各个区域的精确控制和细节优化。RAG-Diff...

AI Projects12/18/2025

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

FitDiT是高保真虚拟试穿技术，是腾讯和复旦大学联合推出的。基于Diffusion Transformers（DiT）关注高分辨率特征，提升服装细节的呈现。FitDiT用服装纹理提取...

AI Projects12/18/2025

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

Documind是开源的AI文档处理工具，能从PDF文档中提取结构化数据。Documind具备将PDF转换为图像、用OpenAI API进行信息提取，根据用户定义的模式格式化输出结...

AI Projects12/18/2025

MARS - 字节推出优化大模型训练效率的框架

MARS（Make vAriance Reduction Shine）是字节跳动推出的创新的优化框架，提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术，基于缩放随机递归...

AI Projects12/18/2025

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

Verifier Engineering（验证器工程）是中国科学院、阿里巴巴和小红书联合推出的新型后训练范式，为基础模型设计，解决提供有效监督信号的挑战。Verifier Engi...

AI Projects12/18/2025

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

XiYan-SQL是阿里巴巴推出的自然语言到SQL（NL2SQL）框架，基于多生成器集成策略，结合提示工程和监督微调，提升SQL查询生成质量。XiYan-SQL引入M-Schema半结...

AI Projects12/18/2025

KuaiFormer - 快手推出的检索框架，基于Transformer

KuaiFormer是快手技术团队推出的基于Transformer的检索框架，用在大规模内容推荐系统。基于重新定义检索流程，从传统的分数估计任务转变为Transformer驱动的“...

AI Projects12/18/2025

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

EyeDiff是文本到图像的扩散模型，基于自然语言提示生成多模态眼科图像，提高常见和罕见眼病的诊断准确性。模型在多个大规模数据集上训练，能准确捕捉关键病变...

AI Projects12/18/2025

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法，支持高效部署多模态大型语言模型（MLLM）至移动设备。模型以小尺寸（2.7B语...

AI Projects12/18/2025

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。框架基于构建长链的思维（CoT）...

AI Projects12/18/2025

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

DeepSeek-R1-Lite是DeepSeek推出的推理模型预览版，DeepSeek-R1-Lite用强化学习训练，具备长思维链推理能力，能实时展示推理思考过程，性能在多个基准测试中...

AI Projects12/18/2025

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型，能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和图像等多种数据类型。Sa...

AI Projects12/18/2025

AlphaQubit - 谷歌推出的量子错误解码器

AlphaQubit是谷歌推出基于AI技术的量子错误解码器，用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别，助力量子计算机...

AI Projects12/18/2025

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的，计算机辅助设计（CAD）模型生成系统，根据用户的多种输入（如文本描述、图像、...

AI Projects12/18/2025

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

LaTRO（Latent Reasoning Optimization）是先进的框架，提升大型语言模型（LLMs）在复杂推理任务中的表现。基于将推理过程类比为从潜在分布中采样，用变分推...

AI Projects12/18/2025

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

ReCapture是谷歌和新加坡国立大学推出的视频处理技术，能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCapture用多视图扩散模型或基于深度的点云渲...

AI Projects12/18/2025

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

MagicClay 是 Adobe 推出3D建模工具，结合网格和有向距离场（SDF）技术，支持艺术家基于文本提示对3D模型的特定部分进行雕刻，同时保持模型的其他区域不变。M...

AI Projects12/18/2025

StableV2V - 中国科技大学开源的视频编辑项目

StableV2V是中国科技大学推出的开源视频编辑项目，基于文本、草图、图片等输入实现视频中物体的精准编辑和替换。项目用形状一致的编辑范式，基于三个主要组件...

AI Projects12/18/2025

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

Halo是开源的DIY健康追踪项目，基于低成本的智能戒指和开源软件，让用户构建自己的私人健康监测应用。Halo支持活动追踪、心率监测、睡眠分析等功能，且完全尊...

AI Projects12/18/2025

JoyVASA - 京东健康开源的音频驱动的数字人头项目

JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目，基于扩散模型技术，根据音频信号生成与音频同步的面部动态和头部运动。JoyVASA能实现人物的唇形同...

AI Projects12/18/2025

TIP-I2V - 超170万大规模真实文本和图像提示数据集

TIP-I2V是大规模真实文本和图像提示数据集，用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示，及五种SOTA图生视频模型生成的相应视频...

AI Projects12/18/2025

FLUX Tools - 黑森林实验室推出的模型工具套组

FLUX Tools是黑森林实验室推出的一套模型工具，能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX Tools包括FLUX.1 Fill（图像修复和扩展）、FLUX.1 D...

AI Projects12/18/2025

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性，...

←1...54 55 56 57 58 59 60...137 →

AI News

AI Projects12/18/2025

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

AI Projects12/18/2025

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

AI Projects12/18/2025

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

AI Projects12/18/2025

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

AI Projects12/18/2025

MARS - 字节推出优化大模型训练效率的框架

AI Projects12/18/2025

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

AI Projects12/18/2025

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

AI Projects12/18/2025

KuaiFormer - 快手推出的检索框架，基于Transformer

AI Projects12/18/2025

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

AI Projects12/18/2025

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

AI Projects12/18/2025

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

AI Projects12/18/2025

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

AI Projects12/18/2025

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

AI Projects12/18/2025

AlphaQubit - 谷歌推出的量子错误解码器

AI Projects12/18/2025

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

AI Projects12/18/2025

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

AI Projects12/18/2025

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

AI Projects12/18/2025

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

AI Projects12/18/2025

StableV2V - 中国科技大学开源的视频编辑项目

AI Projects12/18/2025

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

AI Projects12/18/2025

JoyVASA - 京东健康开源的音频驱动的数字人头项目

AI Projects12/18/2025

TIP-I2V - 超170万大规模真实文本和图像提示数据集

AI Projects12/18/2025

FLUX Tools - 黑森林实验室推出的模型工具套组

AI Projects12/18/2025

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性，...

All Categories

AI News

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

MARS - 字节推出优化大模型训练效率的框架

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

KuaiFormer - 快手推出的检索框架，基于Transformer

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

AlphaQubit - 谷歌推出的量子错误解码器

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

StableV2V - 中国科技大学开源的视频编辑项目

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

JoyVASA - 京东健康开源的音频驱动的数字人头项目

TIP-I2V - 超170万大规模真实文本和图像提示数据集

FLUX Tools - 黑森林实验室推出的模型工具套组

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

AI News

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

MARS - 字节推出优化大模型训练效率的框架

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

KuaiFormer - 快手推出的检索框架，基于Transformer

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

AlphaQubit - 谷歌推出的量子错误解码器

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

StableV2V - 中国科技大学开源的视频编辑项目

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

JoyVASA - 京东健康开源的音频驱动的数字人头项目

TIP-I2V - 超170万大规模真实文本和图像提示数据集

FLUX Tools - 黑森林实验室推出的模型工具套组

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术