AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

AnyStory - 阿里通义推出的高保真个性化文本到图像生成框架

AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架，实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编...

AIプロジェクト2025/12/18

SHMT - 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SHMT（Self-supervised Hierarchical Makeup Transfer）是阿里巴巴达摩院与武汉理工大学等机构联合研发的先进自监督化妆转移技术。技术通过潜在扩散模型实现...

AIプロジェクト2025/12/18

SmartEraser - 中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术，专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”（Masked-Re...

AIプロジェクト2025/12/18

Zerox - 开源的OCR工具，零样本识别多种格式文件

Zerox是开源的本地化高精度OCR工具，基于GPT-4o-mini模型，无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件，擅长处理扫描版文档及复杂...

AIプロジェクト2025/12/18

Video Alchemist - AI视频生成模型，具备多主体开放集合个性化能力

Video Alchemist是Snap公司等推出的新型视频生成模型，具备多主体、开放集合个性化能力，能根据文本提示和参考图像生成视频，无需在测试时进行优化。模型基于...

AIプロジェクト2025/12/18

PSHuman - 开源的单图像3D人像重建技术，仅需一张照片

PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型，仅需一张照片，能生成高度逼真的3D人像模型，包括精细的面部表情和全身姿态。核心优势在于...

AIプロジェクト2025/12/18

Wear-Any-Way - 阿里拍立淘团队推出自由定制的虚拟试穿框架

Wear-Any-Way是阿里巴巴拍立淘团队推出的创新的虚拟试穿框架。通过稀疏对应对齐机制，实现了高保真度且可定制的虚拟试穿效果。用户可以生成逼真的试穿图像，...

AIプロジェクト2025/12/18

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

GameFactory 是香港大学和快手科技联合提出的创新框架，解决游戏视频生成中的场景泛化难题。框架基于预训练的视频扩散模型，结合开放域视频数据和小规模高质...

AIプロジェクト2025/12/18

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

Step-2 mini 是阶跃星辰推出的轻量级极速大模型，基于新一代自研 Attention 架构 MFA 开发。仅用 3% 的参数量就保留了 Step-2 超过 80% 的性能，显著提升了生...

AIプロジェクト2025/12/18

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

FramePainter 是基于 AI 的交互式图像编辑工具，通过结合视频扩散模型和直观的草图控制，让用户能通过简单的绘制、点击或拖动操作来指示编辑意图，实现对图像...

AIプロジェクト2025/12/18

百聆 - AI语音对话助手，端到端时延低至800ms

百聆(Bailing)是开源的语音对话助手，基于语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术实现与用户的自然语音对话，实现类...

AIプロジェクト2025/12/18

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的，无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征转移到详细的设计图纸上，辅助设...

AIプロジェクト2025/12/18

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术，通过模拟不同光照条件下的合成数据进行训练，能将人像照片重新渲染为具有...

AIプロジェクト2025/12/18

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

X-Dyna 是基于扩散模型的动画生成框架，基于驱动视频中的面部表情和身体动作，将单张人类图像动画化，生成具有真实感和环境感知能力的动态效果。核心是 Dynam...

AIプロジェクト2025/12/18

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型，对标OpenAI的o1正式版。DeepSeek-R1推理模型通过大规模强化学习技术进行后训练，仅需极少...

AIプロジェクト2025/12/18

k1.5 - Kimi推出的多模态思考模型

k1.5 是月之暗面科技推出的最新多模态思考模型，具备强大的推理和多模态处理能力。模型在 short-CoT（短链思维）模式下，数学、代码、视觉多模态和通用能力大...

AIプロジェクト2025/12/18

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架，通过模拟人类的迭代扩展和反思过程，突破大型语言模型在机器写作中的知识边界。框架...

AIプロジェクト2025/12/18

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数，是在专有数据集上训练的，数据集包含从4000个临床实践的500...

AIプロジェクト2025/12/18

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

Roop-Unleashed 是基于 Roop 的开源项目，专注于深度伪造（Deepfake）技术的实现与优化。用户无需进行复杂的训练过程，可快速实现图像和视频中的面部替换。通...

AIプロジェクト2025/12/18

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法，核心为浦像HDR（UltraFusion HDR）。算法结合了AIGC技术和HDR技术...

AIプロジェクト2025/12/18

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习（RL）训练的推理模型，未使用任何监督微调（SFT）数据。在推理任务上表现出色，在 AIME 2024 数...

AIプロジェクト2025/12/18

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目，探索深度生成模型是否能仅通过未标注的视频数据学习复杂的知识，包括规则、...

AIプロジェクト2025/12/18

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉任务，具备强大的图像识别、感知、推理和指令跟随能力，...

AIプロジェクト2025/12/18

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架

3DIS-FLUX是基于深度学习的多实例生成框架，通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构建和FLUX模型的扩散变换器架构，分为两阶段...

←1...73 74 75 76 77 78 79...137 →

AIニュース

AIプロジェクト2025/12/18

AnyStory - 阿里通义推出的高保真个性化文本到图像生成框架

AIプロジェクト2025/12/18

SHMT - 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SHMT（Self-supervised Hierarchical Makeup Transfer）是阿里巴巴达摩院与武汉理工大学等机构联合研发的先进自监督化妆转移技术。技术通过潜在扩散模型实现...

AIプロジェクト2025/12/18

SmartEraser - 中科大与微软亚洲研究院推出的图像对象移除技术

AIプロジェクト2025/12/18

Zerox - 开源的OCR工具，零样本识别多种格式文件

AIプロジェクト2025/12/18

Video Alchemist - AI视频生成模型，具备多主体开放集合个性化能力

AIプロジェクト2025/12/18

PSHuman - 开源的单图像3D人像重建技术，仅需一张照片

AIプロジェクト2025/12/18

Wear-Any-Way - 阿里拍立淘团队推出自由定制的虚拟试穿框架

AIプロジェクト2025/12/18

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

AIプロジェクト2025/12/18

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

AIプロジェクト2025/12/18

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

AIプロジェクト2025/12/18

百聆 - AI语音对话助手，端到端时延低至800ms

AIプロジェクト2025/12/18

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

AIプロジェクト2025/12/18

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

AIプロジェクト2025/12/18

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

AIプロジェクト2025/12/18

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

AIプロジェクト2025/12/18

k1.5 - Kimi推出的多模态思考模型

AIプロジェクト2025/12/18

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

AIプロジェクト2025/12/18

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

AIプロジェクト2025/12/18

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

AIプロジェクト2025/12/18

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

AIプロジェクト2025/12/18

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

AIプロジェクト2025/12/18

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

AIプロジェクト2025/12/18

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

AnyStory - 阿里通义推出的高保真个性化文本到图像生成框架

SHMT - 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SmartEraser - 中科大与微软亚洲研究院推出的图像对象移除技术

Zerox - 开源的OCR工具，零样本识别多种格式文件

Video Alchemist - AI视频生成模型，具备多主体开放集合个性化能力

PSHuman - 开源的单图像3D人像重建技术，仅需一张照片

Wear-Any-Way - 阿里拍立淘团队推出自由定制的虚拟试穿框架

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

百聆 - AI语音对话助手，端到端时延低至800ms

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

k1.5 - Kimi推出的多模态思考模型

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架

AIニュース

AnyStory - 阿里通义推出的高保真个性化文本到图像生成框架

SHMT - 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SmartEraser - 中科大与微软亚洲研究院推出的图像对象移除技术

Zerox - 开源的OCR工具，零样本识别多种格式文件

Video Alchemist - AI视频生成模型，具备多主体开放集合个性化能力

PSHuman - 开源的单图像3D人像重建技术，仅需一张照片

Wear-Any-Way - 阿里拍立淘团队推出自由定制的虚拟试穿框架

GameFactory - 香港大学和快手联合推出的可泛化游戏场景框架

Step-2 mini - 阶跃星辰推出的轻量级极速大模型

FramePainter - 哈工大联合华为诺亚推出的交互式图像编辑AI工具

百聆 - AI语音对话助手，端到端时延低至800ms

LineArt - 吉林大学等机构推出的设计绘图外观迁移框架

SynthLight - 耶鲁大学联合 Adobe 推出的人像重照明技术

X-Dyna - 字节联合斯坦福等高校推出的动画生成框架

DeepSeek-R1 - DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

k1.5 - Kimi推出的多模态思考模型

OmniThink - 浙大联合阿里通义实验室推出的深度思考机器写作框架

H-Optimus-0 - 法国初创公司Bioptimus开源的病理学AI基础模型

Roop-Unleashed - AI换脸工具，支持批量换脸、VR换脸、直播换脸

书生·浦像 - 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

DeepSeek R1-Zero - DeepSeek推出的开源推理模型，基于纯强化学习训练

VideoWorld - 字节联合交大等机构推出的自回归视频生成模型

Step-1o Vision - 阶跃星辰推出的原生端到端视觉理解模型

3DIS-FLUX - 浙大联合哈佛推出的多实例生成框架