AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

DreamFit - 字节联合清华和中山大学推出的虚拟试衣框架

DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架，专门用在轻量级服装为中心的人类图像生成。基于自适应注意力和L...

AIプロジェクト2025/12/18

Minion Agent - 开源的多功能 AI Agent 框架

Minion Agent是Agent框架，支持浏览器操作、MCP、自动规划和深度研究等功能。Minion Agent支持多种模型，基于灵活的配置选项满足不同需求。

AIプロジェクト2025/12/18

Being-M0 - 北大联合人民大学推出的人形机器人通用动作生成模型

Being-M0 是北京大学、中国人民大学等机构联合推出的首个大规模人形机器人通用动作生成模型。Being-M0 基于业界首个百万级动作数据集 MotionLib，用创新的 Mo...

AIプロジェクト2025/12/18

DanceGRPO - 字节Seed联合港大推出的统一视觉生成强化学习框架

DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域，覆盖两大生成范式（diffusion 和 rectified ...

AIプロジェクト2025/12/18

AlphaEvolve - 谷歌 DeepMind 推出的通用科学AI Agent

AlphaEvolve是谷歌DeepMind推出的通用科学Agent，基于结合大型语言模型（LLMs）的创造力和自动评估器来设计和优化高级算法。用Gemini Flash和Gemini Pro两种...

AIプロジェクト2025/12/18

WorldMem - 南洋理工联合北大和上海 AI Lab 推出的世界生成模型

WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制，解决传统世界生成模型在长时序下缺乏一致性的关键问题...

AIプロジェクト2025/12/18

GPDiT - 清华北大联合阶跃星辰等推出的视频生成模型

GPDiT（Generative Pre-trained Autoregressive Diffusion Transformer）是北京大学、清华大学、StepFun公司及中国科学技术大学推出的新型视频生成模型，模型...

AIプロジェクト2025/12/18

Skywork-VL Reward - Skywork AI开源的多模态奖励模型

Skywork-VL Reward是Skywork AI开源的多模态奖励模型，能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5-VL-7B-Instruct架构，基于添加奖励头结...

AIプロジェクト2025/12/18

ChatUI - 阿里推出的开源智能对话式 UI 组件库

ChatUI 是阿里团队推出的开源智能对话式 UI 组件库，能帮助开发者快速构建高质量的聊天应用，提供响应式设计、国际化、主题定制等功能。ChatUI 基于阿里巴巴 ...

AIプロジェクト2025/12/18

FaceShot - 同济大学联合上海 AI Lab等推出的肖像动画生成框架

FaceShot是同济大学、上海 AI Lab和南京理工大学推出的新型无需训练的肖像动画生成框架。用外观引导的地标匹配模块和基于坐标的地标重定位模块，为各种角色生...

AIプロジェクト2025/12/18

MT-Color - 上海交大联合哔哩哔哩推出的可控图像着色框架

MT-Color是上海交通大学联合哔哩哔哩推出的基于扩散模型的可控图像着色框架，基于用户提供的实例感知文本和掩码实现精确的实例级图像着色。框架基于像素级掩...

AIプロジェクト2025/12/18

Speech-02 - MiniMax 推出的新一代文本转语音模型

Speech-02 是 MiniMax 推出的新一代文本到语音（TTS）模型。模型基于回归 Transformer 架构，实现零样本语音克隆，仅需几秒参考语音能生成高度相似的目标语音...

AIプロジェクト2025/12/18

Stable Audio Open Small - Stability AI和Arm推出的文本到音频生成模型

Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型，参数量从11亿减少到3.41亿，生成速度...

AIプロジェクト2025/12/18

LBM - AI图像转换框架，实现可控阴影生成

LBM（Latent Bridge Matching）是Jasper Research团队推出的新型图像到图像转换框架，基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推理完...

AIプロジェクト2025/12/18

Sketch2Anim - 爱丁堡大学等机构推出的2D草图转3D动画框架

Sketch2Anim 是爱丁堡大学联合Snap Research、东北大学推出的自动化框架，能将2D草图故事板直接转换为高质量的3D动画。基于条件运动合成技术，用3D关键姿势、...

AIプロジェクト2025/12/18

SWE-1 - Windsurf推出的首个软件工程 AI 模型系列

SWE-1是Windsurf团队推出的首个软件工程 AI 模型系列，专为整个软件开发流程优化，涵盖代码生成、测试、调试、资料查找等开发环节，提升开发效率和用户体验。

AIプロジェクト2025/12/18

DICE-Talk - 复旦联合腾讯优图推出的情感化动态肖像生成框架

DICE-Talk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架，支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICE-Talk引入情感关...

AIプロジェクト2025/12/18

混元图像2.0 - 腾讯推出的实时AI图片生成大模型

混元图像2.0（Hunyuan Image 2.0）是腾讯推出的业内首个毫秒级响应的实时AI图片生成大模型。混元图像2.0支持文本、语音、草图等多种交互方式，用户输入指令后...

AIプロジェクト2025/12/18

OpenMemory MCP - 基于MCP协议的本地AI记忆共享工具

OpenMemory MCP 是mem0推出的基于开放模型上下文协议（MCP）构建的开源工具，能解决 AI 工具记忆痛点，实现不同工具间共享上下文信息。OpenMemory MCP支持 10...

AIプロジェクト2025/12/18

Toolkami - 开源 AI Agent 框架，七种核心工具支持运行

Toolkami 是极简的 AI Agent 框架，用七种工具支持运行，包括读(Read)、写(Write Diff)、浏览(Browse)、命令(Command)、提问(Ask)、思考(Think)。框架支持 T...

AIプロジェクト2025/12/18

Pemo - AI文档管理工具，支持一键翻译智能总结文献摘要

Pemo是AI驱动的文档管理工具。工具支持PDF、Epub、Word等多种格式文档的导入与管理，具备一键翻译、智能总结、思维导图生成等功能，帮助用户快速理解复杂文献...

AIプロジェクト2025/12/18

BLIP3-o - Salesforce Research等机构推出的多模态模型

BLIP3-o是Salesforce Research等机构推出的创新多模态模型，融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...

AIプロジェクト2025/12/18

ShotAdapter - Adobe联合UIUC推出的多镜头视频生成框架

ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架，基于微调预训练的文本到视频模型，引入过渡标记和局部注意力掩码策略，实现对多镜头视频...

AIプロジェクト2025/12/18

Index-AniSora - B站开源的动漫视频生成模型

Index-AniSora 是哔哩哔哩开源的先进动漫视频生成模型，模型支持一键生成多种动漫风格的视频，涵盖番剧片段、国创动画、VTuber 内容等。模型包含超过 1000 万...

←1...103 104 105 106 107 108 109...137 →

AIニュース

AIプロジェクト2025/12/18

DreamFit - 字节联合清华和中山大学推出的虚拟试衣框架

AIプロジェクト2025/12/18

Minion Agent - 开源的多功能 AI Agent 框架

Minion Agent是Agent框架，支持浏览器操作、MCP、自动规划和深度研究等功能。Minion Agent支持多种模型，基于灵活的配置选项满足不同需求。

AIプロジェクト2025/12/18

Being-M0 - 北大联合人民大学推出的人形机器人通用动作生成模型

AIプロジェクト2025/12/18

DanceGRPO - 字节Seed联合港大推出的统一视觉生成强化学习框架

AIプロジェクト2025/12/18

AlphaEvolve - 谷歌 DeepMind 推出的通用科学AI Agent

AlphaEvolve是谷歌DeepMind推出的通用科学Agent，基于结合大型语言模型（LLMs）的创造力和自动评估器来设计和优化高级算法。用Gemini Flash和Gemini Pro两种...

AIプロジェクト2025/12/18

WorldMem - 南洋理工联合北大和上海 AI Lab 推出的世界生成模型

AIプロジェクト2025/12/18

GPDiT - 清华北大联合阶跃星辰等推出的视频生成模型

GPDiT（Generative Pre-trained Autoregressive Diffusion Transformer）是北京大学、清华大学、StepFun公司及中国科学技术大学推出的新型视频生成模型，模型...

AIプロジェクト2025/12/18

Skywork-VL Reward - Skywork AI开源的多模态奖励模型

Skywork-VL Reward是Skywork AI开源的多模态奖励模型，能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5-VL-7B-Instruct架构，基于添加奖励头结...

AIプロジェクト2025/12/18

ChatUI - 阿里推出的开源智能对话式 UI 组件库

AIプロジェクト2025/12/18

FaceShot - 同济大学联合上海 AI Lab等推出的肖像动画生成框架

AIプロジェクト2025/12/18

MT-Color - 上海交大联合哔哩哔哩推出的可控图像着色框架

AIプロジェクト2025/12/18

Speech-02 - MiniMax 推出的新一代文本转语音模型

AIプロジェクト2025/12/18

Stable Audio Open Small - Stability AI和Arm推出的文本到音频生成模型

Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型，参数量从11亿减少到3.41亿，生成速度...

AIプロジェクト2025/12/18

LBM - AI图像转换框架，实现可控阴影生成

AIプロジェクト2025/12/18

Sketch2Anim - 爱丁堡大学等机构推出的2D草图转3D动画框架

AIプロジェクト2025/12/18

SWE-1 - Windsurf推出的首个软件工程 AI 模型系列

AIプロジェクト2025/12/18

DICE-Talk - 复旦联合腾讯优图推出的情感化动态肖像生成框架

AIプロジェクト2025/12/18

混元图像2.0 - 腾讯推出的实时AI图片生成大模型

AIプロジェクト2025/12/18

OpenMemory MCP - 基于MCP协议的本地AI记忆共享工具

AIプロジェクト2025/12/18

Toolkami - 开源 AI Agent 框架，七种核心工具支持运行

Toolkami 是极简的 AI Agent 框架，用七种工具支持运行，包括读(Read)、写(Write Diff)、浏览(Browse)、命令(Command)、提问(Ask)、思考(Think)。框架支持 T...

AIプロジェクト2025/12/18

Pemo - AI文档管理工具，支持一键翻译智能总结文献摘要

AIプロジェクト2025/12/18

BLIP3-o - Salesforce Research等机构推出的多模态模型

AIプロジェクト2025/12/18

ShotAdapter - Adobe联合UIUC推出的多镜头视频生成框架

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

DreamFit - 字节联合清华和中山大学推出的虚拟试衣框架

Minion Agent - 开源的多功能 AI Agent 框架

Being-M0 - 北大联合人民大学推出的人形机器人通用动作生成模型

DanceGRPO - 字节Seed联合港大推出的统一视觉生成强化学习框架

AlphaEvolve - 谷歌 DeepMind 推出的通用科学AI Agent

WorldMem - 南洋理工联合北大和上海 AI Lab 推出的世界生成模型

GPDiT - 清华北大联合阶跃星辰等推出的视频生成模型

Skywork-VL Reward - Skywork AI开源的多模态奖励模型

ChatUI - 阿里推出的开源智能对话式 UI 组件库

FaceShot - 同济大学联合上海 AI Lab等推出的肖像动画生成框架

MT-Color - 上海交大联合哔哩哔哩推出的可控图像着色框架

Speech-02 - MiniMax 推出的新一代文本转语音模型

Stable Audio Open Small - Stability AI和Arm推出的文本到音频生成模型

LBM - AI图像转换框架，实现可控阴影生成

Sketch2Anim - 爱丁堡大学等机构推出的2D草图转3D动画框架

SWE-1 - Windsurf推出的首个软件工程 AI 模型系列

DICE-Talk - 复旦联合腾讯优图推出的情感化动态肖像生成框架

混元图像2.0 - 腾讯推出的实时AI图片生成大模型

OpenMemory MCP - 基于MCP协议的本地AI记忆共享工具

Toolkami - 开源 AI Agent 框架，七种核心工具支持运行

Pemo - AI文档管理工具，支持一键翻译智能总结文献摘要

BLIP3-o - Salesforce Research等机构推出的多模态模型

ShotAdapter - Adobe联合UIUC推出的多镜头视频生成框架

Index-AniSora - B站开源的动漫视频生成模型

AIニュース

DreamFit - 字节联合清华和中山大学推出的虚拟试衣框架

Minion Agent - 开源的多功能 AI Agent 框架

Being-M0 - 北大联合人民大学推出的人形机器人通用动作生成模型

DanceGRPO - 字节Seed联合港大推出的统一视觉生成强化学习框架

AlphaEvolve - 谷歌 DeepMind 推出的通用科学AI Agent

WorldMem - 南洋理工联合北大和上海 AI Lab 推出的世界生成模型

GPDiT - 清华北大联合阶跃星辰等推出的视频生成模型

Skywork-VL Reward - Skywork AI开源的多模态奖励模型

ChatUI - 阿里推出的开源智能对话式 UI 组件库

FaceShot - 同济大学联合上海 AI Lab等推出的肖像动画生成框架

MT-Color - 上海交大联合哔哩哔哩推出的可控图像着色框架

Speech-02 - MiniMax 推出的新一代文本转语音模型

Stable Audio Open Small - Stability AI和Arm推出的文本到音频生成模型

LBM - AI图像转换框架，实现可控阴影生成

Sketch2Anim - 爱丁堡大学等机构推出的2D草图转3D动画框架

SWE-1 - Windsurf推出的首个软件工程 AI 模型系列

DICE-Talk - 复旦联合腾讯优图推出的情感化动态肖像生成框架

混元图像2.0 - 腾讯推出的实时AI图片生成大模型

OpenMemory MCP - 基于MCP协议的本地AI记忆共享工具

Toolkami - 开源 AI Agent 框架，七种核心工具支持运行

Pemo - AI文档管理工具，支持一键翻译智能总结文献摘要

BLIP3-o - Salesforce Research等机构推出的多模态模型

ShotAdapter - Adobe联合UIUC推出的多镜头视频生成框架

Index-AniSora - B站开源的动漫视频生成模型