AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

FaceChain - 阿里推出的人物写真和个人形象生成框架

FaceChain是阿里巴巴达摩院推出的一个开源的人物写真和个人数字形象的AI生成框架（类似于免费开源版的妙鸭相机），用户仅需要提供最少一张照片即可生成独属于...

AIプロジェクト2025/12/18

I2VGen-XL：阿里推出的图像到视频生成模型

I2VGen-XL 是阿里巴巴达摩院推出的一款开源的图像到视频的生成模型，通过创新的级联扩散方法，将文本视频数据与视频结构解耦，同时利用静态图像作为关键指导...

AIプロジェクト2025/12/18

MagicVideo-V2：字节跳动推出的AI视频生成模型

MagicVideo-V2 是字节跳动公司团队开发的一款AI视频生成模型，通过将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块集成到一个端到端的视频...

AIプロジェクト2025/12/18

Motionshop - 阿里推出的AI角色动画项目，可替换视频人物为3D

Motionshop是阿里巴巴智能计算研究院推出的一个AI角色动画框架，可将视频中的人物角色替换为3D化身，同时不改变视频中的其他场景和人物。该框架利用视频处理...

AIプロジェクト2025/12/18

AnyText - 阿里开源的视觉图像文字生成和编辑模型

AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型，专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素...

AIプロジェクト2025/12/18

InstantID - 高保真的个性化图像合成框架

InstantID是一种基于扩散模型的图像生成技术，它专注于实现零次（zero-shot）身份保留（Identity-Preserving）的个性化图像合成。这项技术允许用户仅使用一张...

AIプロジェクト2025/12/18

VideoCrafter2 - 腾讯推出的高质量视频生成模型

VideoCrafter2是一个由腾讯AI实验室开发的视频生成模型，旨在克服高质量视频数据获取的局限性，训练出能够生成高质量视频的模型。该模型的核心思想是将视频的...

AIプロジェクト2025/12/18

Screenshot to Code - AI将截图转换为网页代码的开源项目

Sscreenshot to Code是一个开源的项目，利用人工智能技术（GPT-4V 和 DALL·E 3）将用户的屏幕截图转换为前端网页代码。项目的核心功能是自动化网页设计的编码...

AIプロジェクト2025/12/18

DDColor - 阿里推出的AI图像上色框架，将黑白图片变彩色

DDColor是阿里达摩院的研究人员推出的一个开源的AI图像着色框架，可以一键将黑白图片上色变为全彩图像。该方法通过使用双解码器架构（像素解码器和颜色解码器...

AIプロジェクト2025/12/18

Real-ESRGAN：腾讯推出的开源图像分辨率提升模型

Real-ESRGAN（Real-World Blind Super-Resolution with Pure Synthetic Data）是由腾讯的研究团队推出的一个深度学习模型，专门用于处理和提升低分辨率图像到...

AIプロジェクト2025/12/18

DemoFusion - 免费开源的图像分辨率超清增强框架

DemoFusion是一个旨在低成本进行高分辨率图像生成的技术框架，通过扩展现有的开源生成人工智能模型（如Stable Diffusion），使得这些模型能够在不进行额外训...

AIプロジェクト2025/12/18

ActAnywhere - Adobe推出的AI视频背景生成模型

ActAnywhere是一个由斯坦福大学和Adobe Research的研究人员共同开发的视频生成模型，旨在解决视频背景生成的问题，特别是在需要将前景主体（如人物）与新背景...

AIプロジェクト2025/12/18

Vary-toy：开源的小型视觉多模态模型

Vary-toy是一个小型的视觉语言模型（LVLM），由来自旷视、国科大、华中大的研究人员共同提出，旨在解决大型视觉语言模型（LVLMs）在训练和部署上的挑战。对于...

AIプロジェクト2025/12/18

Lepton Search - 开源的对话式AI搜索引擎项目

Lepton Search是由原阿里巴巴技术副总裁和AI科学家贾扬清创办的Lepton AI应用构建平台开源的一个对话式AI搜素引擎，该项目基于调用Lepton平台上的云端人工智...

AIプロジェクト2025/12/18

Follow Your Pose - 开源的姿态全可控视频生成框架

Follow Your Pose是由清华大学、香港科技大学、腾讯AI Lab以及中科院的研究人员开源的一个基于文本到视频生成的框架，允许用户通过文本描述和指定的人物姿态...

AIプロジェクト2025/12/18

IP-Adapter - 腾讯开源的文本到图像扩散模型适配器

IP-Adapter（Image Prompt Adapter）是一种专门为预训练的文本到图像扩散模型（如Stable Diffusion）设计的适配器，目的是让文生图模型能够利用图像提示来生...

AIプロジェクト2025/12/18

OLMo - 艾伦AI研究所开源的完全开放的大语言模型框架

OLMo（Open Language Model）是由Allen AI（AI2，艾伦AI研究所）开发的一个完全开源开放的大型语言模型（LLM）框架，设计初衷是为了通过开放研究，促进学术界...

AIプロジェクト2025/12/18

DiffusionGPT - 开源的大模型驱动的文本到图像生成系统

DiffusionGPT是由来自字节跳动与中山大学的研究人员推出的一个开源的大模型（LLM）驱动的文本到图像生成系统，旨在解决文生图领域无法处理不同的输入或者仅限...

AIプロジェクト2025/12/18

MetaGPT - 多个AI智能体协作分工的框架

MetaGPT是一个创新的元编程框架，结合了大语言模型和多智能体协作系统，旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化操作程序（SOPs）...

AIプロジェクト2025/12/18

Make-A-Character：阿里开源的AI 3D数字人生成框架

Make-A-Character（简称Mach）是一个由阿里巴巴集团智能计算研究院开发的一个人工智能3D数字人生成框架，旨在通过文本描述快速创建逼真的3D角色。该系统特别...

AIプロジェクト2025/12/18

MotionCtrl - 腾讯等推出的视频生成模型的运动控制器

MotionCtrl是由来自腾讯和香港大学等机构的研究人员推出的一个为视频生成模型设计的统一且灵活的运动控制器，能够独立地控制视频中的相机运动和物体运动视角...

AIプロジェクト2025/12/18

AnimateDiff - 扩展文生图模型生成动画的框架

AnimateDiff是由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员推出的一款将个性化的文本到图像模型扩展为动画生成器的框架，其核心在于它能够利用...

AIプロジェクト2025/12/18

Depth Anything - Tiktok等推出的单目深度估计模型

Depth Anything是由来自Tiktok、香港大学和浙江大学的研究人员推出的一个为单目深度估计设计的深度学习模型，旨在处理各种情况下的图像并估计其深度信息。该...

AIプロジェクト2025/12/18

V-JEPA：Meta推出的视觉模型，可以通过观看视频来学习理解物理世界

V-JEPA是由Meta的研究人员推出的一种新型的视频自监督学习方法，它专注于通过特征预测来学习视频的视觉表示。这种方法的核心思想是让模型能够预测视频中一个...

←1...26 27 28 29 30 31 32...137 →

AIニュース

AIプロジェクト2025/12/18

FaceChain - 阿里推出的人物写真和个人形象生成框架

AIプロジェクト2025/12/18

I2VGen-XL：阿里推出的图像到视频生成模型

AIプロジェクト2025/12/18

MagicVideo-V2：字节跳动推出的AI视频生成模型

AIプロジェクト2025/12/18

Motionshop - 阿里推出的AI角色动画项目，可替换视频人物为3D

AIプロジェクト2025/12/18

AnyText - 阿里开源的视觉图像文字生成和编辑模型

AIプロジェクト2025/12/18

InstantID - 高保真的个性化图像合成框架

AIプロジェクト2025/12/18

VideoCrafter2 - 腾讯推出的高质量视频生成模型

AIプロジェクト2025/12/18

Screenshot to Code - AI将截图转换为网页代码的开源项目

AIプロジェクト2025/12/18

DDColor - 阿里推出的AI图像上色框架，将黑白图片变彩色

AIプロジェクト2025/12/18

Real-ESRGAN：腾讯推出的开源图像分辨率提升模型

Real-ESRGAN（Real-World Blind Super-Resolution with Pure Synthetic Data）是由腾讯的研究团队推出的一个深度学习模型，专门用于处理和提升低分辨率图像到...

AIプロジェクト2025/12/18

DemoFusion - 免费开源的图像分辨率超清增强框架

AIプロジェクト2025/12/18

ActAnywhere - Adobe推出的AI视频背景生成模型

AIプロジェクト2025/12/18

Vary-toy：开源的小型视觉多模态模型

AIプロジェクト2025/12/18

Lepton Search - 开源的对话式AI搜索引擎项目

AIプロジェクト2025/12/18

Follow Your Pose - 开源的姿态全可控视频生成框架

AIプロジェクト2025/12/18

IP-Adapter - 腾讯开源的文本到图像扩散模型适配器

IP-Adapter（Image Prompt Adapter）是一种专门为预训练的文本到图像扩散模型（如Stable Diffusion）设计的适配器，目的是让文生图模型能够利用图像提示来生...

AIプロジェクト2025/12/18

OLMo - 艾伦AI研究所开源的完全开放的大语言模型框架

AIプロジェクト2025/12/18

DiffusionGPT - 开源的大模型驱动的文本到图像生成系统

AIプロジェクト2025/12/18

MetaGPT - 多个AI智能体协作分工的框架

AIプロジェクト2025/12/18

Make-A-Character：阿里开源的AI 3D数字人生成框架

AIプロジェクト2025/12/18

MotionCtrl - 腾讯等推出的视频生成模型的运动控制器

AIプロジェクト2025/12/18

AnimateDiff - 扩展文生图模型生成动画的框架

AIプロジェクト2025/12/18

Depth Anything - Tiktok等推出的单目深度估计模型

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

FaceChain - 阿里推出的人物写真和个人形象生成框架

I2VGen-XL：阿里推出的图像到视频生成模型

MagicVideo-V2：字节跳动推出的AI视频生成模型

Motionshop - 阿里推出的AI角色动画项目，可替换视频人物为3D

AnyText - 阿里开源的视觉图像文字生成和编辑模型

InstantID - 高保真的个性化图像合成框架

VideoCrafter2 - 腾讯推出的高质量视频生成模型

Screenshot to Code - AI将截图转换为网页代码的开源项目

DDColor - 阿里推出的AI图像上色框架，将黑白图片变彩色

Real-ESRGAN：腾讯推出的开源图像分辨率提升模型

DemoFusion - 免费开源的图像分辨率超清增强框架

ActAnywhere - Adobe推出的AI视频背景生成模型

Vary-toy：开源的小型视觉多模态模型

Lepton Search - 开源的对话式AI搜索引擎项目

Follow Your Pose - 开源的姿态全可控视频生成框架

IP-Adapter - 腾讯开源的文本到图像扩散模型适配器

OLMo - 艾伦AI研究所开源的完全开放的大语言模型框架

DiffusionGPT - 开源的大模型驱动的文本到图像生成系统

MetaGPT - 多个AI智能体协作分工的框架

Make-A-Character：阿里开源的AI 3D数字人生成框架

MotionCtrl - 腾讯等推出的视频生成模型的运动控制器

AnimateDiff - 扩展文生图模型生成动画的框架

Depth Anything - Tiktok等推出的单目深度估计模型

V-JEPA：Meta推出的视觉模型，可以通过观看视频来学习理解物理世界

AIニュース

FaceChain - 阿里推出的人物写真和个人形象生成框架

I2VGen-XL：阿里推出的图像到视频生成模型

MagicVideo-V2：字节跳动推出的AI视频生成模型

Motionshop - 阿里推出的AI角色动画项目，可替换视频人物为3D

AnyText - 阿里开源的视觉图像文字生成和编辑模型

InstantID - 高保真的个性化图像合成框架

VideoCrafter2 - 腾讯推出的高质量视频生成模型

Screenshot to Code - AI将截图转换为网页代码的开源项目

DDColor - 阿里推出的AI图像上色框架，将黑白图片变彩色

Real-ESRGAN：腾讯推出的开源图像分辨率提升模型

DemoFusion - 免费开源的图像分辨率超清增强框架

ActAnywhere - Adobe推出的AI视频背景生成模型

Vary-toy：开源的小型视觉多模态模型

Lepton Search - 开源的对话式AI搜索引擎项目

Follow Your Pose - 开源的姿态全可控视频生成框架

IP-Adapter - 腾讯开源的文本到图像扩散模型适配器

OLMo - 艾伦AI研究所开源的完全开放的大语言模型框架

DiffusionGPT - 开源的大模型驱动的文本到图像生成系统

MetaGPT - 多个AI智能体协作分工的框架

Make-A-Character：阿里开源的AI 3D数字人生成框架

MotionCtrl - 腾讯等推出的视频生成模型的运动控制器

AnimateDiff - 扩展文生图模型生成动画的框架

Depth Anything - Tiktok等推出的单目深度估计模型

V-JEPA：Meta推出的视觉模型，可以通过观看视频来学习理解物理世界