AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

StableV2V - 中国科技大学开源的视频编辑项目

StableV2V是中国科技大学推出的开源视频编辑项目，基于文本、草图、图片等输入实现视频中物体的精准编辑和替换。项目用形状一致的编辑范式，基于三个主要组件...

AIプロジェクト2025/12/18

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

Halo是开源的DIY健康追踪项目，基于低成本的智能戒指和开源软件，让用户构建自己的私人健康监测应用。Halo支持活动追踪、心率监测、睡眠分析等功能，且完全尊...

AIプロジェクト2025/12/18

JoyVASA - 京东健康开源的音频驱动的数字人头项目

JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目，基于扩散模型技术，根据音频信号生成与音频同步的面部动态和头部运动。JoyVASA能实现人物的唇形同...

AIプロジェクト2025/12/18

TIP-I2V - 超170万大规模真实文本和图像提示数据集

TIP-I2V是大规模真实文本和图像提示数据集，用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示，及五种SOTA图生视频模型生成的相应视频...

AIプロジェクト2025/12/18

FLUX Tools - 黑森林实验室推出的模型工具套组

FLUX Tools是黑森林实验室推出的一套模型工具，能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX Tools包括FLUX.1 Fill（图像修复和扩展）、FLUX.1 D...

AIプロジェクト2025/12/18

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性，...

AIプロジェクト2025/12/18

AutoConsis - 美团联合复旦大学推出的UI内容一致性AI检测工具

AutoConsis是UI内容一致性智能检测，是美团技术团队与复旦大学联合推出的。工具基于深度学习和大型语言模型自动识别和提取界面中的关键数据，检测并识别数据...

AIプロジェクト2025/12/18

OmniEdit - 滑铁卢大学等机构开源的通用图像编辑模型

OmniEdit是先进的图像编辑技术，通过结合多个专家模型的监督来训练一个通用模型，处理多种图像编辑任务。能处理不同纵横比的图像，七种不同的图像编辑任务，...

AIプロジェクト2025/12/18

In-Context LoRA - 阿里通义推出的基于DiTs的图像生成框架

In-Context LoRA是阿里巴巴通义实验室推出的基于扩散变换器（DiTs）的图像生成框架，用模型的内在上下文学习能力，最小化调整激活模型的上下文生成能力。这种...

AIプロジェクト2025/12/18

Add-it - 英伟达推出无需训练的图像编辑技术

Add-it是NVIDIA推出的无需训练的图像编辑技术，能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制，整合场景图像、文本提示和生成图像...

AIプロジェクト2025/12/18

DINO-X - IDEA 研究院推出的通用视觉大模型

DINO-X是IDEA研究院推出的通用视觉大模型，具备开放世界对象检测与理解能力。支持文本、视觉和定制提示，能识别图像中的任何对象而无需用户提示。基于超过1亿...

AIプロジェクト2025/12/18

The Matrix - 阿里联合港大等多所机构推出的AI基础世界模拟器

The Matrix是与电影同名的、首个AI基础世界模拟器，是全华人团队推出的（作者分别来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vector Insititute）...

AIプロジェクト2025/12/18

DreamPolish - 智谱AI、清华、北大联合推出的文本到3D生成模型

DreamPolish是Zhipu AI、清华大学和北京大学推出的文本到3D生成模型，基于两阶段方法改进复杂对象的精细几何结构和高质量纹理的生成。第一阶段用多种神经表示...

AIプロジェクト2025/12/18

OmniBooth - 华为诺亚方舟联合港科大推出的图像生成框架

OmniBooth是华为诺亚方舟实验室和港科大研究团队共同推出的图像生成框架，支持基于文本提示或图像参考进行空间控制和实例级定制。框架用用户定义的掩码和相关...

AIプロジェクト2025/12/18

DynaMem - 纽约大学和Hello Robot推出的动态空间语义记忆系统

DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统，专为开放世界中的移动操作设计。基于维护一个特征点云作为机器人记忆，处理环境中的动态变化，...

AIプロジェクト2025/12/18

MVPaint - 腾讯PCG联合多所高校共同推出的3D纹理生成框架

MVPaint是腾讯PCG 、上海AI LAB、南洋理工大学S-Lab、清华大学共同推出的3D纹理生成框架，基于同步多视角扩散技术实现高分辨率、无缝且多视图一致的3D纹理生...

AIプロジェクト2025/12/18

LTX Video - Lightricks推出的开源AI视频生成模型

LTX Video是Lightricks推出的开源AI视频生成模型，能在4秒内生成5秒的高质量视频，速度超过观看速度。基于2亿参数的DiT架构，确保帧间平滑运动和结构一致性，...

AIプロジェクト2025/12/18

BALROG - 基准测试工具，用于评估LLMs和VLMs在复杂动态环境中的推理能力

BALROG是评估大型语言模型（LLMs）和视觉语言模型（VLMs）在游戏上的推理能力，特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏...

AIプロジェクト2025/12/18

AutoVFX - 自然语言驱动的视频特效编辑框架

AutoVFX是先进的物理特效框架，是伊利诺伊大学香槟分校研究团队推出的，能根据自然语言指令自动创建真实感和动态的视觉特效（VFX）视频。框架集成神经场景建...

AIプロジェクト2025/12/18

Markdown-to-Image - 开源的在线 Markdown 转海报编辑器

Markdown-to-Image是开源的Markdown 转为海报的编辑器，作为React组件能将Markdown文本内容转换成图像，适用于创建社交媒体帖子、海报和其他视觉内容。工具支...

AIプロジェクト2025/12/18

TÜLU 3 - Ai2 推出的系列开源指令遵循模型

TÜLU 3是艾伦人工智能研究所（Ai2）推出的一系列开源指令遵循模型，包括8B和70B两个版本，未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本，...

AIプロジェクト2025/12/18

EchoMimicV2 - 阿里推出的开源数字人项目，能生成完整数字人半身动画

EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目，基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频，确保音频内容与半身动作的一致性。EchoMi...

AIプロジェクト2025/12/18

FlipSketch - 萨里大学推出的文本引导生成无约束草图动画的AI系统

FlipSketch 是萨里大学推出的创新系统，能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现：微调草图风格的帧生成、用噪声细化保持输入草图视...

AIプロジェクト2025/12/18

StoryTeller - 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统

StoryTeller是字节跳动、上海交通大学和北京大学共同推出的系统，能基于音频视觉角色识别技术改善长视频描述的质量和一致性。系统结合低级视觉概念和高级剧情...

←1...55 56 57 58 59 60 61...137 →

AIニュース

AIプロジェクト2025/12/18

StableV2V - 中国科技大学开源的视频编辑项目

AIプロジェクト2025/12/18

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

AIプロジェクト2025/12/18

JoyVASA - 京东健康开源的音频驱动的数字人头项目

AIプロジェクト2025/12/18

TIP-I2V - 超170万大规模真实文本和图像提示数据集

AIプロジェクト2025/12/18

FLUX Tools - 黑森林实验室推出的模型工具套组

AIプロジェクト2025/12/18

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性，...

AIプロジェクト2025/12/18

AutoConsis - 美团联合复旦大学推出的UI内容一致性AI检测工具

AIプロジェクト2025/12/18

OmniEdit - 滑铁卢大学等机构开源的通用图像编辑模型

AIプロジェクト2025/12/18

In-Context LoRA - 阿里通义推出的基于DiTs的图像生成框架

AIプロジェクト2025/12/18

Add-it - 英伟达推出无需训练的图像编辑技术

AIプロジェクト2025/12/18

DINO-X - IDEA 研究院推出的通用视觉大模型

AIプロジェクト2025/12/18

The Matrix - 阿里联合港大等多所机构推出的AI基础世界模拟器

AIプロジェクト2025/12/18

DreamPolish - 智谱AI、清华、北大联合推出的文本到3D生成模型

AIプロジェクト2025/12/18

OmniBooth - 华为诺亚方舟联合港科大推出的图像生成框架

AIプロジェクト2025/12/18

DynaMem - 纽约大学和Hello Robot推出的动态空间语义记忆系统

AIプロジェクト2025/12/18

MVPaint - 腾讯PCG联合多所高校共同推出的3D纹理生成框架

AIプロジェクト2025/12/18

LTX Video - Lightricks推出的开源AI视频生成模型

AIプロジェクト2025/12/18

BALROG - 基准测试工具，用于评估LLMs和VLMs在复杂动态环境中的推理能力

AIプロジェクト2025/12/18

AutoVFX - 自然语言驱动的视频特效编辑框架

AIプロジェクト2025/12/18

Markdown-to-Image - 开源的在线 Markdown 转海报编辑器

AIプロジェクト2025/12/18

TÜLU 3 - Ai2 推出的系列开源指令遵循模型

AIプロジェクト2025/12/18

EchoMimicV2 - 阿里推出的开源数字人项目，能生成完整数字人半身动画

AIプロジェクト2025/12/18

FlipSketch - 萨里大学推出的文本引导生成无约束草图动画的AI系统

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

StableV2V - 中国科技大学开源的视频编辑项目

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

JoyVASA - 京东健康开源的音频驱动的数字人头项目

TIP-I2V - 超170万大规模真实文本和图像提示数据集

FLUX Tools - 黑森林实验室推出的模型工具套组

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

AutoConsis - 美团联合复旦大学推出的UI内容一致性AI检测工具

OmniEdit - 滑铁卢大学等机构开源的通用图像编辑模型

In-Context LoRA - 阿里通义推出的基于DiTs的图像生成框架

Add-it - 英伟达推出无需训练的图像编辑技术

DINO-X - IDEA 研究院推出的通用视觉大模型

The Matrix - 阿里联合港大等多所机构推出的AI基础世界模拟器

DreamPolish - 智谱AI、清华、北大联合推出的文本到3D生成模型

OmniBooth - 华为诺亚方舟联合港科大推出的图像生成框架

DynaMem - 纽约大学和Hello Robot推出的动态空间语义记忆系统

MVPaint - 腾讯PCG联合多所高校共同推出的3D纹理生成框架

LTX Video - Lightricks推出的开源AI视频生成模型

BALROG - 基准测试工具，用于评估LLMs和VLMs在复杂动态环境中的推理能力

AutoVFX - 自然语言驱动的视频特效编辑框架

Markdown-to-Image - 开源的在线 Markdown 转海报编辑器

TÜLU 3 - Ai2 推出的系列开源指令遵循模型

EchoMimicV2 - 阿里推出的开源数字人项目，能生成完整数字人半身动画

FlipSketch - 萨里大学推出的文本引导生成无约束草图动画的AI系统

StoryTeller - 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统

AIニュース

StableV2V - 中国科技大学开源的视频编辑项目

Halo - 开源的DIY健康追踪项目，构建私人健康检测应用

JoyVASA - 京东健康开源的音频驱动的数字人头项目

TIP-I2V - 超170万大规模真实文本和图像提示数据集

FLUX Tools - 黑森林实验室推出的模型工具套组

SmoothCache - Roblox 和女王大学推出用于DiT的通用推理加速技术

AutoConsis - 美团联合复旦大学推出的UI内容一致性AI检测工具

OmniEdit - 滑铁卢大学等机构开源的通用图像编辑模型

In-Context LoRA - 阿里通义推出的基于DiTs的图像生成框架

Add-it - 英伟达推出无需训练的图像编辑技术

DINO-X - IDEA 研究院推出的通用视觉大模型

The Matrix - 阿里联合港大等多所机构推出的AI基础世界模拟器

DreamPolish - 智谱AI、清华、北大联合推出的文本到3D生成模型

OmniBooth - 华为诺亚方舟联合港科大推出的图像生成框架

DynaMem - 纽约大学和Hello Robot推出的动态空间语义记忆系统

MVPaint - 腾讯PCG联合多所高校共同推出的3D纹理生成框架

LTX Video - Lightricks推出的开源AI视频生成模型

BALROG - 基准测试工具，用于评估LLMs和VLMs在复杂动态环境中的推理能力

AutoVFX - 自然语言驱动的视频特效编辑框架

Markdown-to-Image - 开源的在线 Markdown 转海报编辑器

TÜLU 3 - Ai2 推出的系列开源指令遵循模型

EchoMimicV2 - 阿里推出的开源数字人项目，能生成完整数字人半身动画

FlipSketch - 萨里大学推出的文本引导生成无约束草图动画的AI系统

StoryTeller - 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统