AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Pippo - Meta 推出的单图生成多视角高清人像视频模型

Pippo是Meta Reality Labs推出的图像到视频生成模型，能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器，预训练了30亿张人像图像，...

AIプロジェクト2025/12/18

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术，通过结合环境信息生成更具真实感的角色动画。与传统方法不同，能从视频中提取...

AIプロジェクト2025/12/18

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具，基于深度集成 DeepSeek R1 和 Claude 两大模型，结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应，支...

AIプロジェクト2025/12/18

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

AuraFusion360是用于360°无边界场景修复的新型基于参考的方法，主要用于虚拟现实和建筑可视化等领域的三维场景修复。通过高斯散射表示的3D场景，实现了高质量...

AIプロジェクト2025/12/18

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

RWKV-7-2.9B模型（RWKV-7-World-2.9B-V3）是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练，具有 29 亿参数，支持世界所有语言。模型...

AIプロジェクト2025/12/18

Data Formulator - 微软研究院开源的 AI 数据可视化工具

Data Formulator 是微软研究院推出的开源 AI 驱动的数据可视化工具，帮助用户通过简单交互和指令快速创建丰富的数据可视化。结合了图形化用户界面（GUI）和自...

AIプロジェクト2025/12/18

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型

Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型，基于优化内存消耗和推理延迟快速生成高质量视频片段。模型将复杂的文本到视频生成...

AIプロジェクト2025/12/18

Praison AI - 开源AI多智能体框架，低代码创建和管理AI代理

Praison AI 是生产级的多智能体框架，基于低代码解决方案创建和管理AI代理，用自动化和解决从简单到复杂的任务。Praison AI 支持多种流程类型，包括顺序、分...

AIプロジェクト2025/12/18

Goedel-Prover - 自动化数学问题的形式证明生成开源推理模型

Goedel-Prover（哥德尔证明器）是普林斯顿大学、清华大学、清华大学等机构推出的开源大型语言模型（LLM），用在自动化数学问题的形式证明生成。基于将自然语...

AIプロジェクト2025/12/18

CineMaster - 快手推出的文本到视频生成框架，具备3D感知能力

CineMaster 是快手推出的具备3D感知能力的文本到视频生成框架。类似于视频版的ControlNet，支持用户通过多种控制信号精确操控视频中物体的位置和相机运动。可...

AIプロジェクト2025/12/18

GAS - 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架

GAS（Generative Avatar Synthesis from a Single Image）是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质量、视角一...

AIプロジェクト2025/12/18

OpenThinker-32B - 斯坦福、UC 伯克利等机构联合开源的推理模型

OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型，拥有 328 亿参数，支持 16,000 token 的上下文长度。模型仅使用 114k 数据...

AIプロジェクト2025/12/18

Social Media Agent - AI社交媒体内容管理工具，输入URL自动生成帖子

Social Media Agent是智能的社交媒体内容管理工具，基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互流程，处理社交媒体平台认证...

AIプロジェクト2025/12/18

Matrix-Zero - 昆仑万维推出的世界模型

Matrix-Zero是昆仑万维推出的世界模型，包含两款子模型：3D场景生成大模型和可交互视频生成大模型。Matrix-Zero能将用户输入的图片转化为可自由探索的真实3D...

AIプロジェクト2025/12/18

Sa2VA - 字节跳动等机构开源的多模态大语言模型

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是SAM2和LLaVA结合而成，能实现对图像和视频的密集、细粒度理解。S...

AIプロジェクト2025/12/18

WebLI-100B - 谷歌 DeepMind 推出的1000亿视觉语言数据集

WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集，用在预训练视觉语言模型（VLMs）。WebLI-100B是WebLI数据集的扩展版本，基于从网...

AIプロジェクト2025/12/18

BAG - 港中文联合腾讯推出的3D可穿戴资产生成技术

BAG（Body-Aligned 3D Wearable Asset Generation）是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术，通过结合多视图图像扩散模型和控制网络（Contr...

AIプロジェクト2025/12/18

通古大模型 - 华南理工大学推出的古籍大语言模型

通古大模型是华南理工大学深度学习与视觉计算实验室（SCUT-DLVCLab）推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练，使用...

AIプロジェクト2025/12/18

ENEL - 上海 AI Lab 推出的无编码器3D大型多模态模型

ENEL（Exploring the Potential of Encoder-free Architectures in 3D LMMs）是创新的无编码器3D大型多模态模型（3D LMM），解决传统编码器架构在3D理解任务...

AIプロジェクト2025/12/18

AnyCharV - 港中文联合清华等机构推出的角色可控视频生成框架

AnyCharV 是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架，能将任意参考角色图像与目标驱动视频相结合，生成高质量的角...

AIプロジェクト2025/12/18

NobodyWho - AI游戏引擎插件，本地运行 LLM 实现互动小说创作

NobodyWho是为 Godot 游戏引擎设计的插件，通过本地运行的大型语言模型（LLM）实现互动小说创作。支持 Windows、Linux 和 macOS 平台，用户无需联网即可使用...

AIプロジェクト2025/12/18

PIKE-RAG - 微软亚洲研究院推出的检索增强型生成框架

PIKE-RAG（sPecIalized KnowledgE and Rationale Augmented Generation）是微软亚洲研究院推出的检索增强型生成框架，能解决传统RAG系统在复杂工业应用中的局...

AIプロジェクト2025/12/18

Collaborative Gym - 支持人与AI代理实时交互协作的评估框架

Collaborative Gym（Co-Gym）是专注于人机协作（Human-Agent Collaboration）的框架，支持人类与AI代理之间的实时交互与协作。通过模拟和真实两种实验条件，...

AIプロジェクト2025/12/18

TIGER - 清华大学推出的轻量级语音分离模型

TIGER（Time-frequency Interleaved Gain Extraction and Reconstruction Network）是清华大学研究团队提出的轻量级语音分离模型，通过时频交叉建模策略，结...

←1...79 80 81 82 83 84 85...137 →

AIニュース

AIプロジェクト2025/12/18

Pippo - Meta 推出的单图生成多视角高清人像视频模型

AIプロジェクト2025/12/18

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

AIプロジェクト2025/12/18

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具，基于深度集成 DeepSeek R1 和 Claude 两大模型，结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应，支...

AIプロジェクト2025/12/18

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

AIプロジェクト2025/12/18

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

RWKV-7-2.9B模型（RWKV-7-World-2.9B-V3）是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练，具有 29 亿参数，支持世界所有语言。模型...

AIプロジェクト2025/12/18

Data Formulator - 微软研究院开源的 AI 数据可视化工具

AIプロジェクト2025/12/18

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型

AIプロジェクト2025/12/18

Praison AI - 开源AI多智能体框架，低代码创建和管理AI代理

AIプロジェクト2025/12/18

Goedel-Prover - 自动化数学问题的形式证明生成开源推理模型

AIプロジェクト2025/12/18

CineMaster - 快手推出的文本到视频生成框架，具备3D感知能力

AIプロジェクト2025/12/18

GAS - 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架

GAS（Generative Avatar Synthesis from a Single Image）是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质量、视角一...

AIプロジェクト2025/12/18

OpenThinker-32B - 斯坦福、UC 伯克利等机构联合开源的推理模型

OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型，拥有 328 亿参数，支持 16,000 token 的上下文长度。模型仅使用 114k 数据...

AIプロジェクト2025/12/18

Social Media Agent - AI社交媒体内容管理工具，输入URL自动生成帖子

Social Media Agent是智能的社交媒体内容管理工具，基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互流程，处理社交媒体平台认证...

AIプロジェクト2025/12/18

Matrix-Zero - 昆仑万维推出的世界模型

AIプロジェクト2025/12/18

Sa2VA - 字节跳动等机构开源的多模态大语言模型

AIプロジェクト2025/12/18

WebLI-100B - 谷歌 DeepMind 推出的1000亿视觉语言数据集

WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集，用在预训练视觉语言模型（VLMs）。WebLI-100B是WebLI数据集的扩展版本，基于从网...

AIプロジェクト2025/12/18

BAG - 港中文联合腾讯推出的3D可穿戴资产生成技术

BAG（Body-Aligned 3D Wearable Asset Generation）是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术，通过结合多视图图像扩散模型和控制网络（Contr...

AIプロジェクト2025/12/18

通古大模型 - 华南理工大学推出的古籍大语言模型

AIプロジェクト2025/12/18

ENEL - 上海 AI Lab 推出的无编码器3D大型多模态模型

ENEL（Exploring the Potential of Encoder-free Architectures in 3D LMMs）是创新的无编码器3D大型多模态模型（3D LMM），解决传统编码器架构在3D理解任务...

AIプロジェクト2025/12/18

AnyCharV - 港中文联合清华等机构推出的角色可控视频生成框架

AIプロジェクト2025/12/18

NobodyWho - AI游戏引擎插件，本地运行 LLM 实现互动小说创作

AIプロジェクト2025/12/18

PIKE-RAG - 微软亚洲研究院推出的检索增强型生成框架

PIKE-RAG（sPecIalized KnowledgE and Rationale Augmented Generation）是微软亚洲研究院推出的检索增强型生成框架，能解决传统RAG系统在复杂工业应用中的局...

AIプロジェクト2025/12/18

Collaborative Gym - 支持人与AI代理实时交互协作的评估框架

Collaborative Gym（Co-Gym）是专注于人机协作（Human-Agent Collaboration）的框架，支持人类与AI代理之间的实时交互与协作。通过模拟和真实两种实验条件，...

AIプロジェクト2025/12/18

TIGER - 清华大学推出的轻量级语音分离模型

TIGER（Time-frequency Interleaved Gain Extraction and Reconstruction Network）是清华大学研究团队提出的轻量级语音分离模型，通过时频交叉建模策略，结...

すべてのカテゴリ

AIニュース

Pippo - Meta 推出的单图生成多视角高清人像视频模型

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

Data Formulator - 微软研究院开源的 AI 数据可视化工具

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型

Praison AI - 开源AI多智能体框架，低代码创建和管理AI代理

Goedel-Prover - 自动化数学问题的形式证明生成开源推理模型

CineMaster - 快手推出的文本到视频生成框架，具备3D感知能力

GAS - 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架

OpenThinker-32B - 斯坦福、UC 伯克利等机构联合开源的推理模型

Social Media Agent - AI社交媒体内容管理工具，输入URL自动生成帖子

Matrix-Zero - 昆仑万维推出的世界模型

Sa2VA - 字节跳动等机构开源的多模态大语言模型

WebLI-100B - 谷歌 DeepMind 推出的1000亿视觉语言数据集

BAG - 港中文联合腾讯推出的3D可穿戴资产生成技术

通古大模型 - 华南理工大学推出的古籍大语言模型

ENEL - 上海 AI Lab 推出的无编码器3D大型多模态模型

AnyCharV - 港中文联合清华等机构推出的角色可控视频生成框架

NobodyWho - AI游戏引擎插件，本地运行 LLM 实现互动小说创作

PIKE-RAG - 微软亚洲研究院推出的检索增强型生成框架

Collaborative Gym - 支持人与AI代理实时交互协作的评估框架

TIGER - 清华大学推出的轻量级语音分离模型

AIニュース

Pippo - Meta 推出的单图生成多视角高清人像视频模型

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

Data Formulator - 微软研究院开源的 AI 数据可视化工具

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型

Praison AI - 开源AI多智能体框架，低代码创建和管理AI代理

Goedel-Prover - 自动化数学问题的形式证明生成开源推理模型

CineMaster - 快手推出的文本到视频生成框架，具备3D感知能力

GAS - 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架

OpenThinker-32B - 斯坦福、UC 伯克利等机构联合开源的推理模型

Social Media Agent - AI社交媒体内容管理工具，输入URL自动生成帖子

Matrix-Zero - 昆仑万维推出的世界模型

Sa2VA - 字节跳动等机构开源的多模态大语言模型

WebLI-100B - 谷歌 DeepMind 推出的1000亿视觉语言数据集

BAG - 港中文联合腾讯推出的3D可穿戴资产生成技术

通古大模型 - 华南理工大学推出的古籍大语言模型

ENEL - 上海 AI Lab 推出的无编码器3D大型多模态模型

AnyCharV - 港中文联合清华等机构推出的角色可控视频生成框架

NobodyWho - AI游戏引擎插件，本地运行 LLM 实现互动小说创作

PIKE-RAG - 微软亚洲研究院推出的检索增强型生成框架

Collaborative Gym - 支持人与AI代理实时交互协作的评估框架

TIGER - 清华大学推出的轻量级语音分离模型