AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Image-01 - MiniMax 推出的文本到图像生成模型

Image-01 是 MiniMax 推出的先进文本到图像生成模型，具备卓越的图像生成能力。能将用户输入的文本描述精准转化为高质量图像，支持多种纵横比和高分辨率输出...

AIプロジェクト2025/12/18

SuperGPQA - 豆包大模型联合 M-A-P 开源的知识推理基准测试集

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖...

AIプロジェクト2025/12/18

SpeciesNet - Google 开源的动物物种识别 AI 模型

SpeciesNet 是 Google 开源的人工智能模型，通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成，能识别超过 2000 种标签，包括动物...

AIプロジェクト2025/12/18

GaussianCity - 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架，基于3D高斯绘制（3D-GS）技术。引入紧凑的 BEV-Point 表示方法，将场景的显存（VRA...

AIプロジェクト2025/12/18

Asyncflow v1.0 - Podcastle 推出的 AI 文本转语音模型

Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项，能为文本内容生成高质量的语音朗读，适用于多种语言和风格。

AIプロジェクト2025/12/18

ART - 微软联合清华和北大等推出的多层透明图像生成技术

ART（Anonymous Region Transformer）是新型的多层透明图像生成技术，能根据全局文本提示和匿名区域布局直接生成多个独立的透明图层（支持 RGBA 格式），图...

AIプロジェクト2025/12/18

NextGenAI - OpenAI 推出的教育联盟，联合15家顶尖大学和机构

NextGenAI是OpenAI推出的全球性联盟，基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶尖大学和机构，Ope...

AIプロジェクト2025/12/18

NotaGen - 中央音乐学院联合北航、清华等推出的音乐生成模型

NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型，基于模仿大型语言模型（LLM）的训练范式生成高质量的古典乐谱。NotaGen 基于...

AIプロジェクト2025/12/18

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

DiffRhythm（中文名称：谛韵）是西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型（Latent Diffusion）技术，能快速生成包...

AIプロジェクト2025/12/18

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型（MLLMs）与人类偏好的对齐能力设计的高质量数据...

AIプロジェクト2025/12/18

TrendPublish - AI内容发布工具，支持智能总结和自动发布

TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集，从 Twitter/X、网站等渠道获取信息，用 DeepseekAI、千问等 AI 服务进行智能总结、关...

AIプロジェクト2025/12/18

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

Proxy Lite 是开源的轻量级视觉语言模型（VLM），参数量为3B，支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器，完成网页交互、数据抓取、表单填写等...

AIプロジェクト2025/12/18

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型，基于自然对话实现多样化的视觉生成任务。WeGen结合多模态...

AIプロジェクト2025/12/18

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的，无需训练的图像生成与编辑框架，支持用户基于手绘草图直观地控制图像生成...

AIプロジェクト2025/12/18

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token，与文本token共享同一词汇空间，让大型...

AIプロジェクト2025/12/18

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

X-Dancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的研究人员共同推出的音乐驱动的人像舞蹈视频生成框架，支持从单张静态图像生成多样化且逼真的全身...

AIプロジェクト2025/12/18

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2（Accident Video Diffusion for Accident Video Description）是清华大学联合香港科技大学、吉林大学、南京理工大学、北京理工大学、复旦大学等机构推出...

AIプロジェクト2025/12/18

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

Kiss3DGen是创新的3D资产生成框架，通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle Image”，将多视图图像及对应...

AIプロジェクト2025/12/18

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

Archon 是专注于构建和优化 AI 智能体的开源项目。通过自主生成代码和优化智能体性能，展示了现代 AI 开发的核心理念。Archon 的核心功能包括智能体的快速构...

AIプロジェクト2025/12/18

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景，用多智能体协作系统（包括主持人、嘉宾和编剧）自动生成丰富且结...

AIプロジェクト2025/12/18

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是创新的文本到矢量图形（SVG）生成框架，通过结合大型语言模型（LLMs）和图像扩散模型，实现高质量 SVG 图形的自动化创作。通过多阶段流程，首先基...

AIプロジェクト2025/12/18

QwQ-32B - 阿里通义千问开源的最新推理模型

QwQ-32B 是阿里巴巴开源的新型推理模型，参数量为 320 亿。基于大规模强化学习（RL）训练，在数学推理、编程等任务上表现出色，性能比肩 6710 亿参数的 DeepS...

AIプロジェクト2025/12/18

Light-R1 - 360智脑开源的长思维链推理模型

Light-R1是360智脑开源的AI模型，专注于数学领域的长思维链推理，具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct，用7万条数学数据和两阶段课程学习（SF...

AIプロジェクト2025/12/18

SpatialVLA - 上海 AI Lab 联合上科大等推出的空间具身通用操作模型

SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型，基于百万真实数据预训练，为机器人赋予通用的3...

←1...86 87 88 89 90 91 92...137 →

AIニュース

AIプロジェクト2025/12/18

Image-01 - MiniMax 推出的文本到图像生成模型

AIプロジェクト2025/12/18

SuperGPQA - 豆包大模型联合 M-A-P 开源的知识推理基准测试集

AIプロジェクト2025/12/18

SpeciesNet - Google 开源的动物物种识别 AI 模型

AIプロジェクト2025/12/18

GaussianCity - 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

AIプロジェクト2025/12/18

Asyncflow v1.0 - Podcastle 推出的 AI 文本转语音模型

Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项，能为文本内容生成高质量的语音朗读，适用于多种语言和风格。

AIプロジェクト2025/12/18

ART - 微软联合清华和北大等推出的多层透明图像生成技术

AIプロジェクト2025/12/18

NextGenAI - OpenAI 推出的教育联盟，联合15家顶尖大学和机构

AIプロジェクト2025/12/18

NotaGen - 中央音乐学院联合北航、清华等推出的音乐生成模型

AIプロジェクト2025/12/18

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

AIプロジェクト2025/12/18

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

AIプロジェクト2025/12/18

TrendPublish - AI内容发布工具，支持智能总结和自动发布

AIプロジェクト2025/12/18

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

AIプロジェクト2025/12/18

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

AIプロジェクト2025/12/18

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

AIプロジェクト2025/12/18

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

AIプロジェクト2025/12/18

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

AIプロジェクト2025/12/18

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2（Accident Video Diffusion for Accident Video Description）是清华大学联合香港科技大学、吉林大学、南京理工大学、北京理工大学、复旦大学等机构推出...

AIプロジェクト2025/12/18

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

AIプロジェクト2025/12/18

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

AIプロジェクト2025/12/18

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

AIプロジェクト2025/12/18

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

AIプロジェクト2025/12/18

QwQ-32B - 阿里通义千问开源的最新推理模型

AIプロジェクト2025/12/18

Light-R1 - 360智脑开源的长思维链推理模型

Light-R1是360智脑开源的AI模型，专注于数学领域的长思维链推理，具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct，用7万条数学数据和两阶段课程学习（SF...

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Image-01 - MiniMax 推出的文本到图像生成模型

SuperGPQA - 豆包大模型联合 M-A-P 开源的知识推理基准测试集

SpeciesNet - Google 开源的动物物种识别 AI 模型

GaussianCity - 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

Asyncflow v1.0 - Podcastle 推出的 AI 文本转语音模型

ART - 微软联合清华和北大等推出的多层透明图像生成技术

NextGenAI - OpenAI 推出的教育联盟，联合15家顶尖大学和机构

NotaGen - 中央音乐学院联合北航、清华等推出的音乐生成模型

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

TrendPublish - AI内容发布工具，支持智能总结和自动发布

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

QwQ-32B - 阿里通义千问开源的最新推理模型

Light-R1 - 360智脑开源的长思维链推理模型

SpatialVLA - 上海 AI Lab 联合上科大等推出的空间具身通用操作模型

AIニュース

Image-01 - MiniMax 推出的文本到图像生成模型

SuperGPQA - 豆包大模型联合 M-A-P 开源的知识推理基准测试集

SpeciesNet - Google 开源的动物物种识别 AI 模型

GaussianCity - 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

Asyncflow v1.0 - Podcastle 推出的 AI 文本转语音模型

ART - 微软联合清华和北大等推出的多层透明图像生成技术

NextGenAI - OpenAI 推出的教育联盟，联合15家顶尖大学和机构

NotaGen - 中央音乐学院联合北航、清华等推出的音乐生成模型

谛韵DiffRhythm - 西北工业联合港中文推出的端到端音乐生成工具

OmniAlign-V - 上海交大联合上海 AI Lab 等推出的高质量数据集

TrendPublish - AI内容发布工具，支持智能总结和自动发布

Proxy Lite - 开源视觉语言模型，支持自动化网页任务

WeGen - 中科大联合上海交大等推出的统一多模态生成模型

DiffBrush - 北邮联合清华等机构推出的图像生成与编辑框架

Liquid - 华中科技、字节、港大联合推出的统一多模态生成框架

X-Dancer - 字节等机构推出音乐驱动的人像舞蹈视频生成框架

AVD2 - 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

Kiss3DGen - 基于图像扩散模型的3D资产生成框架

Archon - 开源 AI 智能体框架，自主生成代码构建 AI 智能体

PodAgent - 港中文、微软、小红书联合推出的播客生成框架

Chat2SVG - 文本描述实现高质量矢量图形的生成框架

QwQ-32B - 阿里通义千问开源的最新推理模型

Light-R1 - 360智脑开源的长思维链推理模型

SpatialVLA - 上海 AI Lab 联合上科大等推出的空间具身通用操作模型