AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

PaddleSpeech - 百度飞桨团队开源的语音处理工具

PaddleSpeech 是百度飞桨团队开源的语音处理工具，提供全面的语音处理功能，包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面、服...

AIプロジェクト2025/12/18

ChatAnyone - 阿里通义推出的实时风格化肖像视频生成框架

ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入，生成具有丰富表情和上半身动作的肖像视频。采用高效分层运动扩散模型和混...

AIプロジェクト2025/12/18

Math24o - SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准

Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力。使用2024年全...

AIプロジェクト2025/12/18

RoboBrain - 智源研究院开源的具身大脑模型

RoboBrain是智源研究院推出的开源具身大脑模型，推动单机智能迈向群体智能。由三个模块组成：用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于...

AIプロジェクト2025/12/18

RoboOS - 智源研究院推出的首个跨本体具身大小脑协作框架

RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构，具身大脑RoboBrain负责全局感知与决策，小脑技能库负责低延迟精准执行，...

AIプロジェクト2025/12/18

Vidu Q1 - 生数科技推出的高可控视频大模型

Vidu Q1 是清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队推出的高可控视频大模型。支持生成1080p高清视频，画质细腻，细节丰富，能...

AIプロジェクト2025/12/18

ObjectMover - 港大联合 Adobe 推出的新型图像编辑模型

ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型，解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题。将物...

AIプロジェクト2025/12/18

PhysGen3D - 清华等高校联合推出的单图创建交互式 3D 场景

PhysGen3D 是创新的框架，能将单张图像转换为交互式的 3D 场景，生成具有物理真实感的视频。结合了基于图像的几何和语义理解以及基于物理的模拟，通过从单张...

AIプロジェクト2025/12/18

EmotiVoice - 网易有道开源的AI语音合成系统

EmotiVoice是网易有道开源的多语言、多声音和提示控制的文本到语音（TTS）系统。EmotiVoice支持英语和中文，提供超过2000种声音，支持基于提示生成带有不同情...

AIプロジェクト2025/12/18

Vibe Draw - AI 3D建模工具，涂鸦草图一键转为3D模型

Vibe Draw是开源的 AI 3D建模工具，支持将用户在2D画布上绘制的涂鸦草图转化为精美的3D模型。用户能用文本提示或继续绘制迭代优化模型，一键导出为标准格式（...

AIプロジェクト2025/12/18

OmniSQL - 开源文本到 SQL 模型，自然语言转换为 SQL 查询语句

OmniSQL 是开源的文本到 SQL 模型，将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 SynSQL-2.5M，包...

AIプロジェクト2025/12/18

MegaTTS 3 - 字节与浙江大学合作推出的零样本语音合成系统

MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统，采用轻量级扩散模型，参数量仅0.45B，能高效生成高质量语音。系统将语音分解为内容、音...

AIプロジェクト2025/12/18

AutoGLM沉思 - 首个免费、具备深度研究和操作能力的AI Agent

AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent，能模拟人类思维过程，处理复杂的开放式问题。AutoGLM沉思具备强大的推理能力和自主操...

AIプロジェクト2025/12/18

cpmGO - 面壁智能推出的首个纯端侧汽车智能助手

cpmGO （小钢炮超级助手）是面壁智能推出的全球首个纯端侧智能助手，专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发，具备视觉、语音、多...

AIプロジェクト2025/12/18

AReaL-boba - 蚂蚁联合清华开源的强化学习训练框架

AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本，降低了强化学习训练门槛，用户能轻松训练推理模型。

AIプロジェクト2025/12/18

Qlib - 微软开源的金融 AI 量化投资工具

Qlib 是微软亚洲研究院推出的面向金融行业的AI量化投资工具，帮助量化研究者探索 AI 技术在投资领域的潜力。Qlib提供高性能的数据处理基础设施，支持从数据获...

AIプロジェクト2025/12/18

OpenDeepSearch - AI搜索工具，支持深度网络搜索和信息检索

OpenDeepSearch 是开源的深度搜索工具，基于开源推理模型和推理代理提升搜索性能，专为 Hugging Face 的 SmolAgents 无缝集成进行优化，支持深度网络搜索和...

AIプロジェクト2025/12/18

Hi3DGen - 港中文、字节、清华联合推出的3D几何生成框架

Hi3DGen 是香港中文大学（深圳）、字节跳动和清华大学的研究人员共同推出的高保真3D几何生成框架。能从2D图像生成高保真3D模型，通过基于法线图作为中间表示...

AIプロジェクト2025/12/18

GLM-Z1-Air - 智谱推出的深度思考模型

GLM-Z1-Air 是智谱公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在预训练阶段引入更多推理类数据，在对齐阶段深度优化通用能力，展现出强大的数...

AIプロジェクト2025/12/18

AI-ClothingTryOn - AI虚拟试穿应用，支持生成多版本试衣效果

AI-ClothingTryOn 是基于 Python 的桌面应用程序，用 Google Gemini AI 技术实现虚拟试衣功能。AI-ClothingTryOn支持分别上传人物照片和服装照片，基于 AI 技...

AIプロジェクト2025/12/18

GLM-4-Air-0414 - 智谱推出的基座模型

GLM-4-Air-0414是智谱公司推出的拥有320亿参数的基座模型，是AutoGLM沉思背后的模型。GLM-4-Air-0414在预训练阶段加入更多代码类、推理类数据，针对智能体能...

AIプロジェクト2025/12/18

Second Me - 心识宇宙开源的 AI 身份模型

Second Me 是心识宇宙（Mindverse）推出的开源AI身份模型，支持创建完全私有且深度个性化的AI代理，代表用户的“真实自我”。Second Me 提供 Chat Mode 和 Brid...

AIプロジェクト2025/12/18

FinGPT - 开源金融领域大模型，可预测股票价格走势

FinGPT 是开源的金融领域大型预训练语言模型，基于自然语言处理技术推动金融创新。通过强化学习和人类反馈（RLHF）技术，能学习个人偏好，提供个性化的投资建...

AIプロジェクト2025/12/18

GLM-Z1-Rumination - 智谱推出的沉思模型

GLM-Z1-Rumination 是智谱推出的沉思模型，基于 GLM-Z1 进一步优化而成，具体参数为GLM-Z1-Rumination-32B-0414 。GLM-Z1-Rumination基于扩展强化学习训练，...

←1...93 94 95 96 97 98 99...137 →

AIニュース

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

PaddleSpeech - 百度飞桨团队开源的语音处理工具

ChatAnyone - 阿里通义推出的实时风格化肖像视频生成框架

Math24o - SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准

RoboBrain - 智源研究院开源的具身大脑模型

RoboOS - 智源研究院推出的首个跨本体具身大小脑协作框架

Vidu Q1 - 生数科技推出的高可控视频大模型

ObjectMover - 港大联合 Adobe 推出的新型图像编辑模型

PhysGen3D - 清华等高校联合推出的单图创建交互式 3D 场景

EmotiVoice - 网易有道开源的AI语音合成系统

Vibe Draw - AI 3D建模工具，涂鸦草图一键转为3D模型

OmniSQL - 开源文本到 SQL 模型，自然语言转换为 SQL 查询语句

MegaTTS 3 - 字节与浙江大学合作推出的零样本语音合成系统

AutoGLM沉思 - 首个免费、具备深度研究和操作能力的AI Agent

cpmGO - 面壁智能推出的首个纯端侧汽车智能助手

AReaL-boba - 蚂蚁联合清华开源的强化学习训练框架

Qlib - 微软开源的金融 AI 量化投资工具

OpenDeepSearch - AI搜索工具，支持深度网络搜索和信息检索

Hi3DGen - 港中文、字节、清华联合推出的3D几何生成框架

GLM-Z1-Air - 智谱推出的深度思考模型

AI-ClothingTryOn - AI虚拟试穿应用，支持生成多版本试衣效果

GLM-4-Air-0414 - 智谱推出的基座模型

Second Me - 心识宇宙开源的 AI 身份模型

FinGPT - 开源金融领域大模型，可预测股票价格走势

GLM-Z1-Rumination - 智谱推出的沉思模型

AIニュース

PaddleSpeech - 百度飞桨团队开源的语音处理工具

ChatAnyone - 阿里通义推出的实时风格化肖像视频生成框架

Math24o - SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准

RoboBrain - 智源研究院开源的具身大脑模型

RoboOS - 智源研究院推出的首个跨本体具身大小脑协作框架

Vidu Q1 - 生数科技推出的高可控视频大模型

ObjectMover - 港大联合 Adobe 推出的新型图像编辑模型

PhysGen3D - 清华等高校联合推出的单图创建交互式 3D 场景

EmotiVoice - 网易有道开源的AI语音合成系统

Vibe Draw - AI 3D建模工具，涂鸦草图一键转为3D模型

OmniSQL - 开源文本到 SQL 模型，自然语言转换为 SQL 查询语句

MegaTTS 3 - 字节与浙江大学合作推出的零样本语音合成系统

AutoGLM沉思 - 首个免费、具备深度研究和操作能力的AI Agent

cpmGO - 面壁智能推出的首个纯端侧汽车智能助手

AReaL-boba - 蚂蚁联合清华开源的强化学习训练框架

Qlib - 微软开源的金融 AI 量化投资工具

OpenDeepSearch - AI搜索工具，支持深度网络搜索和信息检索

Hi3DGen - 港中文、字节、清华联合推出的3D几何生成框架

GLM-Z1-Air - 智谱推出的深度思考模型

AI-ClothingTryOn - AI虚拟试穿应用，支持生成多版本试衣效果

GLM-4-Air-0414 - 智谱推出的基座模型

Second Me - 心识宇宙开源的 AI 身份模型

FinGPT - 开源金融领域大模型，可预测股票价格走势

GLM-Z1-Rumination - 智谱推出的沉思模型