AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

SimpleQA - OpenAI开源的新基准，用于评估前沿模型的事实准确性

SimpleQA是OpenAI推出的基准测试，用在评估大型语言模型回答简短、寻求事实问题的能力。SimpleQA包含4326个问题，每个问题设计为只有一个正确答案，易于评分”...

AIプロジェクト2025/12/18

VtripGPT - 视旅科技推出首个旅游领域的AI大模型

VtripGPT是视旅科技推出的专注于旅游领域的AI大模型，基于深度合成服务为旅游对话生成提供智能支持。模型基于Transformer架构，结合旅游行业数据和常规知识进...

AIプロジェクト2025/12/18

D-Edit - 基于图像、文本、掩码的多功能图像编辑框架

D-Edit是基于图像和文本的多功能图像编辑框架，基于预训练的扩散模型和独特的提示（prompts）实现对图像中特定项目的精确控制和编辑。框架能处理包括基于图像...

AIプロジェクト2025/12/18

PromptFix - 微软开源的AI修图工具，通过提示词实现多种图像处理

PromptFix是微软开发的开源AI图像修复工具，基于扩散模型技术，能根据用户指令处理损坏的图片，移除不需要的元素。PromptFix支持多种图像处理任务，包括上色...

AIプロジェクト2025/12/18

Show-o - 新加坡国立Show Lab联合字节推出的多模态理解与生成的统一模型

Show-o是集成了多模态理解和生成的统一Transformer模型。通过结合自回归和离散扩散建模，能灵活处理包括视觉问答、文本到图像生成、文本引导的修复和扩展，混...

AIプロジェクト2025/12/18

MimicTalk - 字节联合浙大推出的开源3D数字人头项目

MimicTalk是浙江大学和字节跳动共同研发推出的，基于NeRF（神经辐射场）技术，能在极短的时间内，仅需15分钟训练出个性化和富有表现力的3D说话人脸模型。Mimi...

AIプロジェクト2025/12/18

Wonder Animation - 视频序列转换成3D动画场景的AI解决方案

Wonder Animation 是 Autodesk 旗下 Wonder Dynamics 推出的创新 AI 技术，Wonder Animation测试版现已上线Wonder Studio。Wonder Animation基于 Video to 3D...

AIプロジェクト2025/12/18

TimeSuite - 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架

TimeSuite是上海AI Lab推出的新型框架，能提升多模态大型语言模型（MLLMs）在长视频理解任务中的表现。基于引入高效的长视频处理框架、高质量的视频数据集Tim...

AIプロジェクト2025/12/18

EMMA - Waymo推出的端到端自动驾驶多模态模型

EMMA是Waymo基于Gemini模型推出的端到端自动驾驶多模态模型，能将原始相机传感器数据直接映射到驾驶特定输出，如规划轨迹、感知对象和道路图元素。EMMA将非传...

AIプロジェクト2025/12/18

DreamVideo-2 - 复旦和阿里联合多机构推出的零样本视频定制生成框架

DreamVideo-2是创新的零样本视频定制框架，是复旦大学和阿里巴巴集团等机构联合推出。DreamVideo-2能根据单一图像和界定框序列生成具有特定主题和精确运动轨...

AIプロジェクト2025/12/18

NotebookMLX - 将PDF文档转换成音频博客开源版的NotebookLM

NotebookMLX是开源版本的NotebookLM，集成NotebookLlama的功能，能将PDF文档转换成易于理解和分享的音频播客形式。项目基于MLX技术实现自然语言处理功能，包...

AIプロジェクト2025/12/18

HOVER - 英伟达推出的通用人形机器人功能控制器1.5M小模型

HOVER是英伟达推出的1.5M小模型，全称为“Humanoid Versatile Controller”，即人形机器人的多功能全身神经通用控制器。模型用150万参数实现对机器人复杂动作的...

AIプロジェクト2025/12/18

Voice Changer - Cartesia推出转换声音同时保留原始情感的变声器模型

Voice Changer是Cartesia推出的新模型，能将任何音频剪辑的语音转换成其他音色，且保留原始音频的情感和表达。用户从Cartesia提供的多种高质量声音库中选择，...

AIプロジェクト2025/12/18

Oasis - Decart联合Etched推出首款AI实时生成的游戏系统

Oasis是世界上首款AI实时生成的游戏，由Decart和Etched联合推出。游戏能以每秒20帧的速度实时渲染交互式视频内容，无需游戏引擎，通过AI模型直接生成。玩家可...

AIプロジェクト2025/12/18

夸克灵知大模型 - 夸克推出的AI学习大模型

夸克灵知是夸克公司全新推出的智能学习学习大模型，具备博士生级别的推理能力。基于AI技术为用户提供分步骤题目讲解，能随时回答问题。在考研数学等题目的正...

AIプロジェクト2025/12/18

OSAID 1.0 - OSI发布的全球首个开源 AI 官方标准1.0版本

OSAID 1.0（The Open Source AI Definition – 1.0）是Open Source Initiative（OSI）发布的官方标准，用在明确AI系统成为开放源代码的条件。参与制定OSAID 1....

AIプロジェクト2025/12/18

MobileLLM - Meta推出的适合移动端的语言模型

MobileLLM是Meta为移动设备用例优化设计的十亿参数以下的大型语言模型，能解决云成本上升和延迟问题。MobileLLM基于深薄架构、嵌入共享和分组查询注意力机制...

AIプロジェクト2025/12/18

SmolLM2 - Hugging Face推出的紧凑型大语言模型

SmolLLM2是Hugging Face推出用在设备端应用的紧凑型大型语言模型，提供1.7B、360M、135M三个不同参数级别的模型，适应不同的应用场景和资源限制。模型在理解...

AIプロジェクト2025/12/18

Genmoai-smol - 对单GPU设备优化的开源AI视频生成模型

Genmoai-smol是开源视频生成模型，是Genmoai的txt2video模型的工作进展分支，专为单GPU设备优化，减少显存占用，在资源有限的设备上能进行视频创作。模型用高...

AIプロジェクト2025/12/18

VirSci - 上海人工智能实验室推出的多智能体AI科学研究工具

VirSci（Virtual Scientists）是上海人工智能实验室推出的多智能体AI科学研究工具，基于模拟科学家团队的合作过程加速科研创新。系统基于大型语言模型（LLMs...

AIプロジェクト2025/12/18

Self-Lengthen - 阿里千问推出的提升输出长度迭代训练框架

Self-Lengthen是阿里巴巴千问团队推出的创新的迭代训练框架，能提升大型语言模型（LLMs）生成长文本的能力。框架基于两个角色，生成器和扩展器协同工作，生成...

AIプロジェクト2025/12/18

Amphion - 开源的全能AI音频项目，面向音频、音乐和语音生成的工具包

Amphion是开源的音频、音乐和语音生成工具包，是香港中文大学（深圳）副教授武执政团队联合上海人工智能实验室和深圳市大数据研究院共同推出的。工具包支持可...

AIプロジェクト2025/12/18

LongReward - 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法

LongReward是清华大学、中国科学院、智谱AI联合推出的，基于AI反馈改进长文本大型语言模型（LLMs）性能的方法。LongReward从有用性、逻辑性、忠实性和完整性...

AIプロジェクト2025/12/18

Fish Agent - Fish Audio推出的端到端语音处理模型

Fish Agent是FishAudio推出的创新的端到端语音处理模型，集成自动语音识别（ASR）和文本到语音（TTS）技术，无需传统的语义编码器/解码器，即可实现语音到语...

←1...49 50 51 52 53 54 55...137 →

AIニュース

AIプロジェクト2025/12/18

SimpleQA - OpenAI开源的新基准，用于评估前沿模型的事实准确性

AIプロジェクト2025/12/18

VtripGPT - 视旅科技推出首个旅游领域的AI大模型

AIプロジェクト2025/12/18

D-Edit - 基于图像、文本、掩码的多功能图像编辑框架

AIプロジェクト2025/12/18

PromptFix - 微软开源的AI修图工具，通过提示词实现多种图像处理

AIプロジェクト2025/12/18

Show-o - 新加坡国立Show Lab联合字节推出的多模态理解与生成的统一模型

AIプロジェクト2025/12/18

MimicTalk - 字节联合浙大推出的开源3D数字人头项目

AIプロジェクト2025/12/18

Wonder Animation - 视频序列转换成3D动画场景的AI解决方案

Wonder Animation 是 Autodesk 旗下 Wonder Dynamics 推出的创新 AI 技术，Wonder Animation测试版现已上线Wonder Studio。Wonder Animation基于 Video to 3D...

AIプロジェクト2025/12/18

TimeSuite - 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架

AIプロジェクト2025/12/18

EMMA - Waymo推出的端到端自动驾驶多模态模型

AIプロジェクト2025/12/18

DreamVideo-2 - 复旦和阿里联合多机构推出的零样本视频定制生成框架

AIプロジェクト2025/12/18

NotebookMLX - 将PDF文档转换成音频博客开源版的NotebookLM

AIプロジェクト2025/12/18

HOVER - 英伟达推出的通用人形机器人功能控制器1.5M小模型

AIプロジェクト2025/12/18

Voice Changer - Cartesia推出转换声音同时保留原始情感的变声器模型

AIプロジェクト2025/12/18

Oasis - Decart联合Etched推出首款AI实时生成的游戏系统

AIプロジェクト2025/12/18

夸克灵知大模型 - 夸克推出的AI学习大模型

AIプロジェクト2025/12/18

OSAID 1.0 - OSI发布的全球首个开源 AI 官方标准1.0版本

OSAID 1.0（The Open Source AI Definition – 1.0）是Open Source Initiative（OSI）发布的官方标准，用在明确AI系统成为开放源代码的条件。参与制定OSAID 1....

AIプロジェクト2025/12/18

MobileLLM - Meta推出的适合移动端的语言模型

AIプロジェクト2025/12/18

SmolLM2 - Hugging Face推出的紧凑型大语言模型

AIプロジェクト2025/12/18

Genmoai-smol - 对单GPU设备优化的开源AI视频生成模型

AIプロジェクト2025/12/18

VirSci - 上海人工智能实验室推出的多智能体AI科学研究工具

AIプロジェクト2025/12/18

Self-Lengthen - 阿里千问推出的提升输出长度迭代训练框架

AIプロジェクト2025/12/18

Amphion - 开源的全能AI音频项目，面向音频、音乐和语音生成的工具包

AIプロジェクト2025/12/18

LongReward - 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

SimpleQA - OpenAI开源的新基准，用于评估前沿模型的事实准确性

VtripGPT - 视旅科技推出首个旅游领域的AI大模型

D-Edit - 基于图像、文本、掩码的多功能图像编辑框架

PromptFix - 微软开源的AI修图工具，通过提示词实现多种图像处理

Show-o - 新加坡国立Show Lab联合字节推出的多模态理解与生成的统一模型

MimicTalk - 字节联合浙大推出的开源3D数字人头项目

Wonder Animation - 视频序列转换成3D动画场景的AI解决方案

TimeSuite - 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架

EMMA - Waymo推出的端到端自动驾驶多模态模型

DreamVideo-2 - 复旦和阿里联合多机构推出的零样本视频定制生成框架

NotebookMLX - 将PDF文档转换成音频博客开源版的NotebookLM

HOVER - 英伟达推出的通用人形机器人功能控制器1.5M小模型

Voice Changer - Cartesia推出转换声音同时保留原始情感的变声器模型

Oasis - Decart联合Etched推出首款AI实时生成的游戏系统

夸克灵知大模型 - 夸克推出的AI学习大模型

OSAID 1.0 - OSI发布的全球首个开源 AI 官方标准1.0版本

MobileLLM - Meta推出的适合移动端的语言模型

SmolLM2 - Hugging Face推出的紧凑型大语言模型

Genmoai-smol - 对单GPU设备优化的开源AI视频生成模型

VirSci - 上海人工智能实验室推出的多智能体AI科学研究工具

Self-Lengthen - 阿里千问推出的提升输出长度迭代训练框架

Amphion - 开源的全能AI音频项目，面向音频、音乐和语音生成的工具包

LongReward - 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法

Fish Agent - Fish Audio推出的端到端语音处理模型

AIニュース

SimpleQA - OpenAI开源的新基准，用于评估前沿模型的事实准确性

VtripGPT - 视旅科技推出首个旅游领域的AI大模型

D-Edit - 基于图像、文本、掩码的多功能图像编辑框架

PromptFix - 微软开源的AI修图工具，通过提示词实现多种图像处理

Show-o - 新加坡国立Show Lab联合字节推出的多模态理解与生成的统一模型

MimicTalk - 字节联合浙大推出的开源3D数字人头项目

Wonder Animation - 视频序列转换成3D动画场景的AI解决方案

TimeSuite - 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架

EMMA - Waymo推出的端到端自动驾驶多模态模型

DreamVideo-2 - 复旦和阿里联合多机构推出的零样本视频定制生成框架

NotebookMLX - 将PDF文档转换成音频博客开源版的NotebookLM

HOVER - 英伟达推出的通用人形机器人功能控制器1.5M小模型

Voice Changer - Cartesia推出转换声音同时保留原始情感的变声器模型

Oasis - Decart联合Etched推出首款AI实时生成的游戏系统

夸克灵知大模型 - 夸克推出的AI学习大模型

OSAID 1.0 - OSI发布的全球首个开源 AI 官方标准1.0版本

MobileLLM - Meta推出的适合移动端的语言模型

SmolLM2 - Hugging Face推出的紧凑型大语言模型

Genmoai-smol - 对单GPU设备优化的开源AI视频生成模型

VirSci - 上海人工智能实验室推出的多智能体AI科学研究工具

Self-Lengthen - 阿里千问推出的提升输出长度迭代训练框架

Amphion - 开源的全能AI音频项目，面向音频、音乐和语音生成的工具包

LongReward - 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法

Fish Agent - Fish Audio推出的端到端语音处理模型