AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2026/2/4

GLM-OCR - 智谱开源的轻量级多模态OCR模型

GLM-OCR是智谱AI开源的轻量级多模态OCR模型，仅0.9B参数在OmniDocBench V1.5榜单以94.6分登顶SOTA。

AIプロジェクト2026/2/4

Thinker - 优必选开源的具身智能视觉语言模型

Thinker是优必选开源的具身智能视觉语言大模型，专为机器人场景打造。模型4B参数在9项权威基准测试中斩获全球第一。

AIプロジェクト2026/2/3

Happy - 开源AI编程远程控制工具，实时查看状态

Happy是什么 Happy 是开源工具，能让用户通过手机或网页客户端远程控制电脑上运行的 Claude Code 或 Codex。支持实时查看代码进度、语音交互、消息推送，采...

AIプロジェクト2026/2/3

Step 3.5 Flash - 阶跃星辰最新开源的基座模型

Step 3.5 Flash 是阶跃星辰最新开源的基座模型，专为 Agent 场景推出。模型采用稀疏 MoE 架构，总参数 1960 亿，每 token 仅激活 110 亿参数，兼顾性能与效率。

AIプロジェクト2026/2/2

Vidu Q3 - 生数科技推出的音画同步AI视频模型

Vidu Q3 是生数科技推出的全球首款 16 秒音画同步 AI 视频模型，专为短剧、漫剧、广告等叙事场景打造。一次提示即可直出 16 秒 1080p 成片，画面、对白、环境...

AIプロジェクト2026/2/1

UnifoLM-VLA-0 - 宇树开源的通用机器人操作大模型

UnifoLM-VLA-0 是宇树科技开源的通用视觉-语言-动作（VLA）大模型，基于 Qwen2.5-VL-7B 架构进行持续预训练。

AIプロジェクト2026/1/31

TTT-Discover - 斯坦福、英伟达推出的测试时强化学习方法

TTT-Discover（Test-Time Training to Discover）是斯坦福、英伟达等机构推出的AI科学发现方法。TTT-Discover在测试阶段对模型进行强化学习训练，非冻结权重...

AIプロジェクト2026/1/31

Project Genie - 谷歌推出的实验性AI世界模型原型

Project Genie 是谷歌 DeepMind 推出的实验性 AI 世界模型原型，基于 Genie 3、Nano Banana Pro 和 Gemini 技术驱动。用户通过文字提示或上传图片可创建虚拟...

AIプロジェクト2026/1/31

LingBot-World - 蚂蚁灵波科技开源的交互式世界模型

LingBot-World 是蚂蚁灵波科技开源的交互式世界模型。模型通过可扩展数据引擎从大规模游戏环境学习物理规律与因果关系，实现动作驱动的精准生成。

AIプロジェクト2026/1/31

Qwen3-ASR - 阿里通义开源的系列语音识别模型

Qwen3-ASR 是阿里云通义千问团队开源的系列语音识别模型，包含 1.7B 高精度版、0.6B 高效版两个 ASR 模型，以及专用的 Qwen3-ForcedAligner-0.6B 强制对齐模型。

AIプロジェクト2026/1/31

SenseNova-MARS - 商汤科技开源的多模态自主推理模型

SenseNova-MARS是商汤科技开源的多模态自主推理模型，提供8B和32B两种参数规模。作为首个支持动态视觉推理与图文搜索深度融合的Agentic VLM，模型能像智能体...

AIプロジェクト2026/1/31

MOVA - 创智学院联合模思智能开源的端到端音视频模型

MOVA（MOSS Video and Audio）是上海创智学院OpenMOSS团队与模思智能（MOSI）联合推出的，中国首个高性能开源音视频端到端生成模型。模型突破传统视频'静音'...

AIプロジェクト2026/1/31

SkyReels-V3 - 昆仑万维开源的多模态视频生成模型

SkyReels-V3是昆仑万维开源的多模态视频生成模型，用单一架构实现专业级视频创作。模型能将静态图像转化为动态影像，支持智能延长视频时长和电影级转场，让数...

AIプロジェクト2026/1/30

LongCat-Flash-Lite - 美团LongCat开源的大语言模型

LongCat-Flash-Lite是美团推出的新一代高效大语言模型。模型采用创新的混合专家（MoE）+ N元语法嵌入架构，总参数量达685亿，每次推理仅激活约29~45亿参数，...

AIプロジェクト2026/1/30

MiniMax-M2-her - MiniMax推出的AI角色扮演模型

MiniMax-M2-her 是 MiniMax 专深度 AI 陪伴场景推出的角色扮演模型，是服务星野/Talkie 的底层模型。模型通过三大核心能力，独特的世界体验、有节奏的故事推...

AIプロジェクト2026/1/30

MiniMax Music 2.5 - MiniMax推出的AI音乐创作模型

MiniMax Music 2.5是MiniMax推出的新一代AI音乐创作模型，在「段落级强控制」与「物理级高保真」两大技术难题上实现突破。模型支持14种音乐结构标签（如前奏...

AIプロジェクト2026/1/30

Mureka V8 - 昆仑万维推出的AI音乐模型

Mureka V8是昆仑万维推出的AI音乐大模型，基于MusiCoT（Music Chain-of-Thought）技术架构，实现从声音拼接到类人创作逻辑的跨越。

AIプロジェクト2026/1/29

DeepSpeed-MII - 微软DeepSpeed开源的模型推理库

DeepSpeed-MII 是 DeepSpeed 团队开源的 Python 库，提供高效模型推理。DeepSpeed-MII用阻塞 KV 缓存、连续批处理和动态 SplitFuse 等创新手段，显著提高推理...

AIプロジェクト2026/1/29

Lucy 2 - Decart AI推出的实时视频生成模型

Lucy 2.0 是 Decart AI推出的实时世界转换模型，支持让高保真视频编辑从离线渲染跃升为可交互的实时体验。

AIプロジェクト2026/1/29

Earth-2 - 英伟达开源的AI气象预测模型家族

NVIDIA Earth-2 是英伟达推出的全球首套完全开源的 AI 气象预测模型家族，基于 Atlas、StormScope、HealDA 三大核心架构，分别实现 15 天全球中期预报、0-6 ...

AIプロジェクト2026/1/28

Kimi K2.5 - 月之暗面kimi开源的全新一代全能旗舰模型

Kimi K2.5 是月之暗面开源的全新一代全能旗舰模型，模型基于约 15T 视觉与文本数据训练而成，具备顶尖的代码生成、视觉理解能力，支持自主 Agent 集群协作，...

AIプロジェクト2026/1/28

DeepSeek-OCR 2 - DeepSeek团队开源的二代OCR模型

DeepSeek-OCR 2 是 DeepSeek 团队推出的第二代 OCR 模型，通过引入 DeepEncoder V2 架构，实现从固定扫描到语义推理的范式转变。模型采用因果流查询和双流注...

AIプロジェクト2026/1/28

LingBot-Depth - 蚂蚁灵波科技开源的空间感知模型

LingBot-Depth 是蚂蚁灵波科技开源的高精度空间感知模型，专为解决机器人在透明、反光物体（如玻璃）场景下的深度感知难题设计。

AIプロジェクト2026/1/28

Vidu Q2参考生Pro - Vidu推出的万物参考视频生成模型

Vidu Q2参考生Pro是全球首创的「万物可参考」视频模型，模型通过支持多模态输入（2个视频和4张图片），为创作者提供强大的功能。

←1...20 21 22 23 24 25 26...137 →

AIニュース

AIプロジェクト2026/2/4

GLM-OCR - 智谱开源的轻量级多模态OCR模型

GLM-OCR是智谱AI开源的轻量级多模态OCR模型，仅0.9B参数在OmniDocBench V1.5榜单以94.6分登顶SOTA。

AIプロジェクト2026/2/4

Thinker - 优必选开源的具身智能视觉语言模型

Thinker是优必选开源的具身智能视觉语言大模型，专为机器人场景打造。模型4B参数在9项权威基准测试中斩获全球第一。

AIプロジェクト2026/2/3

Happy - 开源AI编程远程控制工具，实时查看状态

AIプロジェクト2026/2/3

Step 3.5 Flash - 阶跃星辰最新开源的基座模型

AIプロジェクト2026/2/2

Vidu Q3 - 生数科技推出的音画同步AI视频模型

AIプロジェクト2026/2/1

UnifoLM-VLA-0 - 宇树开源的通用机器人操作大模型

UnifoLM-VLA-0 是宇树科技开源的通用视觉-语言-动作（VLA）大模型，基于 Qwen2.5-VL-7B 架构进行持续预训练。

AIプロジェクト2026/1/31

TTT-Discover - 斯坦福、英伟达推出的测试时强化学习方法

TTT-Discover（Test-Time Training to Discover）是斯坦福、英伟达等机构推出的AI科学发现方法。TTT-Discover在测试阶段对模型进行强化学习训练，非冻结权重...

AIプロジェクト2026/1/31

Project Genie - 谷歌推出的实验性AI世界模型原型

Project Genie 是谷歌 DeepMind 推出的实验性 AI 世界模型原型，基于 Genie 3、Nano Banana Pro 和 Gemini 技术驱动。用户通过文字提示或上传图片可创建虚拟...

AIプロジェクト2026/1/31

LingBot-World - 蚂蚁灵波科技开源的交互式世界模型

LingBot-World 是蚂蚁灵波科技开源的交互式世界模型。模型通过可扩展数据引擎从大规模游戏环境学习物理规律与因果关系，实现动作驱动的精准生成。

AIプロジェクト2026/1/31

Qwen3-ASR - 阿里通义开源的系列语音识别模型

Qwen3-ASR 是阿里云通义千问团队开源的系列语音识别模型，包含 1.7B 高精度版、0.6B 高效版两个 ASR 模型，以及专用的 Qwen3-ForcedAligner-0.6B 强制对齐模型。

AIプロジェクト2026/1/31

SenseNova-MARS - 商汤科技开源的多模态自主推理模型

AIプロジェクト2026/1/31

MOVA - 创智学院联合模思智能开源的端到端音视频模型

AIプロジェクト2026/1/31

SkyReels-V3 - 昆仑万维开源的多模态视频生成模型

AIプロジェクト2026/1/30

LongCat-Flash-Lite - 美团LongCat开源的大语言模型

AIプロジェクト2026/1/30

MiniMax-M2-her - MiniMax推出的AI角色扮演模型

AIプロジェクト2026/1/30

MiniMax Music 2.5 - MiniMax推出的AI音乐创作模型

AIプロジェクト2026/1/30

Mureka V8 - 昆仑万维推出的AI音乐模型

Mureka V8是昆仑万维推出的AI音乐大模型，基于MusiCoT（Music Chain-of-Thought）技术架构，实现从声音拼接到类人创作逻辑的跨越。

AIプロジェクト2026/1/29

DeepSpeed-MII - 微软DeepSpeed开源的模型推理库

DeepSpeed-MII 是 DeepSpeed 团队开源的 Python 库，提供高效模型推理。DeepSpeed-MII用阻塞 KV 缓存、连续批处理和动态 SplitFuse 等创新手段，显著提高推理...

AIプロジェクト2026/1/29

Lucy 2 - Decart AI推出的实时视频生成模型

Lucy 2.0 是 Decart AI推出的实时世界转换模型，支持让高保真视频编辑从离线渲染跃升为可交互的实时体验。

AIプロジェクト2026/1/29

Earth-2 - 英伟达开源的AI气象预测模型家族

NVIDIA Earth-2 是英伟达推出的全球首套完全开源的 AI 气象预测模型家族，基于 Atlas、StormScope、HealDA 三大核心架构，分别实现 15 天全球中期预报、0-6 ...

AIプロジェクト2026/1/28

Kimi K2.5 - 月之暗面kimi开源的全新一代全能旗舰模型

AIプロジェクト2026/1/28

DeepSeek-OCR 2 - DeepSeek团队开源的二代OCR模型

DeepSeek-OCR 2 是 DeepSeek 团队推出的第二代 OCR 模型，通过引入 DeepEncoder V2 架构，实现从固定扫描到语义推理的范式转变。模型采用因果流查询和双流注...

AIプロジェクト2026/1/28

LingBot-Depth - 蚂蚁灵波科技开源的空间感知模型

LingBot-Depth 是蚂蚁灵波科技开源的高精度空间感知模型，专为解决机器人在透明、反光物体（如玻璃）场景下的深度感知难题设计。

AIプロジェクト2026/1/28

Vidu Q2参考生Pro - Vidu推出的万物参考视频生成模型

Vidu Q2参考生Pro是全球首创的「万物可参考」视频模型，模型通过支持多模态输入（2个视频和4张图片），为创作者提供强大的功能。

すべてのカテゴリ

AIニュース

GLM-OCR - 智谱开源的轻量级多模态OCR模型

Thinker - 优必选开源的具身智能视觉语言模型

Happy - 开源AI编程远程控制工具，实时查看状态

Step 3.5 Flash - 阶跃星辰最新开源的基座模型

Vidu Q3 - 生数科技推出的音画同步AI视频模型

UnifoLM-VLA-0 - 宇树开源的通用机器人操作大模型

TTT-Discover - 斯坦福、英伟达推出的测试时强化学习方法

Project Genie - 谷歌推出的实验性AI世界模型原型

LingBot-World - 蚂蚁灵波科技开源的交互式世界模型

Qwen3-ASR - 阿里通义开源的系列语音识别模型

SenseNova-MARS - 商汤科技开源的多模态自主推理模型

MOVA - 创智学院联合模思智能开源的端到端音视频模型

SkyReels-V3 - 昆仑万维开源的多模态视频生成模型

LongCat-Flash-Lite - 美团LongCat开源的大语言模型

MiniMax-M2-her - MiniMax推出的AI角色扮演模型

MiniMax Music 2.5 - MiniMax推出的AI音乐创作模型

Mureka V8 - 昆仑万维推出的AI音乐模型

DeepSpeed-MII - 微软DeepSpeed开源的模型推理库

Lucy 2 - Decart AI推出的实时视频生成模型

Earth-2 - 英伟达开源的AI气象预测模型家族

Kimi K2.5 - 月之暗面kimi开源的全新一代全能旗舰模型

DeepSeek-OCR 2 - DeepSeek团队开源的二代OCR模型

LingBot-Depth - 蚂蚁灵波科技开源的空间感知模型

Vidu Q2参考生Pro - Vidu推出的万物参考视频生成模型

AIニュース

GLM-OCR - 智谱开源的轻量级多模态OCR模型

Thinker - 优必选开源的具身智能视觉语言模型

Happy - 开源AI编程远程控制工具，实时查看状态

Step 3.5 Flash - 阶跃星辰最新开源的基座模型

Vidu Q3 - 生数科技推出的音画同步AI视频模型

UnifoLM-VLA-0 - 宇树开源的通用机器人操作大模型

TTT-Discover - 斯坦福、英伟达推出的测试时强化学习方法

Project Genie - 谷歌推出的实验性AI世界模型原型

LingBot-World - 蚂蚁灵波科技开源的交互式世界模型

Qwen3-ASR - 阿里通义开源的系列语音识别模型

SenseNova-MARS - 商汤科技开源的多模态自主推理模型

MOVA - 创智学院联合模思智能开源的端到端音视频模型

SkyReels-V3 - 昆仑万维开源的多模态视频生成模型

LongCat-Flash-Lite - 美团LongCat开源的大语言模型

MiniMax-M2-her - MiniMax推出的AI角色扮演模型

MiniMax Music 2.5 - MiniMax推出的AI音乐创作模型

Mureka V8 - 昆仑万维推出的AI音乐模型

DeepSpeed-MII - 微软DeepSpeed开源的模型推理库

Lucy 2 - Decart AI推出的实时视频生成模型

Earth-2 - 英伟达开源的AI气象预测模型家族

Kimi K2.5 - 月之暗面kimi开源的全新一代全能旗舰模型

DeepSeek-OCR 2 - DeepSeek团队开源的二代OCR模型

LingBot-Depth - 蚂蚁灵波科技开源的空间感知模型

Vidu Q2参考生Pro - Vidu推出的万物参考视频生成模型