AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2026/6/5

Ideogram 4 - Ideogram 开源的文本到图像生成模型

Ideogram 4 是 Ideogram 推出的首个开源文本到图像生成模型，拥有 93 亿参数，从头训练非基于现有模型微调。模型专为高质量图像生成而设计，尤其在设计、营销...

AIプロジェクト2026/6/4

MAI Transcribe-1.5 - 微软 MAI 推出的语音转文本模型

MAI-Transcribe-1.5 是微软 AI 团队自研的语音转文本模型，支持 43 种语言，具备上下文感知的关键词偏置能力，模型在 FLEURS 基准测试中取得行业最低的词错...

AIプロジェクト2026/6/4

MAI-Voice-2 - 微软推出的新一代文本转语音模型

MAI-Voice-2 是微软推出的新一代文本转语音（TTS）模型，是微软迄今最具表现力和自然感的语音合成模型。相比前代在保真度、语言覆盖、说话人一致性和情感范围...

AIプロジェクト2026/6/4

MAI-Code-1-Flash - 微软推出的轻量级代码生成模型

MAI-Code-1-Flash 是微软专为开发者工作流推出的轻量级代码生成模型，深度集成 GitHub Copilot。模型采用自适应输出长度控制技术，在保持高准确率的同时最高...

AIプロジェクト2026/6/4

Odysseus - 开源的本地自托管 AI 工作空间

Odysseus 是开源自托管的 AI 工作空间，提供类似 ChatGPT / Claude 的聊天界面，工具完全本地化运行，数据不出本机、隐私零泄露。

AIプロジェクト2026/6/4

PaddleOCR-VL-1.6 - 百度推出的文档解析视觉语言模型

PaddleOCR-VL-1.6 是百度飞桨团队推出的文档解析视觉语言模型（VLM），是 PaddleOCR-VL 系列的最新升级版本。

AIプロジェクト2026/6/4

Bernini - 字节跳动开源的统一视频生成与编辑框架

Bernini 是字节跳动开源的统一视频生成与编辑框架，采用MLLM 语义规划 + DiT 视觉渲染的两阶段解耦架构。多模态大模型理解指令并规划语义草图，由 Diffusion ...

AIプロジェクト2026/6/4

Science Skills - 谷歌 DeepMind 开源的科研技能工具包

Science Skills 是谷歌 DeepMind 推出的开源科学技能集合，专为加速 AI Agent 驱动的科学研究工作流设计。工具整合 AlphaGenome、AlphaFold Database、UniPro...

AIプロジェクト2026/6/4

MAI-Thinking-1 - 微软推出的首款自研高级推理模型

MAI-Thinking-1 是微软推出的首款自研高级推理模型。模型采用 35B 活跃参数 / 约 1T 总参数的稀疏 MoE 架构，完全基于干净、商业授权数据从头训练，未使用任...

AIプロジェクト2026/6/3

OpenClacky - 李亚飞团队开源的低成本 AI Agent

OpenClacky 是李亚飞团队开源的 AI Agent，支持一键安装与跨平台运行。工具通过精简工具集、智能上下文压缩和模型路由大幅降低使用成本，让专业人士能全天开...

AIプロジェクト2026/6/3

Mellum2 - JetBrains 开源的混合专家模型

Mellum2 是 JetBrains 开源的面向软件工程系统的新机器学习模型。模型每 token 仅激活 2.5B 参数，专为软件工程 AI 工作流优化，支持代码生成、智能路由、子 ...

AIプロジェクト2026/6/3

ECC - 开源的跨平台 AI Agent 性能优化系统

ECC（Everything Claude Code）是跨平台 AI Agent 性能优化系统。系统为 Claude Code、Codex、Cursor 等 7+ 个 AI 编程工具提供 63 个专业 Agent、249 个按需...

AIプロジェクト2026/6/3

Polar - 英伟达开源的智能体强化学习训练框架

Polar 是英伟达推出的开源智能体强化学习（Agentic RL）训练框架，核心创新在于无需修改现有智能体框架内部代码，可将其接入 GRPO 等 RL 算法进行训练。

AIプロジェクト2026/6/3

Qwen3.7-Plus - 阿里通义推出的智能体多模态大模型

Qwen3.7-Plus 是通义千问推出的新一代多模态大模型，将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代...

AIプロジェクト2026/6/2

Hermes Desktop - Hermes Agent 的桌面应用，开箱即用

Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、hermes-agent 核心与 hermes-web-ui 可视化界面打包为单一可执行文...

AIプロジェクト2026/6/2

Gamma-World - 英伟达推出的多智能体世界模型

Gamma-World 是 NVIDIA 推出的多智能体世界模型，能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。

AIプロジェクト2026/6/2

Dubbing v2 - ElevenLabs 推出的 AI 配音模型

Dubbing v2 是 ElevenLabs 推出的 AI 配音模型，支持 29 种语言自动翻译配音，保留原始说话人音色与情感。模型提供双工作流模式，Auto Dub 快速生成预览，Dub...

AIプロジェクト2026/6/2

Cosmos 3 - 英伟达开源的全模态物理 AI 基础大模型

Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型，采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能力。

AIプロジェクト2026/6/2

MiniMax M3 - MiniMax 推出的新一代 AI 模型

MiniMax M3是MiniMax推出的全新AI模型，具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构，支持1M超长上下文，效率提升20倍。

AIプロジェクト2026/6/2

Qwen-VLA - 阿里通义推出的通用视觉-语言-动作模型

Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型，以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT 动作解码器。模型通过统一动作轨迹预测框架，将...

AIプロジェクト2026/6/2

Webwright - 微软开源的终端原生网页智能体框架

Webwright 是微软研究院开源的终端原生网页智能体框架，仅需约 1000 行代码可让 AI 模型在终端中编写 Playwright 代码、执行 bash 命令、查看日志并反复修正...

AIプロジェクト2026/6/2

ControlFoley - 小米开源的可控视频音效生成模型

ControlFoley是小米开源的可控视频音效生成模型，能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频配音任务，通过自研时空音...

AIプロジェクト2026/5/31

美团GEO营销门户 - 美团推出的生成式引擎优化平台

美团 GEO 营销门户是美团推出的生成式引擎优化（GEO）平台，专为 AI 搜索时代设计，帮助品牌在豆包、DeepSeek、文心一言等主流大模型中提升曝光与推荐频次。...

AIプロジェクト2026/5/31

SenseNova-U1-8B-MoT-Infographic - 商汤科技开源的信息图增强模型

SenseNova-U1-8B-MoT-Infographic 是商汤科技开源的 8B 参数信息图增强模型，基于 SenseNova-U1-8B-MoT 统一架构，通过专项数据训练与 RL 强化学习，显著提升...

←1...4 5 6 7 8 9 10...137 →

AIニュース

AIプロジェクト2026/6/5

Ideogram 4 - Ideogram 开源的文本到图像生成模型

AIプロジェクト2026/6/4

MAI Transcribe-1.5 - 微软 MAI 推出的语音转文本模型

AIプロジェクト2026/6/4

MAI-Voice-2 - 微软推出的新一代文本转语音模型

AIプロジェクト2026/6/4

MAI-Code-1-Flash - 微软推出的轻量级代码生成模型

AIプロジェクト2026/6/4

Odysseus - 开源的本地自托管 AI 工作空间

Odysseus 是开源自托管的 AI 工作空间，提供类似 ChatGPT / Claude 的聊天界面，工具完全本地化运行，数据不出本机、隐私零泄露。

AIプロジェクト2026/6/4

PaddleOCR-VL-1.6 - 百度推出的文档解析视觉语言模型

PaddleOCR-VL-1.6 是百度飞桨团队推出的文档解析视觉语言模型（VLM），是 PaddleOCR-VL 系列的最新升级版本。

AIプロジェクト2026/6/4

Bernini - 字节跳动开源的统一视频生成与编辑框架

AIプロジェクト2026/6/4

Science Skills - 谷歌 DeepMind 开源的科研技能工具包

Science Skills 是谷歌 DeepMind 推出的开源科学技能集合，专为加速 AI Agent 驱动的科学研究工作流设计。工具整合 AlphaGenome、AlphaFold Database、UniPro...

AIプロジェクト2026/6/4

MAI-Thinking-1 - 微软推出的首款自研高级推理模型

AIプロジェクト2026/6/3

OpenClacky - 李亚飞团队开源的低成本 AI Agent

AIプロジェクト2026/6/3

Mellum2 - JetBrains 开源的混合专家模型

AIプロジェクト2026/6/3

ECC - 开源的跨平台 AI Agent 性能优化系统

ECC（Everything Claude Code）是跨平台 AI Agent 性能优化系统。系统为 Claude Code、Codex、Cursor 等 7+ 个 AI 编程工具提供 63 个专业 Agent、249 个按需...

AIプロジェクト2026/6/3

Polar - 英伟达开源的智能体强化学习训练框架

Polar 是英伟达推出的开源智能体强化学习（Agentic RL）训练框架，核心创新在于无需修改现有智能体框架内部代码，可将其接入 GRPO 等 RL 算法进行训练。

AIプロジェクト2026/6/3

Qwen3.7-Plus - 阿里通义推出的智能体多模态大模型

AIプロジェクト2026/6/2

Hermes Desktop - Hermes Agent 的桌面应用，开箱即用

Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、hermes-agent 核心与 hermes-web-ui 可视化界面打包为单一可执行文...

AIプロジェクト2026/6/2

Gamma-World - 英伟达推出的多智能体世界模型

Gamma-World 是 NVIDIA 推出的多智能体世界模型，能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。

AIプロジェクト2026/6/2

Dubbing v2 - ElevenLabs 推出的 AI 配音模型

AIプロジェクト2026/6/2

Cosmos 3 - 英伟达开源的全模态物理 AI 基础大模型

Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型，采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能力。

AIプロジェクト2026/6/2

MiniMax M3 - MiniMax 推出的新一代 AI 模型

MiniMax M3是MiniMax推出的全新AI模型，具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构，支持1M超长上下文，效率提升20倍。

AIプロジェクト2026/6/2

Qwen-VLA - 阿里通义推出的通用视觉-语言-动作模型

AIプロジェクト2026/6/2

Webwright - 微软开源的终端原生网页智能体框架

AIプロジェクト2026/6/2

ControlFoley - 小米开源的可控视频音效生成模型

AIプロジェクト2026/5/31

美团GEO营销门户 - 美团推出的生成式引擎优化平台

AIプロジェクト2026/5/31

SenseNova-U1-8B-MoT-Infographic - 商汤科技开源的信息图增强模型

SenseNova-U1-8B-MoT-Infographic 是商汤科技开源的 8B 参数信息图增强模型，基于 SenseNova-U1-8B-MoT 统一架构，通过专项数据训练与 RL 强化学习，显著提升...

すべてのカテゴリ

AIニュース

Ideogram 4 - Ideogram 开源的文本到图像生成模型

MAI Transcribe-1.5 - 微软 MAI 推出的语音转文本模型

MAI-Voice-2 - 微软推出的新一代文本转语音模型

MAI-Code-1-Flash - 微软推出的轻量级代码生成模型

Odysseus - 开源的本地自托管 AI 工作空间

PaddleOCR-VL-1.6 - 百度推出的文档解析视觉语言模型

Bernini - 字节跳动开源的统一视频生成与编辑框架

Science Skills - 谷歌 DeepMind 开源的科研技能工具包

MAI-Thinking-1 - 微软推出的首款自研高级推理模型

OpenClacky - 李亚飞团队开源的低成本 AI Agent

Mellum2 - JetBrains 开源的混合专家模型

ECC - 开源的跨平台 AI Agent 性能优化系统

Polar - 英伟达开源的智能体强化学习训练框架

Qwen3.7-Plus - 阿里通义推出的智能体多模态大模型

Hermes Desktop - Hermes Agent 的桌面应用，开箱即用

Gamma-World - 英伟达推出的多智能体世界模型

Dubbing v2 - ElevenLabs 推出的 AI 配音模型

Cosmos 3 - 英伟达开源的全模态物理 AI 基础大模型

MiniMax M3 - MiniMax 推出的新一代 AI 模型

Qwen-VLA - 阿里通义推出的通用视觉-语言-动作模型

Webwright - 微软开源的终端原生网页智能体框架

ControlFoley - 小米开源的可控视频音效生成模型

美团GEO营销门户 - 美团推出的生成式引擎优化平台

SenseNova-U1-8B-MoT-Infographic - 商汤科技开源的信息图增强模型

AIニュース

Ideogram 4 - Ideogram 开源的文本到图像生成模型

MAI Transcribe-1.5 - 微软 MAI 推出的语音转文本模型

MAI-Voice-2 - 微软推出的新一代文本转语音模型

MAI-Code-1-Flash - 微软推出的轻量级代码生成模型

Odysseus - 开源的本地自托管 AI 工作空间

PaddleOCR-VL-1.6 - 百度推出的文档解析视觉语言模型

Bernini - 字节跳动开源的统一视频生成与编辑框架

Science Skills - 谷歌 DeepMind 开源的科研技能工具包

MAI-Thinking-1 - 微软推出的首款自研高级推理模型

OpenClacky - 李亚飞团队开源的低成本 AI Agent

Mellum2 - JetBrains 开源的混合专家模型

ECC - 开源的跨平台 AI Agent 性能优化系统

Polar - 英伟达开源的智能体强化学习训练框架

Qwen3.7-Plus - 阿里通义推出的智能体多模态大模型

Hermes Desktop - Hermes Agent 的桌面应用，开箱即用

Gamma-World - 英伟达推出的多智能体世界模型

Dubbing v2 - ElevenLabs 推出的 AI 配音模型

Cosmos 3 - 英伟达开源的全模态物理 AI 基础大模型

MiniMax M3 - MiniMax 推出的新一代 AI 模型

Qwen-VLA - 阿里通义推出的通用视觉-语言-动作模型

Webwright - 微软开源的终端原生网页智能体框架

ControlFoley - 小米开源的可控视频音效生成模型

美团GEO营销门户 - 美团推出的生成式引擎优化平台

SenseNova-U1-8B-MoT-Infographic - 商汤科技开源的信息图增强模型