AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2026/6/26

SkillOpt - 微软开源的Agent技能文档优化工具

SkillOpt是微软开源的Agent技能文档优化工具。工具将深度学习训练逻辑引入文本空间，把skill.md视为可训练参数，通过轨迹分析生成编辑方向，用文本学习率约束...

AIプロジェクト2026/6/26

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

Confucius4-TTS 是网易有道开源的 1.3B 参数多语言语音合成引擎。模型只需 3 秒参考音频可零样本克隆音色，无需参考文本，支持中、英、日、韩等 14 种语言跨...

AIプロジェクト2026/6/26

MMSkills - 上海交大与小红书联合推出的多模态技能框架

MMSkills 是上海交通大学与小红书联合推出的面向通用视觉 Agent 的多模态技能框架，支持将可复用技能从纯文本步骤扩展为包含文本流程、运行时状态卡片和多视...

AIプロジェクト2026/6/25

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

豆包音频生成模型1.0是火山引擎推出的端到端音频创作模型，支持文本或音频作为参考输入生成目标音频。模型单条Prompt可编排多角色对白、情绪语气、背景音乐与...

AIプロジェクト2026/6/25

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

Baichuan-M4是百川智能联合清华大学推出的新一代医疗增强大模型，在 HealthBench 综合、Hard、Professional 三个权威榜单同时位列世界第一，幻觉率低至 3.3% ...

AIプロジェクト2026/6/25

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

JoyAI-VL-Interaction 是京东 Joy Future Academy 开源的实时视频视觉语言交互模型，是全球首个全栈开源的 interaction 模型系统。

AIプロジェクト2026/6/25

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

Qwen-AgentWorld 是通义千问团队推出的首个语言世界模型，通过长思维链推理模拟 MCP、搜索、终端、软件工程、Android、Web、操作系统共 7 大智能体环境。

AIプロジェクト2026/6/24

Seedance 2.5 - 字节跳动推出的最新视频生成模型

Seedance 2.5 是字节跳动旗下豆包视频生成模型的最新旗舰版本，预计 7 月初全面上线。作为 Seedance 2.0 的重大升级，模型实现了三大全球突破，单段原生视频...

AIプロジェクト2026/6/24

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

Unlimited-OCR 是百度推出的端到端长文档 OCR 模型，通过 Reference Sliding Window Attention机制将解码器 KV cache 从线性增长压缩为常数，实现单次前向转...

AIプロジェクト2026/6/24

AudioX-Turbo - Noiz AI 联合清华推出的音频生成框架

AudioX-Turbo 是 Noiz AI 联合香港科技大学、清华大学推出的统一高效音频生成框架，支持文本、视频、音频任意组合输入生成高质量音效与音乐。

AIプロジェクト2026/6/24

Boogu-Image-0.1 - Boogu开源的统一图像生成与编辑模型

Boogu-Image-0.1 是 Boogu 团队开源的统一图像生成与编辑模型家族。模型在同一架构下同时支持文生图、指令式图像编辑及中英双语文本渲染，家族包含 Base、Edi...

AIプロジェクト2026/6/24

Spatial-TTT - 清华联合混元开源的流式视觉空间智能框架

Spatial-TTT 是清华大学、腾讯混元与南洋理工大学联合推出的流式视觉空间智能框架。框架仅 2B 参数，通过 Test-Time Training（TTT）技术，在观看视频流的过...

AIプロジェクト2026/6/24

豆包2.1 - 字节跳动推出的全新智能体模型系列

Seed 2.1 是字节跳动 Seed 团队推出的面向真实生产力场景的全新智能体模型系列，包含 Pro 与 Turbo 两个版本。

AIプロジェクト2026/6/23

VidMuse - Sand.ai 推出的 AI 音乐视频 Agent

VidMuse 是 Sand.ai 推出的 AI 音乐视频 Agent。用户只需上传 Suno 链接或 MP3 文件，可自动生成 30–60 秒的音乐视频。VidMuse 2.0 基于Video as Code理念，...

AIプロジェクト2026/6/23

HappyHorse 1.1 - 阿里推出的升级版AI视频生成模型

HappyHorse 1.1是阿里最新上线的AI视频生成模型升级版，较 1.0 版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力五大维度实现系统性升级。

AIプロジェクト2026/6/23

Skill Zoo - 面向 Coding Agent 的一站式桌面技能管理工具

Skill Zoo 是面向 Coding Agent 的一站式桌面技能管理工具。工具通过 SSOT+ 软链接架构，统一管理分散在 Claude Code、Codex、Trae CN、Hermes 等编程工具中...

AIプロジェクト2026/6/23

Cowart - 开源的本地无限画布插件，让 Codex 看图说话

Cowart是豆包桌面端产品经理钟二信开源的面向 OpenAI Codex 的本地无限画布插件。工具基于 tldraw 框架构建可视化画布，让 Codex 在本地电子白板上摆放图片、...

AIプロジェクト2026/6/23

Xiaomi Miloco 2.0 - 小米开源的全屋智能 AI 方案

Xiaomi Miloco 2.0 是小米基于 MiMo-V2.5-Pro 大模型推出的开源全屋智能 AI 方案，通过 OpenClaw 以 Agent 形式接入，实现多模态感知、主动智能、持续任务与...

AIプロジェクト2026/6/23

Sakana Fugu - Sakana AI 推出的多智能体编排系统

Sakana Fugu是Sakana AI推出的多智能体编排系统，用单一API动态调度顶尖模型。系统分配思考者、执行者与验证者角色，自动完成选择、委派与合成，无需预设工作...

AIプロジェクト2026/6/23

SpatialClaw - 英伟达联合 KAIST 推出的免训练空间推理框架

SpatialClaw 是 NVIDIA Research 与 KAIST 联合推出的免训练空间推理框架，通过代码即动作机制在持久化 Python 内核中迭代执行复杂 3D/4D 空间推理任务，在 2...

AIプロジェクト2026/6/22

MaineCoon - AI 实时音视频世界模型，专为社交互动场景

MaineCoon 是全球首个专为社交互动场景优化的实时音视频自回归世界模型。模型拥有 220 亿参数，能在单 GPU 上实现47.5 FPS 的实时流式生成，支持亚秒级交互响...

AIプロジェクト2026/6/21

LOGOS - 阿里开源的首个统一科学大模型

LOGOS（Language Of Generative Objects in Science）是阿里 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源的首个统一科学语法多领域科学生成基础...

AIプロジェクト2026/6/21

EchoBird - 开源 AI Agent 桌面管理工具

EchoBird 是开源 AI Agent 桌面管理工具，基于 Tauri + Rust 开发。工具通过 Model Nexus 模型中心，将 Claude Code、Codex、OpenClaw 等 12+ 款 Agent 的安...

AIプロジェクト2026/6/19

Grok Imagine Video 1.5 - xAI 推出的图生视频模型

Grok Imagine Video 1.5 是 xAI 推出的图生视频模型，模型基于 Aurora 自回归引擎构建。模型支持静态图一键生成带原生同步音频的短视频，最高 720p 分辨率，F...

←1 2 3 4 5 6 7...137 →

AIニュース

AIプロジェクト2026/6/26

SkillOpt - 微软开源的Agent技能文档优化工具

AIプロジェクト2026/6/26

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

AIプロジェクト2026/6/26

MMSkills - 上海交大与小红书联合推出的多模态技能框架

AIプロジェクト2026/6/25

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

AIプロジェクト2026/6/25

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

Baichuan-M4是百川智能联合清华大学推出的新一代医疗增强大模型，在 HealthBench 综合、Hard、Professional 三个权威榜单同时位列世界第一，幻觉率低至 3.3% ...

AIプロジェクト2026/6/25

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

JoyAI-VL-Interaction 是京东 Joy Future Academy 开源的实时视频视觉语言交互模型，是全球首个全栈开源的 interaction 模型系统。

AIプロジェクト2026/6/25

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

Qwen-AgentWorld 是通义千问团队推出的首个语言世界模型，通过长思维链推理模拟 MCP、搜索、终端、软件工程、Android、Web、操作系统共 7 大智能体环境。

AIプロジェクト2026/6/24

Seedance 2.5 - 字节跳动推出的最新视频生成模型

AIプロジェクト2026/6/24

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

Unlimited-OCR 是百度推出的端到端长文档 OCR 模型，通过 Reference Sliding Window Attention机制将解码器 KV cache 从线性增长压缩为常数，实现单次前向转...

AIプロジェクト2026/6/24

AudioX-Turbo - Noiz AI 联合清华推出的音频生成框架

AudioX-Turbo 是 Noiz AI 联合香港科技大学、清华大学推出的统一高效音频生成框架，支持文本、视频、音频任意组合输入生成高质量音效与音乐。

AIプロジェクト2026/6/24

Boogu-Image-0.1 - Boogu开源的统一图像生成与编辑模型

AIプロジェクト2026/6/24

Spatial-TTT - 清华联合混元开源的流式视觉空间智能框架

AIプロジェクト2026/6/24

豆包2.1 - 字节跳动推出的全新智能体模型系列

Seed 2.1 是字节跳动 Seed 团队推出的面向真实生产力场景的全新智能体模型系列，包含 Pro 与 Turbo 两个版本。

AIプロジェクト2026/6/23

VidMuse - Sand.ai 推出的 AI 音乐视频 Agent

VidMuse 是 Sand.ai 推出的 AI 音乐视频 Agent。用户只需上传 Suno 链接或 MP3 文件，可自动生成 30–60 秒的音乐视频。VidMuse 2.0 基于Video as Code理念，...

AIプロジェクト2026/6/23

HappyHorse 1.1 - 阿里推出的升级版AI视频生成模型

AIプロジェクト2026/6/23

Skill Zoo - 面向 Coding Agent 的一站式桌面技能管理工具

Skill Zoo 是面向 Coding Agent 的一站式桌面技能管理工具。工具通过 SSOT+ 软链接架构，统一管理分散在 Claude Code、Codex、Trae CN、Hermes 等编程工具中...

AIプロジェクト2026/6/23

Cowart - 开源的本地无限画布插件，让 Codex 看图说话

AIプロジェクト2026/6/23

Xiaomi Miloco 2.0 - 小米开源的全屋智能 AI 方案

Xiaomi Miloco 2.0 是小米基于 MiMo-V2.5-Pro 大模型推出的开源全屋智能 AI 方案，通过 OpenClaw 以 Agent 形式接入，实现多模态感知、主动智能、持续任务与...

AIプロジェクト2026/6/23

Sakana Fugu - Sakana AI 推出的多智能体编排系统

AIプロジェクト2026/6/23

SpatialClaw - 英伟达联合 KAIST 推出的免训练空间推理框架

SpatialClaw 是 NVIDIA Research 与 KAIST 联合推出的免训练空间推理框架，通过代码即动作机制在持久化 Python 内核中迭代执行复杂 3D/4D 空间推理任务，在 2...

AIプロジェクト2026/6/22

MaineCoon - AI 实时音视频世界模型，专为社交互动场景

AIプロジェクト2026/6/21

LOGOS - 阿里开源的首个统一科学大模型

LOGOS（Language Of Generative Objects in Science）是阿里 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源的首个统一科学语法多领域科学生成基础...

AIプロジェクト2026/6/21

EchoBird - 开源 AI Agent 桌面管理工具

EchoBird 是开源 AI Agent 桌面管理工具，基于 Tauri + Rust 开发。工具通过 Model Nexus 模型中心，将 Claude Code、Codex、OpenClaw 等 12+ 款 Agent 的安...

AIプロジェクト2026/6/19

すべてのカテゴリ

AIニュース

SkillOpt - 微软开源的Agent技能文档优化工具

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

MMSkills - 上海交大与小红书联合推出的多模态技能框架

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

Seedance 2.5 - 字节跳动推出的最新视频生成模型

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

AudioX-Turbo - Noiz AI 联合清华推出的音频生成框架

Boogu-Image-0.1 - Boogu开源的统一图像生成与编辑模型

Spatial-TTT - 清华联合混元开源的流式视觉空间智能框架

豆包2.1 - 字节跳动推出的全新智能体模型系列

VidMuse - Sand.ai 推出的 AI 音乐视频 Agent

HappyHorse 1.1 - 阿里推出的升级版AI视频生成模型

Skill Zoo - 面向 Coding Agent 的一站式桌面技能管理工具

Cowart - 开源的本地无限画布插件，让 Codex 看图说话

Xiaomi Miloco 2.0 - 小米开源的全屋智能 AI 方案

Sakana Fugu - Sakana AI 推出的多智能体编排系统

SpatialClaw - 英伟达联合 KAIST 推出的免训练空间推理框架

MaineCoon - AI 实时音视频世界模型，专为社交互动场景

LOGOS - 阿里开源的首个统一科学大模型

EchoBird - 开源 AI Agent 桌面管理工具

Grok Imagine Video 1.5 - xAI 推出的图生视频模型

AIニュース

SkillOpt - 微软开源的Agent技能文档优化工具

Confucius4-TTS - 网易有道开源的多语言语音合成引擎

MMSkills - 上海交大与小红书联合推出的多模态技能框架

豆包音频生成模型1.0 - 火山引擎推出的端到端音频创作模型

Baichuan-M4 - 百川智能联合清华推出的医疗增强模型

JoyAI-VL-Interaction - 京东开源的实时视频视觉语言交互模型

Qwen-AgentWorld - 通义千问推出的原生语言世界模型

Seedance 2.5 - 字节跳动推出的最新视频生成模型

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

AudioX-Turbo - Noiz AI 联合清华推出的音频生成框架

Boogu-Image-0.1 - Boogu开源的统一图像生成与编辑模型

Spatial-TTT - 清华联合混元开源的流式视觉空间智能框架

豆包2.1 - 字节跳动推出的全新智能体模型系列

VidMuse - Sand.ai 推出的 AI 音乐视频 Agent

HappyHorse 1.1 - 阿里推出的升级版AI视频生成模型

Skill Zoo - 面向 Coding Agent 的一站式桌面技能管理工具

Cowart - 开源的本地无限画布插件，让 Codex 看图说话

Xiaomi Miloco 2.0 - 小米开源的全屋智能 AI 方案

Sakana Fugu - Sakana AI 推出的多智能体编排系统

SpatialClaw - 英伟达联合 KAIST 推出的免训练空间推理框架

MaineCoon - AI 实时音视频世界模型，专为社交互动场景

LOGOS - 阿里开源的首个统一科学大模型

EchoBird - 开源 AI Agent 桌面管理工具

Grok Imagine Video 1.5 - xAI 推出的图生视频模型