AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2026/1/12

Obsidian-skills - Obsidian推出的开源AI工具包

Obsidian-skills 是 Obsidian 团队开发的一组开源工具，帮助用户更好地将 AI 工具（如 Claude Code）与 Obsidian 笔记系统结合使用。包含三大核心技能：obsid...

AIプロジェクト2026/1/12

DeepTutor - 香港大学开源的AI学习助手

DeepTutor 是香港大学数据科学实验室开源的 AI 学习助手，通过多智能体架构和知识图谱技术，将复杂的知识体系转化为高效的学习体验。

AIプロジェクト2026/1/12

Nemotron Speech ASR - 英伟达开源的语音识别模型

Nemotron Speech ASR 是英伟达开源的专注于低延迟、实时流式语音识别的模型。通过缓存感知架构，将已处理的语音特征缓存，仅对新音频帧进行计算，实现单句转...

AIプロジェクト2026/1/12

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

FantasyWorld是高德地图（AMAP）和北京邮电大学合作开发的创新性3D世界建模框架，专注于通过统一的视频和3D预测生成高质量的3D场景。框架通过在冻结的视频基...

AIプロジェクト2026/1/10

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

Qwen3-VL-Embedding 是阿里通义推出的多模态信息检索模型，专为处理文本、图像、可视化文档和视频等多种模态输入而设计。模型基于强大的 Qwen3-VL 架构，能将...

AIプロジェクト2026/1/10

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

Qwen3-VL-Reranker 是阿里通义基于 Qwen3-VL 构建的跨模态理解模型，专为多模态信息检索设计。模型接收任意模态组合的查询与文档对（如图文查询匹配图文文档...

AIプロジェクト2026/1/10

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

VoiceSculptor 是西北工业大学、语图智能等机构推出的音色设计模型，能通过自然语言指令实现对语音合成的细粒度控制。

AIプロジェクト2026/1/10

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

ChatDev 2.0 是清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具。工具通过可视化交互，让用户通过“拖拽 + 配置”快速构建多智能...

AIプロジェクト2026/1/9

EvoCUA - 美团开源的通用多模态计算机操作模型

EvoCUA（Evolving Computer Use Agent）是美团开源的多模态模型，专注于计算机使用自动化任务。EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、Power...

AIプロジェクト2026/1/9

MMSI-Video-Bench - 上海AI Lab推出的空间智能视频基准

MMSI-Video-Bench 是用于评估多模态大语言模型（MLLMs）在视频空间智能方面能力的基准测试工具。由上海人工智能实验室等多所高校联合推出，全面评估模型在真...

AIプロジェクト2026/1/9

Youtu-LLM - 腾讯Youtu团队开源的轻量级语言模型

Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型，参数规模为 19.6 亿。专为智能体任务设计，具备强大的“原生智能体能力”，在多项任务中超越同规模甚至更大...

AIプロジェクト2026/1/8

OS-Copilot - 上海AI Lab开源的通用操作系统AI Agent

OS-Copilot是开源的操作系统智能助手项目，为构建能与操作系统中各种元素（如网络、代码终端、文件、多媒体和第三方应用）交互的通用计算机智能体。核心是FRI...

AIプロジェクト2026/1/8

10Kh RealOmni-Open - Gen Robot.AI开源的具身智能数据集

10Kh RealOmni-Open是Gen Robot.AI团队开源的具身智能数据集，是目前行业内规模最大的开源数据集之一。包含超过10000小时的数据、100万+任务剪辑，存储总量达...

AIプロジェクト2026/1/8

UI-TARS Desktop - 字节开源的桌面AI GUI智能体工具

UI-TARS Desktop 是字节跳动开源的基于视觉语言模型的桌面自动化工具。支持通过自然语言指令控制电脑操作，如打开文件、浏览网页、操作软件等，能精准识别屏...

AIプロジェクト2026/1/7

Open Interpreter - 开源AI终端助手，本地环境执行代码

Open Interpreter 是开源的AI终端助手项目，为大型语言模型（LLM）提供本地代码运行能力。通过自然语言交互界面，用户可以通过类似 ChatGPT 的方式在终端中与...

AIプロジェクト2026/1/7

TeleChat3 - 中国电信推出的千亿参数MoE语义大模型

TeleChat3是中国电信人工智能研究院（TeleAI）自主研发的千亿参数细粒度MoE语义大模型，采用国产算力训练，支持多轮对话、文本创作、代码生成等任务。模型包...

AIプロジェクト2026/1/6

openPangu-VL-7B - 华为开源的多模态模型

openPangu-VL-7B 是华为推出的开源多模态模型，专为昇腾硬件优化。模型结合语言和视觉能力，具备强大的视觉定位和OCR功能，能高效处理图像、文档和视频任务。

AIプロジェクト2026/1/6

MiroThinker v1.5 - MiroMind推出的开源搜索Agent模型

MiroThinker v1.5 是 MiroMind 团队开源的搜索智能体模型。模型通过交互式扩展技术，将推理与外部环境深度耦合，打破传统大模型依赖庞大参数的局限。

AIプロジェクト2026/1/6

TuriX-CUA - 开源AI桌面Agent，自动进行屏幕识别和操作

TuriX-CUA 是基于 Python 开源的 AI 智能体，能通过 AI 技术实现桌面自动化操作。TuriX-CUA 通过截屏“看”屏幕，用多模态大模型“思考”下一步操作，完成用户指...

AIプロジェクト2026/1/6

DLCM - 字节跳动推出的动态大概念模型框架

DLCM（Dynamic Large Concept Models）是字节Seed团队推出的新型大语言模型架构。框架将模型的推理单位从传统的token（词）提升到concept（概念）层级，通过...

AIプロジェクト2026/1/6

Paper2Any - 北大推出的多模态AI科研PPT生成辅助平台

Paper2Any是北京大学DCAI课题组推出的开源多模态AI辅助平台，基于自动化数据治理Agent框架DataFlow-Agent，能将科研论文自动转化为可编辑的PPT和SVG文件。支...

AIプロジェクト2026/1/5

OpenCode - 开源AI编程工具，支持终端、桌面和IDE插件

OpenCode 是开源的 AI 编程助手，能提升开发效率和代码质量。工具以终端界面、桌面应用或 IDE 插件的形式存在，通过与多种语言模型（LLM）提供商集成，为开发...

AIプロジェクト2026/1/5

StoryMem - 字节联合南洋理工推出的视频生成框架

StoryMem 是字节跳动与南洋理工大学联合发布的开源视频生成框架，解决 AI 视频生成中长期存在的跨镜头一致性问题。通过显式视觉记忆机制，将单镜头视频扩散模...

AIプロジェクト2026/1/5

Voquill - 开源AI语音输入工具，自动智能文本清理

Voquill是开源的语音输入工具，通过语音输入替代传统键盘打字，提升写作和记录效率。支持macOS、Windows和Linux系统，可在任何文本框和应用程序中使用，实现...

←1...23 24 25 26 27 28 29...137 →

AIニュース

AIプロジェクト2026/1/12

Obsidian-skills - Obsidian推出的开源AI工具包

Obsidian-skills 是 Obsidian 团队开发的一组开源工具，帮助用户更好地将 AI 工具（如 Claude Code）与 Obsidian 笔记系统结合使用。包含三大核心技能：obsid...

AIプロジェクト2026/1/12

DeepTutor - 香港大学开源的AI学习助手

DeepTutor 是香港大学数据科学实验室开源的 AI 学习助手，通过多智能体架构和知识图谱技术，将复杂的知识体系转化为高效的学习体验。

AIプロジェクト2026/1/12

Nemotron Speech ASR - 英伟达开源的语音识别模型

AIプロジェクト2026/1/12

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

AIプロジェクト2026/1/10

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

AIプロジェクト2026/1/10

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

AIプロジェクト2026/1/10

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

VoiceSculptor 是西北工业大学、语图智能等机构推出的音色设计模型，能通过自然语言指令实现对语音合成的细粒度控制。

AIプロジェクト2026/1/10

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

AIプロジェクト2026/1/9

EvoCUA - 美团开源的通用多模态计算机操作模型

EvoCUA（Evolving Computer Use Agent）是美团开源的多模态模型，专注于计算机使用自动化任务。EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、Power...

AIプロジェクト2026/1/9

MMSI-Video-Bench - 上海AI Lab推出的空间智能视频基准

AIプロジェクト2026/1/9

Youtu-LLM - 腾讯Youtu团队开源的轻量级语言模型

AIプロジェクト2026/1/8

OS-Copilot - 上海AI Lab开源的通用操作系统AI Agent

AIプロジェクト2026/1/8

10Kh RealOmni-Open - Gen Robot.AI开源的具身智能数据集

AIプロジェクト2026/1/8

UI-TARS Desktop - 字节开源的桌面AI GUI智能体工具

AIプロジェクト2026/1/7

Open Interpreter - 开源AI终端助手，本地环境执行代码

AIプロジェクト2026/1/7

TeleChat3 - 中国电信推出的千亿参数MoE语义大模型

AIプロジェクト2026/1/6

openPangu-VL-7B - 华为开源的多模态模型

AIプロジェクト2026/1/6

MiroThinker v1.5 - MiroMind推出的开源搜索Agent模型

MiroThinker v1.5 是 MiroMind 团队开源的搜索智能体模型。模型通过交互式扩展技术，将推理与外部环境深度耦合，打破传统大模型依赖庞大参数的局限。

AIプロジェクト2026/1/6

TuriX-CUA - 开源AI桌面Agent，自动进行屏幕识别和操作

AIプロジェクト2026/1/6

DLCM - 字节跳动推出的动态大概念模型框架

DLCM（Dynamic Large Concept Models）是字节Seed团队推出的新型大语言模型架构。框架将模型的推理单位从传统的token（词）提升到concept（概念）层级，通过...

AIプロジェクト2026/1/6

Paper2Any - 北大推出的多模态AI科研PPT生成辅助平台

AIプロジェクト2026/1/5

OpenCode - 开源AI编程工具，支持终端、桌面和IDE插件

AIプロジェクト2026/1/5

StoryMem - 字节联合南洋理工推出的视频生成框架

AIプロジェクト2026/1/5

すべてのカテゴリ

AIニュース

Obsidian-skills - Obsidian推出的开源AI工具包

DeepTutor - 香港大学开源的AI学习助手

Nemotron Speech ASR - 英伟达开源的语音识别模型

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

EvoCUA - 美团开源的通用多模态计算机操作模型

MMSI-Video-Bench - 上海AI Lab推出的空间智能视频基准

Youtu-LLM - 腾讯Youtu团队开源的轻量级语言模型

OS-Copilot - 上海AI Lab开源的通用操作系统AI Agent

10Kh RealOmni-Open - Gen Robot.AI开源的具身智能数据集

UI-TARS Desktop - 字节开源的桌面AI GUI智能体工具

Open Interpreter - 开源AI终端助手，本地环境执行代码

TeleChat3 - 中国电信推出的千亿参数MoE语义大模型

openPangu-VL-7B - 华为开源的多模态模型

MiroThinker v1.5 - MiroMind推出的开源搜索Agent模型

TuriX-CUA - 开源AI桌面Agent，自动进行屏幕识别和操作

DLCM - 字节跳动推出的动态大概念模型框架

Paper2Any - 北大推出的多模态AI科研PPT生成辅助平台

OpenCode - 开源AI编程工具，支持终端、桌面和IDE插件

StoryMem - 字节联合南洋理工推出的视频生成框架

Voquill - 开源AI语音输入工具，自动智能文本清理

AIニュース

Obsidian-skills - Obsidian推出的开源AI工具包

DeepTutor - 香港大学开源的AI学习助手

Nemotron Speech ASR - 英伟达开源的语音识别模型

FantasyWorld - 高德地图联合北邮推出的3D世界建模框架

Qwen3-VL-Embedding - 阿里通义开源的多模态信息检索模型

Qwen3-VL-Reranker - 阿里通义开源的跨模态理解模型

VoiceSculptor - 西工大联合语图智能等开源的音色设计模型

ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具

EvoCUA - 美团开源的通用多模态计算机操作模型

MMSI-Video-Bench - 上海AI Lab推出的空间智能视频基准

Youtu-LLM - 腾讯Youtu团队开源的轻量级语言模型

OS-Copilot - 上海AI Lab开源的通用操作系统AI Agent

10Kh RealOmni-Open - Gen Robot.AI开源的具身智能数据集

UI-TARS Desktop - 字节开源的桌面AI GUI智能体工具

Open Interpreter - 开源AI终端助手，本地环境执行代码

TeleChat3 - 中国电信推出的千亿参数MoE语义大模型

openPangu-VL-7B - 华为开源的多模态模型

MiroThinker v1.5 - MiroMind推出的开源搜索Agent模型

TuriX-CUA - 开源AI桌面Agent，自动进行屏幕识别和操作

DLCM - 字节跳动推出的动态大概念模型框架

Paper2Any - 北大推出的多模态AI科研PPT生成辅助平台

OpenCode - 开源AI编程工具，支持终端、桌面和IDE插件

StoryMem - 字节联合南洋理工推出的视频生成框架

Voquill - 开源AI语音输入工具，自动智能文本清理