AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

MeetingMind - AI会议助手，自动捕捉、分析和处理会议见解

MeetingMind是AI驱动的会议助手，基于录音和文件上传功能自动转录会议音频，从中提取关键信息，如任务、决策和问题，帮助用户轻松捕获和分析会议内容，采取行...

AIプロジェクト2025/12/18

星辰大模型 - 中国电信推出的AI大模型集合平台

星辰大模型平台是中国电信推出的AI大模型集合平台，覆盖语义、视觉、语音等多模态领域。包含不同参数量级的模型，支持长文本处理，具备多语种语音识别和多任...

AIプロジェクト2025/12/18

Fast GraphRAG - 微软推出高效的知识图谱检索框架

Fast GraphRAG 是微软推出的高效的知识图谱检索框架，旨在提供可解释性和高精度的代理驱动检索工作流。它结合了检索增强生成（RAG）技术和知识图谱，提升大型...

AIプロジェクト2025/12/18

Stagehand - AI网页浏览框架，提供简单和可扩展的网页自动化解决方案

Stagehand是简单和可扩展的AI网页浏览框架，是Playwright的继承者，提供act、extract和observe三个简单的API，支持自然语言驱动的网页操作。Stagehand提供一...

AIプロジェクト2025/12/18

VideoTuna - AI视频生成应用代码库，支持多模型和全面的视频生成流程

VideoTuna是集成多种AI视频生成模型的代码库，支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提供预训练、持续训练、后训练对齐和微调等全面视频...

AIプロジェクト2025/12/18

ComfyUI-MochiEdit - 开源的AI视频编辑工具，支持视频转视频和局部编辑

ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的开源视频编辑工具，基于将视频转换为噪声、重新采样实现视频编辑，支持局部编辑和视频转视频功能。用户能调整...

AIプロジェクト2025/12/18

HiCo - 360 AI研究院推出的布局可控AI绘画模型

HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型，HiCo基于多分支结构设计，实现对对象位置和文本描述的精确控制。HiCo的关键特点在于...

AIプロジェクト2025/12/18

Ferret-UI 2 - 苹果推出的跨平台UI理解多模态大语言模型

Ferret-UI 2是苹果公司推出的多模态大型语言模型，用在理解和交互移动用户界面。Ferret-UI 2能识别和理解各种移动设备屏幕上的UI元素，执行复杂的用户指令，...

AIプロジェクト2025/12/18

MMBench-Video - 上海AI Lab联合多所高校推出的长视频理解基准测试

MMBench-Video是新颖的长视频多题问答基准测试，是浙江大学、上海人工智能实验室、上海交通大学和香港中文大学联合推出的。MMBench-Video能全面评估大型视觉...

AIプロジェクト2025/12/18

MiniMates - 轻量级AI数字人项目，支持语音和表情两种驱动模式

MiniMates是高性能的轻量级数字人驱动算法，具备语音和表情两种驱动模式，能在普通电脑上实现实时运行。基于先进的技术架构，提供极致的速度体验和个性化定制...

AIプロジェクト2025/12/18

MotionCLR - AI动作编辑模型，根据文本提示生成相应的动作序列

MotionCLR是基于注意力机制的人体动作生成和编辑模型，能根据文本提示生成动作，支持用户进行交互式编辑，如动作强调、减弱、替换、擦除和风格转移。MotionCL...

AIプロジェクト2025/12/18

DocMind - 司马阅推出的文档智能大模型

DocMind是司马阅推出的文档智能大模型，基于Transformer结构，融合深度学习、NLP和CV技术，能处理富文本文档的复杂结构和视觉信息，提高信息抽取准确性。DocM...

AIプロジェクト2025/12/18

DistilQwen2 - 阿里推出基于Qwen2优化的轻量级语言模型

DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言模型，能提高运算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增强指令数据多样性...

AIプロジェクト2025/12/18

Hunyuan3D-1.0 - 腾讯推出的3D生成模型，支持文生3D和图生3D

Hunyuan3D-1.0 是腾讯推出的一款3D生成模型，具备文本和图像输入条件，支持高质量的3D资产生成。该模型采用两阶段方法，首先使用多视角扩散模型生成多视角RGB...

AIプロジェクト2025/12/18

Hunyuan-Large - 腾讯推出的大型混合专家（MoE）模型

Hunyuan-Large是腾讯推出的大型混合专家（MoE）模型，具有3890亿总参数量和520亿激活参数量，是目前业界参数规模最大的开源MoE模型。基于Transformer架构，支...

AIプロジェクト2025/12/18

Cofounder - 全栈AI应用构建器，辅助开发者自动生成完整的应用程序

Cofounder是开源的全栈AI开发代理，能帮助开发者基于单一提示自动生成完整的应用程序，包括后端、前端、数据库和有状态的Web应用。Cofounder基于生成式AI技术...

AIプロジェクト2025/12/18

MagicTailor - 组件可控个性化图像生成新框架

MagicTailor 是专门为组件可控个性化设计的新框架，让T2I模型在个性化过程中能够精确控制。MagicTailor 基于两个关键技术动态掩码退化（DM-Deg）和双流平衡（...

AIプロジェクト2025/12/18

Claude Computer Use - Anthropic推出支持AI自动化操作电脑任务的功能

Claude Computer Use是Anthropic公司为Claude 3.5 Sonnet和Claude 3.5 Haiku模型推出的新功能，支持AI模型Claude执行类似人类的电脑操作，如查看屏幕、移动光...

AIプロジェクト2025/12/18

Docling - IBM开源的文档解析工具

Docling是开源的文档解析和转换工具，能高效地将多种格式的文档（包括PDF、DOCX、PPTX、图片和HTML）解析，导出为Markdown或JSON格式。Docling支持高级PDF理...

AIプロジェクト2025/12/18

Cerebellum - 浏览器AI助手，完成网页自动化任务和行动规划

Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver构建的浏览器AI智能助手，能理解任务意图、执行网页自动化任务，如数据抓取和网站自动化测试。Cerebe...

AIプロジェクト2025/12/18

WebRL - 清华联合智谱AI推出的自进化在线课程强化学习框架

WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架，训练使用开放大型语言模型（LLMs）的高性能网络代理。WebRL动态生成任务、结果监督奖励...

AIプロジェクト2025/12/18

GameGen-X - 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型，用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能，如创新角色...

AIプロジェクト2025/12/18

OuteTTS - 开源的文本到语音合成项目，基于纯语言建模方法生成语音

OuteTTS是开源的文本到语音（TTS）项目，基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构，用Oute3-350M-DEV基础模型，拥有3.5亿参数。OuteTTS具备...

AIプロジェクト2025/12/18

GTA - 上海AI Lab联合交大推出评估通用工具智能体的基准测试

GTA（a benchmark for General Tool Agents）是上海交通大学和上海AI实验室共同推出的基准测试，评估大型语言模型（LLMs）在真实世界场景中调用工具的能力。G...

←1...50 51 52 53 54 55 56...137 →

AIニュース

AIプロジェクト2025/12/18

MeetingMind - AI会议助手，自动捕捉、分析和处理会议见解

AIプロジェクト2025/12/18

星辰大模型 - 中国电信推出的AI大模型集合平台

AIプロジェクト2025/12/18

Fast GraphRAG - 微软推出高效的知识图谱检索框架

AIプロジェクト2025/12/18

Stagehand - AI网页浏览框架，提供简单和可扩展的网页自动化解决方案

Stagehand是简单和可扩展的AI网页浏览框架，是Playwright的继承者，提供act、extract和observe三个简单的API，支持自然语言驱动的网页操作。Stagehand提供一...

AIプロジェクト2025/12/18

VideoTuna - AI视频生成应用代码库，支持多模型和全面的视频生成流程

AIプロジェクト2025/12/18

ComfyUI-MochiEdit - 开源的AI视频编辑工具，支持视频转视频和局部编辑

AIプロジェクト2025/12/18

HiCo - 360 AI研究院推出的布局可控AI绘画模型

AIプロジェクト2025/12/18

Ferret-UI 2 - 苹果推出的跨平台UI理解多模态大语言模型

AIプロジェクト2025/12/18

MMBench-Video - 上海AI Lab联合多所高校推出的长视频理解基准测试

AIプロジェクト2025/12/18

MiniMates - 轻量级AI数字人项目，支持语音和表情两种驱动模式

AIプロジェクト2025/12/18

MotionCLR - AI动作编辑模型，根据文本提示生成相应的动作序列

AIプロジェクト2025/12/18

DocMind - 司马阅推出的文档智能大模型

AIプロジェクト2025/12/18

DistilQwen2 - 阿里推出基于Qwen2优化的轻量级语言模型

AIプロジェクト2025/12/18

Hunyuan3D-1.0 - 腾讯推出的3D生成模型，支持文生3D和图生3D

AIプロジェクト2025/12/18

Hunyuan-Large - 腾讯推出的大型混合专家（MoE）模型

AIプロジェクト2025/12/18

Cofounder - 全栈AI应用构建器，辅助开发者自动生成完整的应用程序

AIプロジェクト2025/12/18

MagicTailor - 组件可控个性化图像生成新框架

AIプロジェクト2025/12/18

Claude Computer Use - Anthropic推出支持AI自动化操作电脑任务的功能

Claude Computer Use是Anthropic公司为Claude 3.5 Sonnet和Claude 3.5 Haiku模型推出的新功能，支持AI模型Claude执行类似人类的电脑操作，如查看屏幕、移动光...

AIプロジェクト2025/12/18

Docling - IBM开源的文档解析工具

AIプロジェクト2025/12/18

Cerebellum - 浏览器AI助手，完成网页自动化任务和行动规划

Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver构建的浏览器AI智能助手，能理解任务意图、执行网页自动化任务，如数据抓取和网站自动化测试。Cerebe...

AIプロジェクト2025/12/18

WebRL - 清华联合智谱AI推出的自进化在线课程强化学习框架

AIプロジェクト2025/12/18

GameGen-X - 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

AIプロジェクト2025/12/18

OuteTTS - 开源的文本到语音合成项目，基于纯语言建模方法生成语音

OuteTTS是开源的文本到语音（TTS）项目，基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构，用Oute3-350M-DEV基础模型，拥有3.5亿参数。OuteTTS具备...

AIプロジェクト2025/12/18

GTA - 上海AI Lab联合交大推出评估通用工具智能体的基准测试

GTA（a benchmark for General Tool Agents）是上海交通大学和上海AI实验室共同推出的基准测试，评估大型语言模型（LLMs）在真实世界场景中调用工具的能力。G...

すべてのカテゴリ

AIニュース

MeetingMind - AI会议助手，自动捕捉、分析和处理会议见解

星辰大模型 - 中国电信推出的AI大模型集合平台

Fast GraphRAG - 微软推出高效的知识图谱检索框架

Stagehand - AI网页浏览框架，提供简单和可扩展的网页自动化解决方案

VideoTuna - AI视频生成应用代码库，支持多模型和全面的视频生成流程

ComfyUI-MochiEdit - 开源的AI视频编辑工具，支持视频转视频和局部编辑

HiCo - 360 AI研究院推出的布局可控AI绘画模型

Ferret-UI 2 - 苹果推出的跨平台UI理解多模态大语言模型

MMBench-Video - 上海AI Lab联合多所高校推出的长视频理解基准测试

MiniMates - 轻量级AI数字人项目，支持语音和表情两种驱动模式

MotionCLR - AI动作编辑模型，根据文本提示生成相应的动作序列

DocMind - 司马阅推出的文档智能大模型

DistilQwen2 - 阿里推出基于Qwen2优化的轻量级语言模型

Hunyuan3D-1.0 - 腾讯推出的3D生成模型，支持文生3D和图生3D

Hunyuan-Large - 腾讯推出的大型混合专家（MoE）模型

Cofounder - 全栈AI应用构建器，辅助开发者自动生成完整的应用程序

MagicTailor - 组件可控个性化图像生成新框架

Claude Computer Use - Anthropic推出支持AI自动化操作电脑任务的功能

Docling - IBM开源的文档解析工具

Cerebellum - 浏览器AI助手，完成网页自动化任务和行动规划

WebRL - 清华联合智谱AI推出的自进化在线课程强化学习框架

GameGen-X - 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

OuteTTS - 开源的文本到语音合成项目，基于纯语言建模方法生成语音

GTA - 上海AI Lab联合交大推出评估通用工具智能体的基准测试

AIニュース

MeetingMind - AI会议助手，自动捕捉、分析和处理会议见解

星辰大模型 - 中国电信推出的AI大模型集合平台

Fast GraphRAG - 微软推出高效的知识图谱检索框架

Stagehand - AI网页浏览框架，提供简单和可扩展的网页自动化解决方案

VideoTuna - AI视频生成应用代码库，支持多模型和全面的视频生成流程

ComfyUI-MochiEdit - 开源的AI视频编辑工具，支持视频转视频和局部编辑

HiCo - 360 AI研究院推出的布局可控AI绘画模型

Ferret-UI 2 - 苹果推出的跨平台UI理解多模态大语言模型

MMBench-Video - 上海AI Lab联合多所高校推出的长视频理解基准测试

MiniMates - 轻量级AI数字人项目，支持语音和表情两种驱动模式

MotionCLR - AI动作编辑模型，根据文本提示生成相应的动作序列

DocMind - 司马阅推出的文档智能大模型

DistilQwen2 - 阿里推出基于Qwen2优化的轻量级语言模型

Hunyuan3D-1.0 - 腾讯推出的3D生成模型，支持文生3D和图生3D

Hunyuan-Large - 腾讯推出的大型混合专家（MoE）模型

Cofounder - 全栈AI应用构建器，辅助开发者自动生成完整的应用程序

MagicTailor - 组件可控个性化图像生成新框架

Claude Computer Use - Anthropic推出支持AI自动化操作电脑任务的功能

Docling - IBM开源的文档解析工具

Cerebellum - 浏览器AI助手，完成网页自动化任务和行动规划

WebRL - 清华联合智谱AI推出的自进化在线课程强化学习框架

GameGen-X - 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

OuteTTS - 开源的文本到语音合成项目，基于纯语言建模方法生成语音

GTA - 上海AI Lab联合交大推出评估通用工具智能体的基准测试