AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

YT Navigator - AI YouTube 内容搜索工具，自然语言查询定位关键信息

YT Navigator 是 AI 驱动的 YouTube 内容搜索工具，帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能，让用户快速定位到特定频道视...

AIプロジェクト2025/12/18

Step-Video-TI2V - 阶跃星辰开源的图生视频模型

Step-Video-TI2V 是阶跃星辰（StepFun）推出的开源图生视频（Image-to-Video）生成模型，拥有 300 亿参数，能根据文本描述和图像输入生成最长 102 帧的视频。...

AIプロジェクト2025/12/18

Dify-Plus - 基于 Dify 二次开发的企业级增强版项目

Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录...

AIプロジェクト2025/12/18

gpt-4o-transcribe - OpenAI 推出的语音转文本模型

gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构，用海量多样化音频数据训练，精准捕捉语音细微差别，显著降低单词错误率（...

AIプロジェクト2025/12/18

GPT-4o mini TTS - OpenAI 推出的文本转语音模型

GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型，支持将文本内容转换为自然流畅语音的同时，开发者能用指令控制语音的语调、情感和风格，例如“平静”“...

AIプロジェクト2025/12/18

福棠·百川 - 百川智能联合北京儿童等推出的儿科大模型

福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及疑难病症的立体化...

AIプロジェクト2025/12/18

Agent TARS - 字节跳动开源的多模态 AI Agent 项目

Agent TARS 是字节跳动开源的多模态 AI 代理工具。基于视觉解释网页内容，与浏览器、命令行和文件系统无缝集成，实现复杂任务的规划与执行。Agent TARS 提供...

AIプロジェクト2025/12/18

gpt-4o-mini-transcribe - OpenAI 推出的语音转文本模型

gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型，gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe 基于 GPT-4o-mini 架构，用知识蒸馏技术从大...

AIプロジェクト2025/12/18

SpatialLM - 群核科技开源的空间理解多模态模型

SpatialLM 是群核科技开源的空间理解多模态模型，赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频，能重建出详细的 3D 场景布局，...

AIプロジェクト2025/12/18

Multi-Agent Orchestrator - 亚马逊开源的多智能体框架

Multi-Agent Orchestrator 是用于管理和协调多个智能代理（Agent）的框架。通过分类器识别用户输入的意图，将请求分配给最适合的代理进行处理，通过对话存储...

AIプロジェクト2025/12/18

龙猫LongCat - 美团自主研发的生成式AI大模型

LongCat（龙猫）是美团自主研发的生成式AI大模型，通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力，能处理文本、图像等多种数据...

AIプロジェクト2025/12/18

食神 - 老板电器推出的首个烹饪大模型

食神是老板电器推出的首个烹饪垂直领域大模型。基于老板电器46年积累的海量烹饪数据，结合DeepSeek技术，能精准理解烹饪场景需求。用户可通过语音、文字等方...

AIプロジェクト2025/12/18

Soundwave - 港中文深圳开源的语音理解大模型

Soundwave是香港中文大学（深圳）开源的语音理解大模型，专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术，有效解决了语音和文本在...

AIプロジェクト2025/12/18

Motia - AI Agent 开发框架，支持多种编程语言、一键部署智能体

Motia 是专为软件工程师设计的 AI Agent 框架，简化 AI 智能体的开发、测试和部署过程。支持多种编程语言，如 Python、TypeScript 和 Ruby，开发者可以使用熟...

AIプロジェクト2025/12/18

InfiniteYou - 字节跳动开源的身份保持图像生成框架

InfiniteYou（InfU）是字节跳动智能创作团队推出的基于扩散变换器（Diffusion Transformers，如 FLUX）的身份保持图像生成框架。基于 InfuseNet 将身份特征注...

AIプロジェクト2025/12/18

RuoYi AI - 全栈式 AI 开发平台，快速搭建个性化 AI 应用

RuoYi AI 是全栈式 AI 开发平台，提供完整的前端、后台管理及小程序应用，支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案，集成 Milvus/Weaviate 等向...

AIプロジェクト2025/12/18

MoshiVis - Kyutai 开源的多模态实时语音模型

MoshiVis 是 Kyutai 推出的开源多模态语音模型，基于 Moshi 实时对话语音模型开发，增加了视觉输入功能。能实现图像的自然、实时语音交互，将语音和视觉信息...

AIプロジェクト2025/12/18

DeepMesh - 清华和南洋理工推出的 3D 网格生成框架

DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架，基于强化学习和自回归变换器生成高质量的 3D 网格。通过两项关键创新来优化网格生成：一...

AIプロジェクト2025/12/18

BlockDance - 复旦联合字节推出的扩散模型加速方法

BlockDance 是复旦大学联合字节跳动智能创作团队推出的用在加速扩散模型的新方法。BlockDance 基于识别重用相邻时间步中结构相似的时空特征（STSS），减少冗...

AIプロジェクト2025/12/18

Reve Image - Reve 推出的全新 AI 图像生成模型

Reve Image 是 Reve 推出的全新 AI 图像生成模型。专注于提升美学表现、精确的提示遵循能力以及出色的排版设计，能生成高质量的视觉作品。模型在生成图像时展...

AIプロジェクト2025/12/18

StarVector - 开源多模态视觉语言模型，支持图像和文本到 SVG 生成

StarVector 是开源的多模态视觉语言模型，ServiceNow Research、Mila - Quebec AI Institute 和 ETS Montreal 联合开发，专注于将图像和文本转换为可缩放矢量...

AIプロジェクト2025/12/18

LHM - 阿里通义开源的单图生成可动画3D人体模型

LHM（Large Animatable Human Reconstruction Model）是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构，融合3D几何...

AIプロジェクト2025/12/18

瀚海智语 - 海洋垂直领域大模型，基于360 智脑和 DeepSeek 研发

瀚海智语（OceanDS）是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型，模型以360智脑13B和Deepseek-R1-...

AIプロジェクト2025/12/18

Qwen2.5-VL-32B - 阿里开源的最新多模态模型

Qwen2.5-VL-32B是阿里巴巴开源的多模态模型，参数规模为32B。模型在Qwen2.5-VL系列的基础上，基于强化学习优化，具备更符合人类偏好的回答风格、显著提升的数...

←1...91 92 93 94 95 96 97...137 →

AIニュース

AIプロジェクト2025/12/18

YT Navigator - AI YouTube 内容搜索工具，自然语言查询定位关键信息

YT Navigator 是 AI 驱动的 YouTube 内容搜索工具，帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能，让用户快速定位到特定频道视...

AIプロジェクト2025/12/18

Step-Video-TI2V - 阶跃星辰开源的图生视频模型

AIプロジェクト2025/12/18

Dify-Plus - 基于 Dify 二次开发的企业级增强版项目

Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录...

AIプロジェクト2025/12/18

gpt-4o-transcribe - OpenAI 推出的语音转文本模型

AIプロジェクト2025/12/18

GPT-4o mini TTS - OpenAI 推出的文本转语音模型

AIプロジェクト2025/12/18

福棠·百川 - 百川智能联合北京儿童等推出的儿科大模型

AIプロジェクト2025/12/18

Agent TARS - 字节跳动开源的多模态 AI Agent 项目

AIプロジェクト2025/12/18

gpt-4o-mini-transcribe - OpenAI 推出的语音转文本模型

gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型，gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe 基于 GPT-4o-mini 架构，用知识蒸馏技术从大...

AIプロジェクト2025/12/18

SpatialLM - 群核科技开源的空间理解多模态模型

AIプロジェクト2025/12/18

Multi-Agent Orchestrator - 亚马逊开源的多智能体框架

AIプロジェクト2025/12/18

龙猫LongCat - 美团自主研发的生成式AI大模型

AIプロジェクト2025/12/18

食神 - 老板电器推出的首个烹饪大模型

AIプロジェクト2025/12/18

Soundwave - 港中文深圳开源的语音理解大模型

AIプロジェクト2025/12/18

Motia - AI Agent 开发框架，支持多种编程语言、一键部署智能体

AIプロジェクト2025/12/18

InfiniteYou - 字节跳动开源的身份保持图像生成框架

InfiniteYou（InfU）是字节跳动智能创作团队推出的基于扩散变换器（Diffusion Transformers，如 FLUX）的身份保持图像生成框架。基于 InfuseNet 将身份特征注...

AIプロジェクト2025/12/18

RuoYi AI - 全栈式 AI 开发平台，快速搭建个性化 AI 应用

RuoYi AI 是全栈式 AI 开发平台，提供完整的前端、后台管理及小程序应用，支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案，集成 Milvus/Weaviate 等向...

AIプロジェクト2025/12/18

MoshiVis - Kyutai 开源的多模态实时语音模型

AIプロジェクト2025/12/18

DeepMesh - 清华和南洋理工推出的 3D 网格生成框架

AIプロジェクト2025/12/18

BlockDance - 复旦联合字节推出的扩散模型加速方法

AIプロジェクト2025/12/18

Reve Image - Reve 推出的全新 AI 图像生成模型

AIプロジェクト2025/12/18

StarVector - 开源多模态视觉语言模型，支持图像和文本到 SVG 生成

StarVector 是开源的多模态视觉语言模型，ServiceNow Research、Mila - Quebec AI Institute 和 ETS Montreal 联合开发，专注于将图像和文本转换为可缩放矢量...

AIプロジェクト2025/12/18

LHM - 阿里通义开源的单图生成可动画3D人体模型

LHM（Large Animatable Human Reconstruction Model）是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构，融合3D几何...

AIプロジェクト2025/12/18

瀚海智语 - 海洋垂直领域大模型，基于360 智脑和 DeepSeek 研发

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

YT Navigator - AI YouTube 内容搜索工具，自然语言查询定位关键信息

Step-Video-TI2V - 阶跃星辰开源的图生视频模型

Dify-Plus - 基于 Dify 二次开发的企业级增强版项目

gpt-4o-transcribe - OpenAI 推出的语音转文本模型

GPT-4o mini TTS - OpenAI 推出的文本转语音模型

福棠·百川 - 百川智能联合北京儿童等推出的儿科大模型

Agent TARS - 字节跳动开源的多模态 AI Agent 项目

gpt-4o-mini-transcribe - OpenAI 推出的语音转文本模型

SpatialLM - 群核科技开源的空间理解多模态模型

Multi-Agent Orchestrator - 亚马逊开源的多智能体框架

龙猫LongCat - 美团自主研发的生成式AI大模型

食神 - 老板电器推出的首个烹饪大模型

Soundwave - 港中文深圳开源的语音理解大模型

Motia - AI Agent 开发框架，支持多种编程语言、一键部署智能体

InfiniteYou - 字节跳动开源的身份保持图像生成框架

RuoYi AI - 全栈式 AI 开发平台，快速搭建个性化 AI 应用

MoshiVis - Kyutai 开源的多模态实时语音模型

DeepMesh - 清华和南洋理工推出的 3D 网格生成框架

BlockDance - 复旦联合字节推出的扩散模型加速方法

Reve Image - Reve 推出的全新 AI 图像生成模型

StarVector - 开源多模态视觉语言模型，支持图像和文本到 SVG 生成

LHM - 阿里通义开源的单图生成可动画3D人体模型

瀚海智语 - 海洋垂直领域大模型，基于360 智脑和 DeepSeek 研发

Qwen2.5-VL-32B - 阿里开源的最新多模态模型

AIニュース

YT Navigator - AI YouTube 内容搜索工具，自然语言查询定位关键信息

Step-Video-TI2V - 阶跃星辰开源的图生视频模型

Dify-Plus - 基于 Dify 二次开发的企业级增强版项目

gpt-4o-transcribe - OpenAI 推出的语音转文本模型

GPT-4o mini TTS - OpenAI 推出的文本转语音模型

福棠·百川 - 百川智能联合北京儿童等推出的儿科大模型

Agent TARS - 字节跳动开源的多模态 AI Agent 项目

gpt-4o-mini-transcribe - OpenAI 推出的语音转文本模型

SpatialLM - 群核科技开源的空间理解多模态模型

Multi-Agent Orchestrator - 亚马逊开源的多智能体框架

龙猫LongCat - 美团自主研发的生成式AI大模型

食神 - 老板电器推出的首个烹饪大模型

Soundwave - 港中文深圳开源的语音理解大模型

Motia - AI Agent 开发框架，支持多种编程语言、一键部署智能体

InfiniteYou - 字节跳动开源的身份保持图像生成框架

RuoYi AI - 全栈式 AI 开发平台，快速搭建个性化 AI 应用

MoshiVis - Kyutai 开源的多模态实时语音模型

DeepMesh - 清华和南洋理工推出的 3D 网格生成框架

BlockDance - 复旦联合字节推出的扩散模型加速方法

Reve Image - Reve 推出的全新 AI 图像生成模型

StarVector - 开源多模态视觉语言模型，支持图像和文本到 SVG 生成

LHM - 阿里通义开源的单图生成可动画3D人体模型

瀚海智语 - 海洋垂直领域大模型，基于360 智脑和 DeepSeek 研发

Qwen2.5-VL-32B - 阿里开源的最新多模态模型