AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

SpatialLM 1.5 - 群核科技推出的空间语言模型

SpatialLM 1.5 是群核科技推出的强大的空间语言模型。模型基于大语言模型训练，能理解自然语言指令，输出包含空间结构、物体关系和物理参数的空间语言。用户...

AIプロジェクト2025/12/18

WhisperLiveKit - 开源AI语音识别工具，支持说话人识别

WhisperLiveKit 是开源的实时语音识别工具，能将语音实时转录为文字，支持说话人识别。工具基于先进的技术如 SimulStreaming 和 WhisperStreaming，提供超低...

AIプロジェクト2025/12/18

Wan2.2-S2V - 阿里通义开源的多模态视频生成模型

Wan2.2-S2V 是开源的多模态视频生成模型，仅需一张静态图片和一段音频，能生成电影级数字人视频，视频时长可达分钟级，且支持多种图片类型和画幅。

AIプロジェクト2025/12/18

Gemini 2.5 Flash Image - 谷歌推出的图像生成和编辑模型

Gemini 2.5 Flash Image（代号nano banana）是谷歌推出的AI图像生成与编辑模型。模型能保持角色在不同场景中的一致性，支持通过自然语言进行精准图像编辑，如...

AIプロジェクト2025/12/18

Youtu-agent - 腾讯优图推出的开源智能体框架

Youtu-agent 是腾讯优图实验室推出的开源智能体框架，用在构建、运行和评估自主智能体。框架基于开源模型DeepSeek-V3实现领先性能，支持多种模型 API 和工具...

AIプロジェクト2025/12/18

MiniCPM-V 4.5 - 面壁智能开源的端侧多模态模型

MiniCPM-V 4.5是面壁智能推出的端侧多模态模型，拥有8B参数。模型在图片、视频、OCR等多个领域表现卓越，尤其在高刷视频理解方面取得突破，能处理高刷新率视...

AIプロジェクト2025/12/18

Waver 1.0 - 字节跳动推出的AI视频生成模型

Waver 1.0 是字节跳动推出的新一代视频生成模型，基于修正流 Transformer 架构，支持文本到视频（T2V）、图像到视频（I2V）和文本到图像（T2I）生成，可在单...

AIプロジェクト2025/12/18

PixVerse V5 - 爱诗科技推出的AI视频生成模型

PixVerse V5是爱诗科技推出的自研AI视频生成大模型，已在全球同步上线。PixVerse V5版本在动态效果、视觉质量、一致性保持和指令遵循等方面进行全面升级，能...

AIプロジェクト2025/12/18

FramePackLoop - AI视频生成工具，首尾连接生成循环视频

FramePackLoop 是基于 FramePack 推出的无限循环视频生成工具。工具通过创建主视频和连接视频，将视频组合成循环视频，适用视频背景、图标等场景。

AIプロジェクト2025/12/18

问小白5 - 问小白推出的全能旗舰AI模型

问小白5是问小白推出的“All in One”旗舰大模型，是国产大模型中智能水平最高的。模型在多项评测中表现优异，如AA-Index综合评估指标得分64.7分，STEM能力评测...

AIプロジェクト2025/12/18

Grok Code Fast 1 - xAI推出的AI编程模型

Grok Code Fast 1 是 xAI 推出的 AI 编程模型，专为快速高效的基础代码任务设计。模型每秒可处理92个标记，拥有256k的上下文窗口，适合快速原型开发、代码调...

AIプロジェクト2025/12/18

HunyuanVideo-Foley - 腾讯混元开源的视频音效生成模型

HunyuanVideo-Foley是腾讯混元团队开源的端到端视频音效生成模型。模型能根据输入的视频和文字描述，生成与视频画面精准匹配的高质量音效，解决现有AI视频生...

AIプロジェクト2025/12/18

gpt-realtime - OpenAI最新推出的语音模型

gpt-realtime 是 OpenAI 最新推出的先进语音模型，专为实际任务设计。模型能生成高质量、自然的语音，支持多种语言和语音风格，能理解非语言线索并根据场景调...

AIプロジェクト2025/12/18

OmniHuman-1.5 - 字节推出的数字人动画生成模型

OmniHuman-1.5 字节推出的先进的AI模型，能从单张图片和语音轨道生成富有表现力的数字人动画。模型基于双重系统认知理论，融合多模态大语言模型和扩散变换器...

AIプロジェクト2025/12/18

Meeseeks - 美团开源的模型指令遵循能力评测集

Meeseeks 是美团 M17 团队开源的大模型评测集，用在评估模型的指令遵循能力。Meeseeks通过三级评测框架，从宏观到微观全面衡量模型是否能严格按照用户指令生...

AIプロジェクト2025/12/18

MAI-Voice-1 - 微软推出的极速语音生成模型

MAI-Voice-1 是微软人工智能团队推出的首个具有高度表现力和自然的语音生成模型。模型能在单个 GPU 上不到一秒钟内生成一分钟的音频，是目前最高效的语音系统...

AIプロジェクト2025/12/18

Async - 开源AI编程工具，自动研究编程任务并执行

Async 是开源的开发者工具，为经验丰富的开发者提供结合AI编码、任务管理和代码审查的统一工作流，通过 AI 技术帮助开发者提高工作效率。

AIプロジェクト2025/12/18

InternVL3.5 - 上海AI Lab开源的多模态大模型

InternVL3.5（书生·万象3.5）是上海人工智能实验室开源的多模态大模型，模型在通用能力、推理能力和部署效率上全面升级，提供从10亿到2410亿参数的九种尺寸版...

AIプロジェクト2025/12/18

MAI-1-preview - 微软推出的端到端训练基础模型

MAI-1-preview 是微软人工智能团队推出的端到端训练的基础模型，为用户提供遵循指令和回答日常查询的能力。

AIプロジェクト2025/12/18

MobileCLIP2 - 苹果开源的端侧多模态模型

MobileCLIP2是苹果公司研究人员推出的高效端侧多模态模型，是MobileCLIP的升级版本。在多模态强化训练方面进行了优化，通过在DFN数据集上训练性能更优的CLIP...

AIプロジェクト2025/12/18

Step-Audio 2 mini - 阶跃星辰开源的端到端语音大模型

Step-Audio 2 mini 是阶跃星辰发布的开源端到端语音大模型。突破传统语音模型结构，采用真端到端多模态架构，直接将原始音频输入转化为语音响应输出，时延更...

AIプロジェクト2025/12/18

AudioStory - 腾讯ARC推出的音频生成模型

AudioStory 是腾讯 ARC 实验室发布的音频生成技术，能根据自然语言描述生成高质量的长篇叙事音频。采用分而治之策略，将复杂叙事请求拆解为有序子任务，通过...

AIプロジェクト2025/12/18

Open-Fiesta - 开源的AI聊天平台，能同时运行多种模型对比

Open-Fiesta 是开源的多模型 AI 聊天平台，基于 Next.js 14 构建。平台支持多种 AI 提供商（如 Gemini、OpenRouter 等）和多种模型，用户能同时选择 5 种模型...

AIプロジェクト2025/12/18

AgentScope 1.0 - 阿里通义开源的多Agent开发框架

AgentScope 1.0 是阿里通义开源的多智能体开发框架，通过三层技术架构，AgentScope核心框架、AgentScope Runtime 和 AgentScope Studio，提供从开发到部署的...

←1...119 120 121 122 123 124 125...137 →

AIニュース

AIプロジェクト2025/12/18

SpatialLM 1.5 - 群核科技推出的空间语言模型

AIプロジェクト2025/12/18

WhisperLiveKit - 开源AI语音识别工具，支持说话人识别

WhisperLiveKit 是开源的实时语音识别工具，能将语音实时转录为文字，支持说话人识别。工具基于先进的技术如 SimulStreaming 和 WhisperStreaming，提供超低...

AIプロジェクト2025/12/18

Wan2.2-S2V - 阿里通义开源的多模态视频生成模型

Wan2.2-S2V 是开源的多模态视频生成模型，仅需一张静态图片和一段音频，能生成电影级数字人视频，视频时长可达分钟级，且支持多种图片类型和画幅。

AIプロジェクト2025/12/18

Gemini 2.5 Flash Image - 谷歌推出的图像生成和编辑模型

AIプロジェクト2025/12/18

Youtu-agent - 腾讯优图推出的开源智能体框架

AIプロジェクト2025/12/18

MiniCPM-V 4.5 - 面壁智能开源的端侧多模态模型

AIプロジェクト2025/12/18

Waver 1.0 - 字节跳动推出的AI视频生成模型

AIプロジェクト2025/12/18

PixVerse V5 - 爱诗科技推出的AI视频生成模型

AIプロジェクト2025/12/18

FramePackLoop - AI视频生成工具，首尾连接生成循环视频

FramePackLoop 是基于 FramePack 推出的无限循环视频生成工具。工具通过创建主视频和连接视频，将视频组合成循环视频，适用视频背景、图标等场景。

AIプロジェクト2025/12/18

问小白5 - 问小白推出的全能旗舰AI模型

AIプロジェクト2025/12/18

Grok Code Fast 1 - xAI推出的AI编程模型

AIプロジェクト2025/12/18

HunyuanVideo-Foley - 腾讯混元开源的视频音效生成模型

AIプロジェクト2025/12/18

gpt-realtime - OpenAI最新推出的语音模型

AIプロジェクト2025/12/18

OmniHuman-1.5 - 字节推出的数字人动画生成模型

AIプロジェクト2025/12/18

Meeseeks - 美团开源的模型指令遵循能力评测集

AIプロジェクト2025/12/18

MAI-Voice-1 - 微软推出的极速语音生成模型

AIプロジェクト2025/12/18

Async - 开源AI编程工具，自动研究编程任务并执行

Async 是开源的开发者工具，为经验丰富的开发者提供结合AI编码、任务管理和代码审查的统一工作流，通过 AI 技术帮助开发者提高工作效率。

AIプロジェクト2025/12/18

InternVL3.5 - 上海AI Lab开源的多模态大模型

AIプロジェクト2025/12/18

MAI-1-preview - 微软推出的端到端训练基础模型

MAI-1-preview 是微软人工智能团队推出的端到端训练的基础模型，为用户提供遵循指令和回答日常查询的能力。

AIプロジェクト2025/12/18

MobileCLIP2 - 苹果开源的端侧多模态模型

AIプロジェクト2025/12/18

Step-Audio 2 mini - 阶跃星辰开源的端到端语音大模型

AIプロジェクト2025/12/18

AudioStory - 腾讯ARC推出的音频生成模型

AIプロジェクト2025/12/18

Open-Fiesta - 开源的AI聊天平台，能同时运行多种模型对比

Open-Fiesta 是开源的多模型 AI 聊天平台，基于 Next.js 14 构建。平台支持多种 AI 提供商（如 Gemini、OpenRouter 等）和多种模型，用户能同时选择 5 种模型...

AIプロジェクト2025/12/18

AgentScope 1.0 - 阿里通义开源的多Agent开发框架

AgentScope 1.0 是阿里通义开源的多智能体开发框架，通过三层技术架构，AgentScope核心框架、AgentScope Runtime 和 AgentScope Studio，提供从开发到部署的...

すべてのカテゴリ

AIニュース

SpatialLM 1.5 - 群核科技推出的空间语言模型

WhisperLiveKit - 开源AI语音识别工具，支持说话人识别

Wan2.2-S2V - 阿里通义开源的多模态视频生成模型

Gemini 2.5 Flash Image - 谷歌推出的图像生成和编辑模型

Youtu-agent - 腾讯优图推出的开源智能体框架

MiniCPM-V 4.5 - 面壁智能开源的端侧多模态模型

Waver 1.0 - 字节跳动推出的AI视频生成模型

PixVerse V5 - 爱诗科技推出的AI视频生成模型

FramePackLoop - AI视频生成工具，首尾连接生成循环视频

问小白5 - 问小白推出的全能旗舰AI模型

Grok Code Fast 1 - xAI推出的AI编程模型

HunyuanVideo-Foley - 腾讯混元开源的视频音效生成模型

gpt-realtime - OpenAI最新推出的语音模型

OmniHuman-1.5 - 字节推出的数字人动画生成模型

Meeseeks - 美团开源的模型指令遵循能力评测集

MAI-Voice-1 - 微软推出的极速语音生成模型

Async - 开源AI编程工具，自动研究编程任务并执行

InternVL3.5 - 上海AI Lab开源的多模态大模型

MAI-1-preview - 微软推出的端到端训练基础模型

MobileCLIP2 - 苹果开源的端侧多模态模型

Step-Audio 2 mini - 阶跃星辰开源的端到端语音大模型

AudioStory - 腾讯ARC推出的音频生成模型

Open-Fiesta - 开源的AI聊天平台，能同时运行多种模型对比

AgentScope 1.0 - 阿里通义开源的多Agent开发框架

AIニュース

SpatialLM 1.5 - 群核科技推出的空间语言模型

WhisperLiveKit - 开源AI语音识别工具，支持说话人识别

Wan2.2-S2V - 阿里通义开源的多模态视频生成模型

Gemini 2.5 Flash Image - 谷歌推出的图像生成和编辑模型

Youtu-agent - 腾讯优图推出的开源智能体框架

MiniCPM-V 4.5 - 面壁智能开源的端侧多模态模型

Waver 1.0 - 字节跳动推出的AI视频生成模型

PixVerse V5 - 爱诗科技推出的AI视频生成模型

FramePackLoop - AI视频生成工具，首尾连接生成循环视频

问小白5 - 问小白推出的全能旗舰AI模型

Grok Code Fast 1 - xAI推出的AI编程模型

HunyuanVideo-Foley - 腾讯混元开源的视频音效生成模型

gpt-realtime - OpenAI最新推出的语音模型

OmniHuman-1.5 - 字节推出的数字人动画生成模型

Meeseeks - 美团开源的模型指令遵循能力评测集

MAI-Voice-1 - 微软推出的极速语音生成模型

Async - 开源AI编程工具，自动研究编程任务并执行

InternVL3.5 - 上海AI Lab开源的多模态大模型

MAI-1-preview - 微软推出的端到端训练基础模型

MobileCLIP2 - 苹果开源的端侧多模态模型

Step-Audio 2 mini - 阶跃星辰开源的端到端语音大模型

AudioStory - 腾讯ARC推出的音频生成模型

Open-Fiesta - 开源的AI聊天平台，能同时运行多种模型对比

AgentScope 1.0 - 阿里通义开源的多Agent开发框架