AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Rowboat - 开源AI编程工具，快速构建多智能体助手

Rowboat 是开源的低代码 AI IDE，专注于构建多智能体助手的 MCP（多云平台）工具。通过可视化界面和 AI 辅助开发功能，帮助用户快速设计、配置和测试智能体工...

AIプロジェクト2025/12/18

Qwen2.5-Omni-3B - 阿里 Qwen 团队推出的轻量级多模态 AI 模型

Qwen2.5-Omni-3B 是阿里巴巴 Qwen 团队推出的轻量级多模态 AI 模型。是 Qwen2.5-Omni-7B 的精简版，专为消费级硬件设计，支持文本、音频、图像和视频等多种输...

AIプロジェクト2025/12/18

TesserAct - AI 4D具身世界模型，能预测3D场景的动态演变

TesserAct 是创新的 4D 具身世界模型，能预测 3D 场景随时间的动态演变，响应具身代理的动作。通过训练 RGB-DN（RGB、深度和法线）视频数据来学习，超越了传...

AIプロジェクト2025/12/18

VoltAgent - 开源的AI Agent构建和编排框架

VoltAgent 是开源的 TypeScript 框架，用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具，简化与大语言模型（LLM）的交互、状态管理、...

AIプロジェクト2025/12/18

Aero-1-Audio - LMMs-Lab 推出的轻量级音频模型

Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型，基于 Qwen-2.5-1.5B 构建，仅包含 1.5 亿参数。专为长音频处理设计，能支持长达 15 分钟的连续音频输入，无...

AIプロジェクト2025/12/18

DianJin-R1 - 阿里云通义点金联合苏大推出的金融推理大模型

DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型，专为金融任务设计，融合了先进的技术和全面的数据支持。模型通过推理增强监督...

AIプロジェクト2025/12/18

X-Fusion - 加州大学联合Adobe等机构推出的多模态融合框架

X-Fusion 是加州大学洛杉矶分校、威斯康星大学麦迪逊分校和 Adobe Research 联合提出的多模态融合框架，将预训练的大型语言模型（LLMs）扩展到多模态任务中，...

AIプロジェクト2025/12/18

Phi-4-reasoning - 微软推出的Phi-4推理模型系列

Phi-4-reasoning 是微软推出的 140 亿参数的推理模型，专为复杂推理任务设计。通过监督微调（SFT）训练而成，使用了 OpenAI 的 o3-mini 模型生成的高质量推理...

AIプロジェクト2025/12/18

Paper2Coder - 一键将学术论文转为代码库的AI系统

Paper2Coder 是韩国科学技术院推出的多智能体大语言模型（LLM）系统，支持将机器学习领域的科学论文自动转换为代码库。基于规划、分析和代码生成三个阶段，将...

AIプロジェクト2025/12/18

HoloTime - 北大联合鹏城实验室推出的全景4D场景生成框架

HoloTime 是北京大学深圳研究生院和鹏城实验室推出的全景 4D 场景生成框架，基于视频扩散模型将单张全景图像转化为具有真实动态效果的全景视频，进一步重建为...

AIプロジェクト2025/12/18

T2I-R1 - 港中文联合上海AI Lab推出文生图模型

T2I-R1 是香港中文大学和上海AI Lab联合推出的新型文本生成图像模型。基于引入双层推理机制，语义级链式思维（CoT）和 Token 级 CoT，实现高层次图像规划与低...

AIプロジェクト2025/12/18

Cobra - 清华、港中文和腾讯开源的漫画线稿上色框架

Cobra（Efficient Line Art COlorization with BRoAder References）是清华大学、香港中文大学和腾讯ARC实验室推出的漫画线稿上色框架，专为高精度、高效率和...

AIプロジェクト2025/12/18

KeySync - 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架

KeySync 是帝国理工学院和弗罗茨瓦夫大学推出的用在高分辨率口型同步框架，支持将输入音频与视频中的口型动作对齐。KeySync 基于两阶段框架实现，首先生成关...

AIプロジェクト2025/12/18

Omni Reference - Midjourney V7推出的图像参考功能

Omni Reference 是 Midjourney 推出的全能参考功能，支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Midjourney V7...

AIプロジェクト2025/12/18

3DV-TON - 阿里达摩院联合浙大等推出的视频虚拟试穿框架

3DV-TON（Textured 3D-Guided Consistent Video Try-on via Diffusion Models）是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模型的视频虚拟试...

AIプロジェクト2025/12/18

ACE-Step - ACE Studio联合阶跃星辰开源的音乐生成基础模型

ACE-Step 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型，基于创新的架构设计实现高效、连贯且可控的音乐创作。ACE-Step结合扩散模型、深度压缩...

AIプロジェクト2025/12/18

ReasonIR-8B - Meta AI 推出专为推理密集型检索任务设计的模型

ReasonIR-8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.1-8B 训练，采用双编码器架构，将查询和文档分别编码为嵌入向量，通过余弦相...

AIプロジェクト2025/12/18

Voila - 开源端到端语音大模型，实现低延迟语音对话

Voila 是开源的端到端语音大模型，专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力，能直接处理语音输入并生成语音输出，为用户提供流畅且自...

AIプロジェクト2025/12/18

kimi-thinking-preview - 月之暗面推出的多模态思考模型

kimi-thinking-preview 是月之暗面推出的多模态思考模型，具备深度推理能力，擅长解决复杂问题，如代码、数学和工作难题。模型基于 reasoning_content 字段展...

AIプロジェクト2025/12/18

UniTok - 字节联合港大、华中科技推出的统一视觉分词器

UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器，能同时支持视觉生成和理解任务。基于多码本量化技术，将视觉特征分割成多个小块，每块用...

AIプロジェクト2025/12/18

D-DiT - 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-DiT（Dual Diffusion Transformer）是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型，能统一图像生成和理解任务。模型结合连续图像扩...

AIプロジェクト2025/12/18

NoteLLM - 小红书推出的笔记推荐多模态大模型框架

NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别，用大型语言模型（LLM）的强大语义理解能...

AIプロジェクト2025/12/18

Granite 4.0 Tiny Preview - IBM推出的语言模型

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特...

AIプロジェクト2025/12/18

Gemini 2.5 Pro (I/O 版) - 谷歌推出的升级版多模态AI模型

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型，具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...

←1...100 101 102 103 104 105 106...137 →

AIニュース

AIプロジェクト2025/12/18

Rowboat - 开源AI编程工具，快速构建多智能体助手

AIプロジェクト2025/12/18

Qwen2.5-Omni-3B - 阿里 Qwen 团队推出的轻量级多模态 AI 模型

AIプロジェクト2025/12/18

TesserAct - AI 4D具身世界模型，能预测3D场景的动态演变

AIプロジェクト2025/12/18

VoltAgent - 开源的AI Agent构建和编排框架

VoltAgent 是开源的 TypeScript 框架，用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具，简化与大语言模型（LLM）的交互、状态管理、...

AIプロジェクト2025/12/18

Aero-1-Audio - LMMs-Lab 推出的轻量级音频模型

Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型，基于 Qwen-2.5-1.5B 构建，仅包含 1.5 亿参数。专为长音频处理设计，能支持长达 15 分钟的连续音频输入，无...

AIプロジェクト2025/12/18

DianJin-R1 - 阿里云通义点金联合苏大推出的金融推理大模型

AIプロジェクト2025/12/18

X-Fusion - 加州大学联合Adobe等机构推出的多模态融合框架

AIプロジェクト2025/12/18

Phi-4-reasoning - 微软推出的Phi-4推理模型系列

AIプロジェクト2025/12/18

Paper2Coder - 一键将学术论文转为代码库的AI系统

AIプロジェクト2025/12/18

HoloTime - 北大联合鹏城实验室推出的全景4D场景生成框架

AIプロジェクト2025/12/18

T2I-R1 - 港中文联合上海AI Lab推出文生图模型

AIプロジェクト2025/12/18

Cobra - 清华、港中文和腾讯开源的漫画线稿上色框架

Cobra（Efficient Line Art COlorization with BRoAder References）是清华大学、香港中文大学和腾讯ARC实验室推出的漫画线稿上色框架，专为高精度、高效率和...

AIプロジェクト2025/12/18

KeySync - 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架

AIプロジェクト2025/12/18

Omni Reference - Midjourney V7推出的图像参考功能

Omni Reference 是 Midjourney 推出的全能参考功能，支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Midjourney V7...

AIプロジェクト2025/12/18

3DV-TON - 阿里达摩院联合浙大等推出的视频虚拟试穿框架

3DV-TON（Textured 3D-Guided Consistent Video Try-on via Diffusion Models）是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模型的视频虚拟试...

AIプロジェクト2025/12/18

ACE-Step - ACE Studio联合阶跃星辰开源的音乐生成基础模型

AIプロジェクト2025/12/18

ReasonIR-8B - Meta AI 推出专为推理密集型检索任务设计的模型

AIプロジェクト2025/12/18

Voila - 开源端到端语音大模型，实现低延迟语音对话

AIプロジェクト2025/12/18

kimi-thinking-preview - 月之暗面推出的多模态思考模型

AIプロジェクト2025/12/18

UniTok - 字节联合港大、华中科技推出的统一视觉分词器

AIプロジェクト2025/12/18

D-DiT - 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

AIプロジェクト2025/12/18

NoteLLM - 小红书推出的笔记推荐多模态大模型框架

AIプロジェクト2025/12/18

Granite 4.0 Tiny Preview - IBM推出的语言模型

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特...

AIプロジェクト2025/12/18

Gemini 2.5 Pro (I/O 版) - 谷歌推出的升级版多模态AI模型

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型，具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...

すべてのカテゴリ

AIニュース

Rowboat - 开源AI编程工具，快速构建多智能体助手

Qwen2.5-Omni-3B - 阿里 Qwen 团队推出的轻量级多模态 AI 模型

TesserAct - AI 4D具身世界模型，能预测3D场景的动态演变

VoltAgent - 开源的AI Agent构建和编排框架

Aero-1-Audio - LMMs-Lab 推出的轻量级音频模型

DianJin-R1 - 阿里云通义点金联合苏大推出的金融推理大模型

X-Fusion - 加州大学联合Adobe等机构推出的多模态融合框架

Phi-4-reasoning - 微软推出的Phi-4推理模型系列

Paper2Coder - 一键将学术论文转为代码库的AI系统

HoloTime - 北大联合鹏城实验室推出的全景4D场景生成框架

T2I-R1 - 港中文联合上海AI Lab推出文生图模型

Cobra - 清华、港中文和腾讯开源的漫画线稿上色框架

KeySync - 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架

Omni Reference - Midjourney V7推出的图像参考功能

3DV-TON - 阿里达摩院联合浙大等推出的视频虚拟试穿框架

ACE-Step - ACE Studio联合阶跃星辰开源的音乐生成基础模型

ReasonIR-8B - Meta AI 推出专为推理密集型检索任务设计的模型

Voila - 开源端到端语音大模型，实现低延迟语音对话

kimi-thinking-preview - 月之暗面推出的多模态思考模型

UniTok - 字节联合港大、华中科技推出的统一视觉分词器

D-DiT - 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

NoteLLM - 小红书推出的笔记推荐多模态大模型框架

Granite 4.0 Tiny Preview - IBM推出的语言模型

Gemini 2.5 Pro (I/O 版) - 谷歌推出的升级版多模态AI模型

AIニュース

Rowboat - 开源AI编程工具，快速构建多智能体助手

Qwen2.5-Omni-3B - 阿里 Qwen 团队推出的轻量级多模态 AI 模型

TesserAct - AI 4D具身世界模型，能预测3D场景的动态演变

VoltAgent - 开源的AI Agent构建和编排框架

Aero-1-Audio - LMMs-Lab 推出的轻量级音频模型

DianJin-R1 - 阿里云通义点金联合苏大推出的金融推理大模型

X-Fusion - 加州大学联合Adobe等机构推出的多模态融合框架

Phi-4-reasoning - 微软推出的Phi-4推理模型系列

Paper2Coder - 一键将学术论文转为代码库的AI系统

HoloTime - 北大联合鹏城实验室推出的全景4D场景生成框架

T2I-R1 - 港中文联合上海AI Lab推出文生图模型

Cobra - 清华、港中文和腾讯开源的漫画线稿上色框架

KeySync - 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架

Omni Reference - Midjourney V7推出的图像参考功能

3DV-TON - 阿里达摩院联合浙大等推出的视频虚拟试穿框架

ACE-Step - ACE Studio联合阶跃星辰开源的音乐生成基础模型

ReasonIR-8B - Meta AI 推出专为推理密集型检索任务设计的模型

Voila - 开源端到端语音大模型，实现低延迟语音对话

kimi-thinking-preview - 月之暗面推出的多模态思考模型

UniTok - 字节联合港大、华中科技推出的统一视觉分词器

D-DiT - 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

NoteLLM - 小红书推出的笔记推荐多模态大模型框架

Granite 4.0 Tiny Preview - IBM推出的语言模型

Gemini 2.5 Pro (I/O 版) - 谷歌推出的升级版多模态AI模型