AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

VQAScore - CMU联合Meta推出的文本到视觉图像生成评估方法

VQAScore是CMU和Meta联合推出的评估方法，基于视觉问答（VQA）模型衡量由文本提示生成的图像质量。VQAScore用计算模型对“Does this figure show {text}?”这一...

AIプロジェクト2025/12/18

AndroidLab - 清华和北大联合推出系统化评估Android智能代理的框架

AndroidLab是用在训练和系统评估Android自主代理的框架，集成文本和图像模态操作环境，统一行动空间和可重现基准测试。AndroidLab支持大型语言模型和多模态模...

AIプロジェクト2025/12/18

Recraft V3 - Recraft推出的AI文本到图像生成模型

Recraft V3是Recraft公司推出的AI文本到图像生成模型，在Hugging Face的文本到图像模型排行榜上以1172的ELO评分荣获第一。模型具有高质量的图像生成和先进的...

AIプロジェクト2025/12/18

Magentic-One - 微软推出的多AI智能体协同完成复杂任务系统

Magentic-One 是微软推出的通用多智能体系统，解决跨领域的复杂网络和文件任务。系统基于多智能体架构，由Orchestrator智能体领导，协调WebSurfer、FileSurfe...

AIプロジェクト2025/12/18

X-Portrait 2 - 字节跳动推出的单图驱动视频生成模型

X-Portrait 2是字节跳动智能创作团队推出的单图视频驱动技术，基于一张静态照片和一段驱动视频生成高质量、电影级视频。X-Portrait 2保留原图身份特征，准确...

AIプロジェクト2025/12/18

Ichigo - 开源的多模态AI语音助手，实时处理语音和文本的交织序列

Ichigo是开源的多模态AI语音助手，采用混合模态模型，能实时处理语音和文本的交织序列。基于将语音直接量化为离散令牌，用统一的变换器架构同时处理语音和文...

AIプロジェクト2025/12/18

CogSound - 智谱AI最新推出的音效模型

CogSound是智谱AI最新推出的音效模型，能为无声视频增添动人的音效。基于GLM-4V的视频理解能力，CogSound能精准识别理解视频背后的语义和情感，为无声视频添...

AIプロジェクト2025/12/18

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

AgentSquare是清华大学团队推出自动搜索和优化大型语言模型（LLM）代理的框架。基于标准化的模块接口抽象，实现AI智能体的高速自我演化和自适应演进。框架包...

AIプロジェクト2025/12/18

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

Fashion-VDM是谷歌和华盛顿大学共同推出的基于视频扩散模型（VDM）的虚拟试穿技术。能在给定服装图像和人物视频的情况下，生成人物穿着指定服装的高质量试穿...

AIプロジェクト2025/12/18

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

Olly.bot是集成于iMessage和SMS的个人AI助手，基于OpenAI大模型，提供网络搜索、文档分析、图片生成等功能。Olly.bot无需下载、注册，不收集用户身份信息，保...

AIプロジェクト2025/12/18

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

AdaCache（Adaptive Caching）是Meta推出的开源技术，能加速AI视频生成过程。AdaCache自适应缓存机制优化计算资源分配，根据不同视频内容的复杂度动态调整计...

AIプロジェクト2025/12/18

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本，5B 系列模型支持生成5至10秒、768P分辨率、16...

AIプロジェクト2025/12/18

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

MiLoRA是参数高效的大型语言模型（LLMs）微调方法，通过更新权重分量来矩阵的次要奇异减少计算和内存成本。方法基于奇异值分解（SVD）将权重矩阵分为主要和次...

AIプロジェクト2025/12/18

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

OpenCoder是墨尔本大学、复旦大学等高校研究人员联合无限光年推出的开源代码大型语言模型（LLM），能提升开源代码LLM的性能至专有模型水平，推动代码AI研究的...

AIプロジェクト2025/12/18

Infinity-MM - 智源推出的千万级多模态指令数据集

Infinity-MM是智源研究院推出的千万级多模态指令数据集，包含4300万条样本，数据量达10TB。数据集经过质量过滤和去重，确保高质量和多样性，能提升开源视觉-...

AIプロジェクト2025/12/18

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

FabricDiffusion是谷歌和卡内基梅隆大学共同推出的高保真度3D服装生成技术，能将现实世界中2D服装图像的纹理和印花高质量地转移到任意形状的3D服装模型上。Fa...

AIプロジェクト2025/12/18

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集，包含500个第一人称视角视频，时长20至120分钟，覆盖77种日常活动，能评估多模态模型对...

AIプロジェクト2025/12/18

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架，实现应用功能与系统体验（如Siri、Spotlight搜索、快捷指令...

AIプロジェクト2025/12/18

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

DimensionX是香港科技大学、清华大学和生数科技共同推出的框架，能从单张图片生成高逼真度的3D和4D场景，基于视频扩散技术实现对空间和时间维度的精确控制。...

AIプロジェクト2025/12/18

SeedEdit - 字节豆包团队推出的AI图像编辑模型

SeedEdit是字节跳动豆包大模型团队推出的通用图像编辑模型，基于简单的自然语言指令编辑图像，包括修图、换装、美化、风格转换及在指定区域添加或删除元素等...

AIプロジェクト2025/12/18

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

HK-O1aw是香港生成式AI研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR)与北京大学对齐团队(PKU-Alignment Team)合作推出的全球首个慢思考范式法律推理大模型...

AIプロジェクト2025/12/18

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

AnimePro FLUX是基于Apache 2.0许可的动漫风格图像生成模型，专为生成高质量二次元插画设计。AnimePro FLUX基于Flux.1 Shnell模型微调，克服DEV版本的许可限...

AIプロジェクト2025/12/18

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

VideoChat是开源的实时数字人对话系统，支持语音输入和实时对话功能。用户自定义数字人的形象和音色，无需训练即可进行音色克隆，首包延迟可低至3秒，适用于...

AIプロジェクト2025/12/18

TableGPT2 - 浙大推出整合与处理表格数据的多模态大模型

TableGPT2是浙江大学推出的新型大型多模态模型，针对表格数据的整合与处理。首次将结构化数据作为独立模态进行训练，直接理解并操作数据库、Excel等数据，执...

←1...51 52 53 54 55 56 57...137 →

AIニュース

AIプロジェクト2025/12/18

VQAScore - CMU联合Meta推出的文本到视觉图像生成评估方法

VQAScore是CMU和Meta联合推出的评估方法，基于视觉问答（VQA）模型衡量由文本提示生成的图像质量。VQAScore用计算模型对“Does this figure show {text}?”这一...

AIプロジェクト2025/12/18

AndroidLab - 清华和北大联合推出系统化评估Android智能代理的框架

AIプロジェクト2025/12/18

Recraft V3 - Recraft推出的AI文本到图像生成模型

AIプロジェクト2025/12/18

Magentic-One - 微软推出的多AI智能体协同完成复杂任务系统

AIプロジェクト2025/12/18

X-Portrait 2 - 字节跳动推出的单图驱动视频生成模型

AIプロジェクト2025/12/18

Ichigo - 开源的多模态AI语音助手，实时处理语音和文本的交织序列

AIプロジェクト2025/12/18

CogSound - 智谱AI最新推出的音效模型

AIプロジェクト2025/12/18

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

AIプロジェクト2025/12/18

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

AIプロジェクト2025/12/18

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

AIプロジェクト2025/12/18

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

AIプロジェクト2025/12/18

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本，5B 系列模型支持生成5至10秒、768P分辨率、16...

AIプロジェクト2025/12/18

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

AIプロジェクト2025/12/18

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

AIプロジェクト2025/12/18

Infinity-MM - 智源推出的千万级多模态指令数据集

AIプロジェクト2025/12/18

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

AIプロジェクト2025/12/18

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

AIプロジェクト2025/12/18

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架，实现应用功能与系统体验（如Siri、Spotlight搜索、快捷指令...

AIプロジェクト2025/12/18

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

AIプロジェクト2025/12/18

SeedEdit - 字节豆包团队推出的AI图像编辑模型

AIプロジェクト2025/12/18

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

HK-O1aw是香港生成式AI研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR)与北京大学对齐团队(PKU-Alignment Team)合作推出的全球首个慢思考范式法律推理大模型...

AIプロジェクト2025/12/18

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

AnimePro FLUX是基于Apache 2.0许可的动漫风格图像生成模型，专为生成高质量二次元插画设计。AnimePro FLUX基于Flux.1 Shnell模型微调，克服DEV版本的许可限...

AIプロジェクト2025/12/18

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

VQAScore - CMU联合Meta推出的文本到视觉图像生成评估方法

AndroidLab - 清华和北大联合推出系统化评估Android智能代理的框架

Recraft V3 - Recraft推出的AI文本到图像生成模型

Magentic-One - 微软推出的多AI智能体协同完成复杂任务系统

X-Portrait 2 - 字节跳动推出的单图驱动视频生成模型

Ichigo - 开源的多模态AI语音助手，实时处理语音和文本的交织序列

CogSound - 智谱AI最新推出的音效模型

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

Infinity-MM - 智源推出的千万级多模态指令数据集

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

SeedEdit - 字节豆包团队推出的AI图像编辑模型

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

TableGPT2 - 浙大推出整合与处理表格数据的多模态大模型

AIニュース

VQAScore - CMU联合Meta推出的文本到视觉图像生成评估方法

AndroidLab - 清华和北大联合推出系统化评估Android智能代理的框架

Recraft V3 - Recraft推出的AI文本到图像生成模型

Magentic-One - 微软推出的多AI智能体协同完成复杂任务系统

X-Portrait 2 - 字节跳动推出的单图驱动视频生成模型

Ichigo - 开源的多模态AI语音助手，实时处理语音和文本的交织序列

CogSound - 智谱AI最新推出的音效模型

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

Infinity-MM - 智源推出的千万级多模态指令数据集

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

SeedEdit - 字节豆包团队推出的AI图像编辑模型

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

TableGPT2 - 浙大推出整合与处理表格数据的多模态大模型