AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Gen2Act - 谷歌、卡内基梅隆、斯坦福联合推出生成人类视频引导机器人操作策略

Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学共同推出的一种机器人操作策略，基于预测网络数据中的运动信息来生成人类视频，并将视频用在引导机器人执行新任...

AIプロジェクト2025/12/18

T2V-Turbo - 谷歌开源的文本到视频生成模型

T2V-Turbo是一种先进的文本到视频生成模型，由Google、UC Santa Barbara（加利福尼亚大学圣塔芭芭拉分校）、和University of Waterloo（滑铁卢大学）的研究人...

AIプロジェクト2025/12/18

FLUX.1-Turbo-Alpha - 阿里推出的文本到图像生成模型，基于FLUX.1-dev

FLUX.1-Turbo-Alpha是阿里妈妈创意团队基于FLUX.1-dev模型训练的8步蒸馏Lora模型。基于多头判别器技术，升图像生成的质量，支持文本到图像的生成及修复控制网...

AIプロジェクト2025/12/18

OpenR - 伦敦大学联合多所高校推出提升大模型推理能力的框架

OpenR是一个由伦敦大学学院（UCL）、上海交通大学、利物浦大学、香港科技大学（广州）和西湖大学联合开源的全链条训练框架，旨在提升大型语言模型（LLM）的复...

AIプロジェクト2025/12/18

Agent-S - 基于图形用户界面实现人机交互自动化的代理框架

Agent-S 是创新的代理框架，旨在基于图形用户界面（GUI）实现人机交互的自动化。Agent-S 基于模拟人类的操作方式，用鼠标和键盘直接与计算机交互，处理复杂的...

AIプロジェクト2025/12/18

Adobe Firefly - Adobe推出的系列创意生成式AI模型

Adobe Firefly 是 Adobe 推出的一系列创意生成式 AI 模型，旨在帮助用户扩展其天生的创造力。这些模型集成在 Adobe 的旗舰应用程序和 Adobe Stock 中，支持的...

AIプロジェクト2025/12/18

Augmented Physics - 将教科书静态图表生成交互式物理模拟的AI技术

Augmented Physics是一个创新的教育工具，基于集成机器学习技术，将物理教科书中的静态图表转换成互动式和嵌入式的物理模拟。工具基于先进的计算机视觉技术，...

AIプロジェクト2025/12/18

podlm-public - 开源的AI博客生成工具，支持网页URL、文本转换成博客

podlm-public是一个开源AI播客工具，旨在创建一个中文版的NotebookLM替代品，专门用在将任意URL转换成播客内容，再推送到小宇宙平台。项目基于先进的AI技术，...

AIプロジェクト2025/12/18

Yi-Lightning - 零一万物最新推出的高性能高速度旗舰模型

Yi-Lightning 是零一万物公司最新发布的旗舰模型，在国际权威盲测榜单 LMSYS 上取得了显著成绩，超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic C...

AIプロジェクト2025/12/18

FunASR - 阿里开源的多功能语音识别工具包

FunASR是由阿里巴巴达摩院开源的语音识别工具包，提供包括语音识别（ASR）、语音活动检测（VAD）、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR...

AIプロジェクト2025/12/18

CleanS2S - 流式语音到语音交互智能体原型，同时进行听和说

CleanS2S是一个流式语音到语音（S2S）交互智能体原型，提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现，简化配置和理解过程，便于用户和研究人...

AIプロジェクト2025/12/18

Hallo2 - 复旦、百度和南大共同推出的音频驱动视频生成模型

Hallo2是复旦大学、百度公司和南京大学共同推出的音频驱动视频生成模型。能将单张参考图片和持续几分钟的音频输入结合起来，基于可选的文本提示调节肖像表情...

AIプロジェクト2025/12/18

模型判官 - 在线AI模型评测平台，三个模型生成回答，第四个模型进行评判

模型判官是一个基于 Next.js 构建的在线AI模型评测平台，用户输入问题并选择多个AI模型进行测试，帮助用户快速识别出最适于需求的AI模型。平台的特色在于，提...

AIプロジェクト2025/12/18

AgentStack - 开发者快速构建AI代理的开源项目

AgentStack是一个开源工具，旨在帮助开发者快速构建AI代理项目。基于提供一个预配置的模板和集成流行的代理框架及大型语言模型（LLM）提供商，简化从零开始创...

AIプロジェクト2025/12/18

Marco - 阿里推出的商用翻译大模型，支持15个语种

Marco是阿里国际最新推出的大规模商用翻译大模型，支持15种全球主流语种，包括中、英、日、韩、西、法等。在BLEU评测指标上超越Google翻译、DeepL、GPT-4等竞...

AIプロジェクト2025/12/18

Ministral 3B/8B - Mistral AI推出的两款新型AI小模型

Ministral 3B和8B是由Mistral AI推出的两款新型AI小模型，专为设备端计算和边缘使用场景设计。在知识、常识、推理、功能调用和效率方面为10亿参数以下的类别...

AIプロジェクト2025/12/18

TANGO - 东京大学和CyberAgent AI Lab推出声音驱动全身手势视频生成框架

TANGO 是一个由东京大学和 CyberAgent AI Lab 共同推出的开源框架，专注于生成与目标语音同步的全身手势视频。基于分层音频运动嵌入和扩散插值网络，将目标语...

AIプロジェクト2025/12/18

Nemotron-70B-Instruct - 英伟达推出的大语言模型

Nemotron-70B-Instruct 是英伟达（NVIDIA）发布的一个大型语言模型，基于一种新颖的混合训练方法提升模型遵循指令时的响应质量和一致性。模型结合Bradley-Ter...

AIプロジェクト2025/12/18

Sana - 英伟达、麻省和清华联合推出的文本到图像生成框架

SANA是由NVIDIA、麻省理工学院和清华大学共同推出的文本到图像生成框架，能高效地生成高达4096×4096分辨率的高清晰度图像。SANA基于深度压缩自编码器、线性扩...

AIプロジェクト2025/12/18

Chat2DB - AI数据库管理和分析工具，自然语言生成SQL

Chat2DB是一款AI驱动的数据库管理和分析工具，基于自然语言处理技术，支持用户用自然语言与数据库进行交互，简化SQL代码的编写和数据库管理。Chat2DB支持多种...

AIプロジェクト2025/12/18

IterComp - 清北、牛津等多所高校联合推出的文本到图像生成框架

IterComp是一个由清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学和普林斯顿大学的研究人员联合推出的文本到图像生成框架。基于迭代反馈学习机制...

AIプロジェクト2025/12/18

LayerSkip - Meta推出加速大型语言模型推理过程的技术

LayerSkip是一种用在加速大型语言模型（LLMs）推理过程的技术。基于在训练阶段应用层dropout和早期退出损失，让模型在推理时从早期层开始更准确地退出，不需...

AIプロジェクト2025/12/18

Spirit LM - Meta推出多模态语言模型，无缝集成语音和文本

Spirit LM是由Meta AI团队推出的一种多模态语言模型，能无缝地混合文本和语音数据。Spirit LM基于一个预训练的文本语言模型，用持续在文本和语音单元上的训练...

AIプロジェクト2025/12/18

Story-Adapter - 无需额外训练的长篇故事可视化框架

Story-Adapter 是一种新型的长篇故事可视化框架，能在保持语义一致性的同时，生成高质量且具有细腻交互的故事图像序列。通过迭代方式，基于全局参考交叉注意...

←1...45 46 47 48 49 50 51...137 →

AIニュース

AIプロジェクト2025/12/18

Gen2Act - 谷歌、卡内基梅隆、斯坦福联合推出生成人类视频引导机器人操作策略

AIプロジェクト2025/12/18

T2V-Turbo - 谷歌开源的文本到视频生成模型

T2V-Turbo是一种先进的文本到视频生成模型，由Google、UC Santa Barbara（加利福尼亚大学圣塔芭芭拉分校）、和University of Waterloo（滑铁卢大学）的研究人...

AIプロジェクト2025/12/18

FLUX.1-Turbo-Alpha - 阿里推出的文本到图像生成模型，基于FLUX.1-dev

AIプロジェクト2025/12/18

OpenR - 伦敦大学联合多所高校推出提升大模型推理能力的框架

AIプロジェクト2025/12/18

Agent-S - 基于图形用户界面实现人机交互自动化的代理框架

AIプロジェクト2025/12/18

Adobe Firefly - Adobe推出的系列创意生成式AI模型

Adobe Firefly 是 Adobe 推出的一系列创意生成式 AI 模型，旨在帮助用户扩展其天生的创造力。这些模型集成在 Adobe 的旗舰应用程序和 Adobe Stock 中，支持的...

AIプロジェクト2025/12/18

Augmented Physics - 将教科书静态图表生成交互式物理模拟的AI技术

AIプロジェクト2025/12/18

podlm-public - 开源的AI博客生成工具，支持网页URL、文本转换成博客

AIプロジェクト2025/12/18

Yi-Lightning - 零一万物最新推出的高性能高速度旗舰模型

Yi-Lightning 是零一万物公司最新发布的旗舰模型，在国际权威盲测榜单 LMSYS 上取得了显著成绩，超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic C...

AIプロジェクト2025/12/18

FunASR - 阿里开源的多功能语音识别工具包

AIプロジェクト2025/12/18

CleanS2S - 流式语音到语音交互智能体原型，同时进行听和说

AIプロジェクト2025/12/18

Hallo2 - 复旦、百度和南大共同推出的音频驱动视频生成模型

AIプロジェクト2025/12/18

模型判官 - 在线AI模型评测平台，三个模型生成回答，第四个模型进行评判

AIプロジェクト2025/12/18

AgentStack - 开发者快速构建AI代理的开源项目

AIプロジェクト2025/12/18

Marco - 阿里推出的商用翻译大模型，支持15个语种

AIプロジェクト2025/12/18

Ministral 3B/8B - Mistral AI推出的两款新型AI小模型

AIプロジェクト2025/12/18

TANGO - 东京大学和CyberAgent AI Lab推出声音驱动全身手势视频生成框架

AIプロジェクト2025/12/18

Nemotron-70B-Instruct - 英伟达推出的大语言模型

AIプロジェクト2025/12/18

Sana - 英伟达、麻省和清华联合推出的文本到图像生成框架

AIプロジェクト2025/12/18

Chat2DB - AI数据库管理和分析工具，自然语言生成SQL

AIプロジェクト2025/12/18

IterComp - 清北、牛津等多所高校联合推出的文本到图像生成框架

AIプロジェクト2025/12/18

LayerSkip - Meta推出加速大型语言模型推理过程的技术

AIプロジェクト2025/12/18

Spirit LM - Meta推出多模态语言模型，无缝集成语音和文本

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Gen2Act - 谷歌、卡内基梅隆、斯坦福联合推出生成人类视频引导机器人操作策略

T2V-Turbo - 谷歌开源的文本到视频生成模型

FLUX.1-Turbo-Alpha - 阿里推出的文本到图像生成模型，基于FLUX.1-dev

OpenR - 伦敦大学联合多所高校推出提升大模型推理能力的框架

Agent-S - 基于图形用户界面实现人机交互自动化的代理框架

Adobe Firefly - Adobe推出的系列创意生成式AI模型

Augmented Physics - 将教科书静态图表生成交互式物理模拟的AI技术

podlm-public - 开源的AI博客生成工具，支持网页URL、文本转换成博客

Yi-Lightning - 零一万物最新推出的高性能高速度旗舰模型

FunASR - 阿里开源的多功能语音识别工具包

CleanS2S - 流式语音到语音交互智能体原型，同时进行听和说

Hallo2 - 复旦、百度和南大共同推出的音频驱动视频生成模型

模型判官 - 在线AI模型评测平台，三个模型生成回答，第四个模型进行评判

AgentStack - 开发者快速构建AI代理的开源项目

Marco - 阿里推出的商用翻译大模型，支持15个语种

Ministral 3B/8B - Mistral AI推出的两款新型AI小模型

TANGO - 东京大学和CyberAgent AI Lab推出声音驱动全身手势视频生成框架

Nemotron-70B-Instruct - 英伟达推出的大语言模型

Sana - 英伟达、麻省和清华联合推出的文本到图像生成框架

Chat2DB - AI数据库管理和分析工具，自然语言生成SQL

IterComp - 清北、牛津等多所高校联合推出的文本到图像生成框架

LayerSkip - Meta推出加速大型语言模型推理过程的技术

Spirit LM - Meta推出多模态语言模型，无缝集成语音和文本

Story-Adapter - 无需额外训练的长篇故事可视化框架

AIニュース

Gen2Act - 谷歌、卡内基梅隆、斯坦福联合推出生成人类视频引导机器人操作策略

T2V-Turbo - 谷歌开源的文本到视频生成模型

FLUX.1-Turbo-Alpha - 阿里推出的文本到图像生成模型，基于FLUX.1-dev

OpenR - 伦敦大学联合多所高校推出提升大模型推理能力的框架

Agent-S - 基于图形用户界面实现人机交互自动化的代理框架

Adobe Firefly - Adobe推出的系列创意生成式AI模型

Augmented Physics - 将教科书静态图表生成交互式物理模拟的AI技术

podlm-public - 开源的AI博客生成工具，支持网页URL、文本转换成博客

Yi-Lightning - 零一万物最新推出的高性能高速度旗舰模型

FunASR - 阿里开源的多功能语音识别工具包

CleanS2S - 流式语音到语音交互智能体原型，同时进行听和说

Hallo2 - 复旦、百度和南大共同推出的音频驱动视频生成模型

模型判官 - 在线AI模型评测平台，三个模型生成回答，第四个模型进行评判

AgentStack - 开发者快速构建AI代理的开源项目

Marco - 阿里推出的商用翻译大模型，支持15个语种

Ministral 3B/8B - Mistral AI推出的两款新型AI小模型

TANGO - 东京大学和CyberAgent AI Lab推出声音驱动全身手势视频生成框架

Nemotron-70B-Instruct - 英伟达推出的大语言模型

Sana - 英伟达、麻省和清华联合推出的文本到图像生成框架

Chat2DB - AI数据库管理和分析工具，自然语言生成SQL

IterComp - 清北、牛津等多所高校联合推出的文本到图像生成框架

LayerSkip - Meta推出加速大型语言模型推理过程的技术

Spirit LM - Meta推出多模态语言模型，无缝集成语音和文本

Story-Adapter - 无需额外训练的长篇故事可视化框架