AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Eino - 字节跳动开源的大模型应用开发框架

Eino 是字节跳动开源的大模型应用开发框架，能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础，具备稳定的内核、灵活的扩展性和完善的工具生...

AIプロジェクト2025/12/18

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

NutWorld是新加坡国立大学、南洋理工大学和Skywork AI推出的视频处理框架，能将日常单目视频高效地转换为动态3D高斯表示（Gaussian Splatting）。NutWorld基...

AIプロジェクト2025/12/18

AstrBot - 开源多平台聊天机器人及开发框架

AstrBot 是多平台聊天机器人及开发框架，支持多种大语言模型（如 OpenAI GPT、Google Gemini、Llama 等）和多种消息平台（如 QQ、Telegram、微信等）。AstrBo...

AIプロジェクト2025/12/18

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

Lumina-Image 2.0 是开源的高效统一图像生成模型，参数量为26亿，基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色，在...

AIプロジェクト2025/12/18

BEN2 - 自动从图像和视频中移除背景深度学习模型

BEN2（Background Erase Network 2）是Prama LLC开发的深度学习模型，专门用于从图像和视频中快速移除背景并提取前景。基于创新的置信度引导抠图（CGM）管道...

AIプロジェクト2025/12/18

PartEdit - KAUST推出的细粒度图像编辑方法

PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记（称为“部分标记”），让扩散模型精准定位和编辑图像中对象的各...

AIプロジェクト2025/12/18

Agentic Object Detection - 吴恩达团队推出的Agent目标检测技术

Agentic Object Detection 是吴恩达团队开发的新型目标检测技术，通过智能代理（Agent）系统实现无需标注数据的目标检测。用户仅需输入文字提示，AI 基于推理...

AIプロジェクト2025/12/18

Agno - 用于构建多模态智能体的轻量级框架

Agno 是构建智能代理（Agents）的轻量级框架。Agno 支持多模态（文本、图像、音频、视频）和多代理协作，能快速创建代理，速度比 LangGraph 快 5000 倍，支持...

AIプロジェクト2025/12/18

Ola - 清华联合腾讯等推出的全模态语言模型

Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略，逐步扩展语言模型支持的模态，从图像和文...

AIプロジェクト2025/12/18

AlphaGeometry2 - 谷歌 DeepMind 推出解决复杂几何问题的AI系统

AlphaGeometry2 是谷歌 DeepMind 推出的先进的人工智能系统，专门用于解决国际数学奥林匹克竞赛（IMO）中的几何问题。结合了神经符号方法，将谷歌 Gemini 系...

AIプロジェクト2025/12/18

EliGen - 浙大联合阿里推出的新型实体级可控图像生成框架

EliGen是浙江大学和阿里巴巴集团联合开发的新型的实体级可控图像生成框架，通过引入区域注意力机制，无需额外参数即可将实体提示和任意形状的空间掩码无缝集...

AIプロジェクト2025/12/18

Hibiki - Kyutai Labs 推出的实时语音翻译模型

Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型，能实时将一种语言的语音翻译成另一种语言的语音或文本。Hibiki基于多流语言模型架构，同步处理源语...

AIプロジェクト2025/12/18

HMA - MIT联合Meta等推出的机器人动作视频动态建模方法

HMA（Heterogeneous Masked Autoregression）是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的，用在建模机器人动作视频动态的方法。HMA基于异构预训练，用...

AIプロジェクト2025/12/18

DeepRant 鲸喷 - 专为游戏玩家设计的多语言快捷翻译开源工具

DeepRant（中文名：鲸喷）是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能够帮助玩家在国际服务器中快速进行文字交流，消除语言障碍。玩家在游戏中选中...

AIプロジェクト2025/12/18

StochSync - AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像

StochSync（Stochastic Diffusion Synchronization）是创新的图像生成技术，专门用于在复杂空间（如360°全景图或3D表面纹理）中生成高质量图像。结合了扩散同...

AIプロジェクト2025/12/18

Sonic - 腾讯联合浙大推出的音频驱动肖像动画框架

Sonic是腾讯和浙江大学推出的音频驱动肖像动画框架，基于全局音频感知生成逼真的面部表情和动作。Sonic基于上下文增强音频学习和运动解耦控制器，分别提取音...

AIプロジェクト2025/12/18

FireRedASR - 小红书开源的自动语音识别模型

FireRedASR 是小红书开源的工业级自动语音识别（ASR）模型家族，支持普通话、中文方言和英语，在普通话 ASR 基准测试中达到了新的最佳水平（SOTA），在歌词识...

AIプロジェクト2025/12/18

MVoT - 微软联合剑桥和中科院推出的多模态推理可视化框架

MVoT（Multimodal Visualization-of-Thought）是微软研究院、剑桥大学语言技术实验室、中国科学院自动化研究所推出的新型多模态推理范式，基于生成图像可视化...

AIプロジェクト2025/12/18

DynVFX - AI视频增强技术，将新动态内容与原始视频无缝融合

DynVFX是创新的视频增强技术，能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉语言模型（VLM），实现了在不...

AIプロジェクト2025/12/18

WorldSense - 小红书联合上海交大推出的多模态全面评测新基准

WorldSense是小红书和上海交通大学推出的，用在评估多模态大型语言模型（MLLMs）在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSen...

AIプロジェクト2025/12/18

Kiln AI- 开源 AI 原型设计和数据集协作开发工具，微调专属模型

Kiln AI是开源的 AI 开发工具，能简化大型语言模型（LLM）的微调、合成数据生成和数据集协作。Kiln AI提供直观的桌面应用程序，支持 Windows、MacOS 和 Linux...

AIプロジェクト2025/12/18

Airweave - 将任何应用程序转为 Agent 知识库的开源工具

Airweave 是开源工具，能将任何应用程序的数据（包括API、数据库、网站等）同步到图数据库和向量数据库中，让数据能基于智能代理或搜索机制进行检索。Airweav...

AIプロジェクト2025/12/18

MotionCanvas - 港中文和 Adobe 等机构推出的可控图像到视频生成方法

MotionCanvas是香港中文大学、Adobe 研究院和莫纳什大学推出的图像到视频（I2V）生成方法，能将静态图像转化为具有丰富动态效果的视频。MotionCanvas基于引入...

AIプロジェクト2025/12/18

MedRAX - AI医学推理Agent，用于胸部X光检查和解决复杂医学问题

MedRAX（Medical Reasoning Agent for Chest X-ray）是专门用于胸部X光检查的医学推理AI代理。通过整合最先进的胸部X光分析工具和多模态大型语言模型，形成一...

←1...77 78 79 80 81 82 83...137 →

AIニュース

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Eino - 字节跳动开源的大模型应用开发框架

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

AstrBot - 开源多平台聊天机器人及开发框架

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

BEN2 - 自动从图像和视频中移除背景深度学习模型

PartEdit - KAUST推出的细粒度图像编辑方法

Agentic Object Detection - 吴恩达团队推出的Agent目标检测技术

Agno - 用于构建多模态智能体的轻量级框架

Ola - 清华联合腾讯等推出的全模态语言模型

AlphaGeometry2 - 谷歌 DeepMind 推出解决复杂几何问题的AI系统

EliGen - 浙大联合阿里推出的新型实体级可控图像生成框架

Hibiki - Kyutai Labs 推出的实时语音翻译模型

HMA - MIT联合Meta等推出的机器人动作视频动态建模方法

DeepRant 鲸喷 - 专为游戏玩家设计的多语言快捷翻译开源工具

StochSync - AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像

Sonic - 腾讯联合浙大推出的音频驱动肖像动画框架

FireRedASR - 小红书开源的自动语音识别模型

MVoT - 微软联合剑桥和中科院推出的多模态推理可视化框架

DynVFX - AI视频增强技术，将新动态内容与原始视频无缝融合

WorldSense - 小红书联合上海交大推出的多模态全面评测新基准

Kiln AI- 开源 AI 原型设计和数据集协作开发工具，微调专属模型

Airweave - 将任何应用程序转为 Agent 知识库的开源工具

MotionCanvas - 港中文和 Adobe 等机构推出的可控图像到视频生成方法

MedRAX - AI医学推理Agent，用于胸部X光检查和解决复杂医学问题

AIニュース

Eino - 字节跳动开源的大模型应用开发框架

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

AstrBot - 开源多平台聊天机器人及开发框架

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

BEN2 - 自动从图像和视频中移除背景深度学习模型

PartEdit - KAUST推出的细粒度图像编辑方法

Agentic Object Detection - 吴恩达团队推出的Agent目标检测技术

Agno - 用于构建多模态智能体的轻量级框架

Ola - 清华联合腾讯等推出的全模态语言模型

AlphaGeometry2 - 谷歌 DeepMind 推出解决复杂几何问题的AI系统

EliGen - 浙大联合阿里推出的新型实体级可控图像生成框架

Hibiki - Kyutai Labs 推出的实时语音翻译模型

HMA - MIT联合Meta等推出的机器人动作视频动态建模方法

DeepRant 鲸喷 - 专为游戏玩家设计的多语言快捷翻译开源工具

StochSync - AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像

Sonic - 腾讯联合浙大推出的音频驱动肖像动画框架

FireRedASR - 小红书开源的自动语音识别模型

MVoT - 微软联合剑桥和中科院推出的多模态推理可视化框架

DynVFX - AI视频增强技术，将新动态内容与原始视频无缝融合

WorldSense - 小红书联合上海交大推出的多模态全面评测新基准

Kiln AI- 开源 AI 原型设计和数据集协作开发工具，微调专属模型

Airweave - 将任何应用程序转为 Agent 知识库的开源工具

MotionCanvas - 港中文和 Adobe 等机构推出的可控图像到视频生成方法

MedRAX - AI医学推理Agent，用于胸部X光检查和解决复杂医学问题