AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

DeepRAG - 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架

DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成（RAG）框架，提升大型语言模型（LLMs）在推理和检索任务中的性能。通过将检索增强推理建...

AI Projects12/18/2025

MnnLlmApp - 阿里巴巴开源的离线大模型 Android 手机应用AI助手

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用，支持各类大语言模型（LLM）在手机上离线运行。具备多模态功能，能实现文本生成文本、图像生...

AI Projects12/18/2025

DynamicFace - 小红书联合上海交大等推出的视频换脸技术

DynamicFace是小红书团队推出新型的视频换脸技术，技术通过结合扩散模型和即插即用的时间层，基于3D面部先验知识，实现高质量和一致性的视频换脸效果。 Dynam...

AI Projects12/18/2025

Gemini 2.0 Pro - 谷歌推出的高性能多模态AI模型

Gemini 2.0 Pro是Google推出的高性能实验版AI模型，专为编程性能和复杂提示处理优化。Gemini 2.0 Pro具备200万tokens的超大上下文窗口，能处理和分析海量信息...

AI Projects12/18/2025

Open Deep Research - Deep Research开源复现版智能体，支持切换多种语言模型

Open Deep Research 是开源的 AI 智能体，是Deep Research开源复现项目，基于推理大量网络数据完成复杂的多步骤研究任务。Open Deep Research使用 Firecrawl ...

AI Projects12/18/2025

Chatbox AI - 开源的AI客户端助手，支持多种主流AI模型

Chatbox AI是开源的跨平台AI客户端应用和智能助手，支持 Windows、Mac、Linux、iOS、Android 和网页版，集成多种先进的语言模型（如 ChatGPT、DeepSeek、Clau...

AI Projects12/18/2025

RAG-FiT - 英特尔实验室推出用于开发、增强大模型的开源RAG框架

RAG-FiT（曾用名RAG Foundry）是英特尔实验室推出的开源框架，用在微调（fine-tuning）增强大型语言模型（LLMs）在检索增强生成（RAG）任务中的表现。RAG-FiT...

AI Projects12/18/2025

FluxSR - 上海交大联合华为等高校推出的图像超分辨率模型

FluxSR是新型的单步扩散模型，是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率（Real-ISR）任务。FluxSR基...

AI Projects12/18/2025

VideoJAM - Meta 推出增强视频生成模型运动连贯性的框架

VideoJAM是Meta推出的，用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示，让模型在训练阶段同时学习预测视频的像素和运动信息，在推理阶段...

AI Projects12/18/2025

SynCD - Meta和卡内基梅隆大学开源的文生图合成训练数据集

SynCD（Synthetic Customization Dataset）是卡内基梅隆大学和Meta推出的高质量合成训练数据集，用在提升文本到图像模型的定制化能力。SynCD包含多个相同对象...

AI Projects12/18/2025

MatAnyone - 南洋理工和商汤科技推出的人像视频抠图框架

MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的，针对复杂背景人像视频抠图的先进框架，专注于目标指定的视频抠图任务。MatAnyone基于一致的内存传播模...

AI Projects12/18/2025

JoyGen - 京东和港大推出音频驱动的3D说话人脸视频生成框架

JoyGen是京东科技和香港大学推出的，音频驱动的3D说话人脸视频生成框架，专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特征和面部深度...

AI Projects12/18/2025

EMAGE - 清华联合东大等机构推出的音频生成全身共语手势框架

EMAGE（Expressive Masked Audio-conditioned GEsture modeling）是清华大学、东京大学、庆应义塾大学等机构推出的用在生成全身共语手势框架。EMAGE能根据音...

AI Projects12/18/2025

LIMO - 上海交大推出的高效推理方法，仅需817条训练样本

LIMO（Less Is More for Reasoning）是上海交通大学研究团队提出的高效推理方法，通过极少量高质量的训练样本激活大语言模型（LLM）的复杂推理能力。核心假设...

AI Projects12/18/2025

SANA 1.5 - 英伟联合MIT、清北等机构推出的文生图新框架

SANA 1.5 是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器（Linear Diffusion Transformer），用于文本到图像生成任务。在 SANA 1.0 的基...

AI Projects12/18/2025

ASAP - 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架

ASAP（Aligning Simulation and Real Physics）是卡内基梅隆大学和英伟达联合推出的，用在解决仿人机器人模拟与现实动力学不匹配问题的两阶段框架。ASAP基于...

AI Projects12/18/2025

MAETok - 港大联合北大等机构推出的自动编码器

MAETok（Masked Autoencoders Tokenizer）是卡内基梅隆大学、香港大学、北京大学等机构推出的用在扩散模型的新型图像标记化方法。MAETok基于掩码建模（Mask M...

AI Projects12/18/2025

Eino - 字节跳动开源的大模型应用开发框架

Eino 是字节跳动开源的大模型应用开发框架，能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础，具备稳定的内核、灵活的扩展性和完善的工具生...

AI Projects12/18/2025

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

NutWorld是新加坡国立大学、南洋理工大学和Skywork AI推出的视频处理框架，能将日常单目视频高效地转换为动态3D高斯表示（Gaussian Splatting）。NutWorld基...

AI Projects12/18/2025

AstrBot - 开源多平台聊天机器人及开发框架

AstrBot 是多平台聊天机器人及开发框架，支持多种大语言模型（如 OpenAI GPT、Google Gemini、Llama 等）和多种消息平台（如 QQ、Telegram、微信等）。AstrBo...

AI Projects12/18/2025

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

Lumina-Image 2.0 是开源的高效统一图像生成模型，参数量为26亿，基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色，在...

AI Projects12/18/2025

BEN2 - 自动从图像和视频中移除背景深度学习模型

BEN2（Background Erase Network 2）是Prama LLC开发的深度学习模型，专门用于从图像和视频中快速移除背景并提取前景。基于创新的置信度引导抠图（CGM）管道...

AI Projects12/18/2025

PartEdit - KAUST推出的细粒度图像编辑方法

PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记（称为“部分标记”），让扩散模型精准定位和编辑图像中对象的各...

AI Projects12/18/2025

Agentic Object Detection - 吴恩达团队推出的Agent目标检测技术

Agentic Object Detection 是吴恩达团队开发的新型目标检测技术，通过智能代理（Agent）系统实现无需标注数据的目标检测。用户仅需输入文字提示，AI 基于推理...

←1...76 77 78 79 80 81 82...137 →

AI News

AI Projects12/18/2025

DeepRAG - 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架

AI Projects12/18/2025

MnnLlmApp - 阿里巴巴开源的离线大模型 Android 手机应用AI助手

AI Projects12/18/2025

DynamicFace - 小红书联合上海交大等推出的视频换脸技术

AI Projects12/18/2025

Gemini 2.0 Pro - 谷歌推出的高性能多模态AI模型

AI Projects12/18/2025

Open Deep Research - Deep Research开源复现版智能体，支持切换多种语言模型

Open Deep Research 是开源的 AI 智能体，是Deep Research开源复现项目，基于推理大量网络数据完成复杂的多步骤研究任务。Open Deep Research使用 Firecrawl ...

AI Projects12/18/2025

Chatbox AI - 开源的AI客户端助手，支持多种主流AI模型

Chatbox AI是开源的跨平台AI客户端应用和智能助手，支持 Windows、Mac、Linux、iOS、Android 和网页版，集成多种先进的语言模型（如 ChatGPT、DeepSeek、Clau...

AI Projects12/18/2025

RAG-FiT - 英特尔实验室推出用于开发、增强大模型的开源RAG框架

AI Projects12/18/2025

FluxSR - 上海交大联合华为等高校推出的图像超分辨率模型

AI Projects12/18/2025

VideoJAM - Meta 推出增强视频生成模型运动连贯性的框架

AI Projects12/18/2025

SynCD - Meta和卡内基梅隆大学开源的文生图合成训练数据集

AI Projects12/18/2025

MatAnyone - 南洋理工和商汤科技推出的人像视频抠图框架

AI Projects12/18/2025

JoyGen - 京东和港大推出音频驱动的3D说话人脸视频生成框架

AI Projects12/18/2025

EMAGE - 清华联合东大等机构推出的音频生成全身共语手势框架

EMAGE（Expressive Masked Audio-conditioned GEsture modeling）是清华大学、东京大学、庆应义塾大学等机构推出的用在生成全身共语手势框架。EMAGE能根据音...

AI Projects12/18/2025

LIMO - 上海交大推出的高效推理方法，仅需817条训练样本

AI Projects12/18/2025

SANA 1.5 - 英伟联合MIT、清北等机构推出的文生图新框架

SANA 1.5 是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器（Linear Diffusion Transformer），用于文本到图像生成任务。在 SANA 1.0 的基...

AI Projects12/18/2025

ASAP - 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架

ASAP（Aligning Simulation and Real Physics）是卡内基梅隆大学和英伟达联合推出的，用在解决仿人机器人模拟与现实动力学不匹配问题的两阶段框架。ASAP基于...

AI Projects12/18/2025

MAETok - 港大联合北大等机构推出的自动编码器

MAETok（Masked Autoencoders Tokenizer）是卡内基梅隆大学、香港大学、北京大学等机构推出的用在扩散模型的新型图像标记化方法。MAETok基于掩码建模（Mask M...

AI Projects12/18/2025

Eino - 字节跳动开源的大模型应用开发框架

AI Projects12/18/2025

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

NutWorld是新加坡国立大学、南洋理工大学和Skywork AI推出的视频处理框架，能将日常单目视频高效地转换为动态3D高斯表示（Gaussian Splatting）。NutWorld基...

AI Projects12/18/2025

AstrBot - 开源多平台聊天机器人及开发框架

AstrBot 是多平台聊天机器人及开发框架，支持多种大语言模型（如 OpenAI GPT、Google Gemini、Llama 等）和多种消息平台（如 QQ、Telegram、微信等）。AstrBo...

AI Projects12/18/2025

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

AI Projects12/18/2025

BEN2 - 自动从图像和视频中移除背景深度学习模型

AI Projects12/18/2025

PartEdit - KAUST推出的细粒度图像编辑方法

AI Projects12/18/2025

All Categories

AI News

DeepRAG - 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架

MnnLlmApp - 阿里巴巴开源的离线大模型 Android 手机应用AI助手

DynamicFace - 小红书联合上海交大等推出的视频换脸技术

Gemini 2.0 Pro - 谷歌推出的高性能多模态AI模型

Open Deep Research - Deep Research开源复现版智能体，支持切换多种语言模型

Chatbox AI - 开源的AI客户端助手，支持多种主流AI模型

RAG-FiT - 英特尔实验室推出用于开发、增强大模型的开源RAG框架

FluxSR - 上海交大联合华为等高校推出的图像超分辨率模型

VideoJAM - Meta 推出增强视频生成模型运动连贯性的框架

SynCD - Meta和卡内基梅隆大学开源的文生图合成训练数据集

MatAnyone - 南洋理工和商汤科技推出的人像视频抠图框架

JoyGen - 京东和港大推出音频驱动的3D说话人脸视频生成框架

EMAGE - 清华联合东大等机构推出的音频生成全身共语手势框架

LIMO - 上海交大推出的高效推理方法，仅需817条训练样本

SANA 1.5 - 英伟联合MIT、清北等机构推出的文生图新框架

ASAP - 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架

MAETok - 港大联合北大等机构推出的自动编码器

Eino - 字节跳动开源的大模型应用开发框架

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

AstrBot - 开源多平台聊天机器人及开发框架

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

BEN2 - 自动从图像和视频中移除背景深度学习模型

PartEdit - KAUST推出的细粒度图像编辑方法

Agentic Object Detection - 吴恩达团队推出的Agent目标检测技术

AI News

DeepRAG - 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架

MnnLlmApp - 阿里巴巴开源的离线大模型 Android 手机应用AI助手

DynamicFace - 小红书联合上海交大等推出的视频换脸技术

Gemini 2.0 Pro - 谷歌推出的高性能多模态AI模型

Open Deep Research - Deep Research开源复现版智能体，支持切换多种语言模型

Chatbox AI - 开源的AI客户端助手，支持多种主流AI模型

RAG-FiT - 英特尔实验室推出用于开发、增强大模型的开源RAG框架

FluxSR - 上海交大联合华为等高校推出的图像超分辨率模型

VideoJAM - Meta 推出增强视频生成模型运动连贯性的框架

SynCD - Meta和卡内基梅隆大学开源的文生图合成训练数据集

MatAnyone - 南洋理工和商汤科技推出的人像视频抠图框架

JoyGen - 京东和港大推出音频驱动的3D说话人脸视频生成框架

EMAGE - 清华联合东大等机构推出的音频生成全身共语手势框架

LIMO - 上海交大推出的高效推理方法，仅需817条训练样本

SANA 1.5 - 英伟联合MIT、清北等机构推出的文生图新框架

ASAP - 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架

MAETok - 港大联合北大等机构推出的自动编码器

Eino - 字节跳动开源的大模型应用开发框架

NutWorld - 新加坡国立、南洋理工和Skywork AI推出的视频处理框架

AstrBot - 开源多平台聊天机器人及开发框架

Lumina-Image 2.0 - 上海 AI Lab 开源的统一图像生成模型

BEN2 - 自动从图像和视频中移除背景深度学习模型

PartEdit - KAUST推出的细粒度图像编辑方法

Agentic Object Detection - 吴恩达团队推出的Agent目标检测技术