AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Seer - 上海 AI Lab 联合北大等机构推出的端到端操作模型

Seer是由上海AI实验室、北京大学计算机科学与技术学院、北京大学软件与微电子学院等机构联合推出的端到端操作模型，实现机器人视觉预测与动作执行的高度协同...

AI Projects12/18/2025

ArtCrafter - 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架

ArtCrafter是清华大学、鹏城实验室和联想研究院共同推出的文本到图像风格迁移框架，基于扩散模型，解决传统方法在风格表达、内容一致性和输出多样性方面的局...

AI Projects12/18/2025

Ingredients - 多ID照片定制视频生成框架，基于多ID照片与视频扩散相结合

Ingredients是强大的框架，基于将多个特定身份（ID）照片与视频扩散Transformer相结合，用在定制视频创作。Ingredients基于三个核心模块实现高度定制化的视频...

AI Projects12/18/2025

MultiBooth - 清华联合 Meta 等机构推出的多概念图像生成方法

MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法，能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...

AI Projects12/18/2025

Aria-UI - 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型

Aria-UI是香港大学和Rhymes AI共同推出的为图形用户界面（GUI）定位任务设计的大型多模态模型。基于纯视觉方法，不依赖于HTML或AXTree等辅助输入，用大规模、...

AI Projects12/18/2025

TransPixar - 港中文联合 Adobe 等机构开源的生成透明背景视频技术

TransPixar是香港中文大学、Adobe研究院、香港科技大学和智能摩尔联合开源的，先进的文本到视频生成方法，扩展预训练的RGB视频模型生成包含透明度信息的RGBA...

AI Projects12/18/2025

STAR - 南大、字节、西南大学联合开源的现实世界视频超分辨率框架

STAR是南京大学、字节跳动、西南大学联合推出的，创新的现实世界视频超分辨率（VSR）框架，能从低分辨率（LR）视频生成高分辨率（HR）视频，同时保持细节清晰...

AI Projects12/18/2025

万相2.1 - 通义万相最新推出的视频生成模型

万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构，增强时空上下文建模能力，支持无限长1080P视频的高效编解码，首次实现中文文字视频生成...

AI Projects12/18/2025

星火纪要 - 科大讯飞推出的会议交流总结和分析平台

星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台，广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容...

AI Projects12/18/2025

Hallo3 - 复旦联合百度开源的高动态与真实感肖像动画生成框架

Hallo3是复旦大学和百度公司联合推出的，基于扩散变换器网络（Diffusion Transformer Networks）的肖像图像动画技术，能生成高度动态和逼真的视频。Hallo3基...

AI Projects12/18/2025

rStar-Math - 微软推出的小模型复杂推理与自进化SLMs的创新技术

rStar-Math是微软亚洲研究院推出的创新研究项目，基于蒙特卡洛树搜索（MCTS）驱动的深度思考，使小型语言模型（SLMs）在数学推理方面达到甚至超越OpenAI大型...

AI Projects12/18/2025

SPAR3D - Stability AI等机构推出的单试图重建 3D 网络模型

SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的，先进的单图生成3D模型方法，能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计，第一阶段...

AI Projects12/18/2025

Search-o1 - 人大联合清华推出自主知识检索增强的推理框架

Search-o1是中国人民大学和清华大学推出的创新框架，能提升大型推理模型（LRMs）在面对复杂问题时的推理能力。基于整合代理检索增强生成（RAG）机制和Reason-...

AI Projects12/18/2025

ConceptMaster - 高保真多概念视频定制生成的创新 AI 框架

ConceptMaster是用于多概念视频定制的创新框架，能在无需测试时调优的情况下，在扩散Transformer模型上生成高质量且概念一致的定制视频。框架通过学习解耦的...

AI Projects12/18/2025

日日新融合大模型 - 商汤科技推出的原生融合模态大模型

“日日新”融合大模型（SenseNova）是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态，深度推理能力与多模态信息处理能力均大幅提升...

AI Projects12/18/2025

Agent Laboratory - AMD 联合约翰·霍普金斯大学推出的自主科研 Agent

Agent Laboratory是AMD和约翰·霍普金斯大学推出，基于大型语言模型（LLM）的自主研究框架，能加速科学发现、降低成本并提高研究质量。Agent Laboratory接受人...

AI Projects12/18/2025

新言意码 - 前月之暗面明超平创立的 AI Coding 项目

新言意码是专注于AI编程应用开发的公司，由前月之暗面海外产品Noisee的明超平创立。公司全称深圳新言意码科技有限公司，成立于2024年9月23日，位于广东省深圳...

AI Projects12/18/2025

PPTAgent - 中科院推出的自动生成高质量演示文稿框架

PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架，基于模仿人类工作流程的两阶段编辑方法，从文档自动生成高质量的演示文稿。PPTAgent分析...

AI Projects12/18/2025

HoloDrive - 商汤联合上海AI Lab等机构推出的2D-3D多模态街道场景生成框架

HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生成相机图像和激光雷达点云，填补自动驾驶中2D...

AI Projects12/18/2025

Perception-as-Control - 阿里通义实验室推出的图像动画框架

Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架，能根据用户意图实现细粒度的运动控制。Perception-as-Control基于构建3D感知运动表示，将相...

AI Projects12/18/2025

Motion Dreamer - 香港科技大学推出的运动合理视频生成框架

Motion Dreamer是香港科技大学（广州）研究者提出的视频生成框架，生成运动合理视频。基于两阶段生成方式，先基于输入图像和运动条件生成中间运动表示，再利...

AI Projects12/18/2025

Sky-T1 - NovaSky 开源的推理 AI 模型，可从零开始复现该模型

Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型，名为Sky-T1-32B-Preview。是首个开源推理模型，训练数据集和代码均...

AI Projects12/18/2025

FaceLift - Adobe 联合加州大学推出的单张图像到 3D 头部模型生成技术

FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术，能从单一的人脸图像中重建出360度的头部模型。FaceLift基于两阶段的流程实现：基...

AI Projects12/18/2025

SVFR - 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架

SVFR（Stable Video Face Restoration）是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统一框架，整合了视频人脸修复（BFR）、着色和修复任务...

←1...70 71 72 73 74 75 76...137 →

All Categories

AI News

Seer - 上海 AI Lab 联合北大等机构推出的端到端操作模型

ArtCrafter - 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架

Ingredients - 多ID照片定制视频生成框架，基于多ID照片与视频扩散相结合

MultiBooth - 清华联合 Meta 等机构推出的多概念图像生成方法

Aria-UI - 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型

TransPixar - 港中文联合 Adobe 等机构开源的生成透明背景视频技术

STAR - 南大、字节、西南大学联合开源的现实世界视频超分辨率框架

万相2.1 - 通义万相最新推出的视频生成模型

星火纪要 - 科大讯飞推出的会议交流总结和分析平台

Hallo3 - 复旦联合百度开源的高动态与真实感肖像动画生成框架

rStar-Math - 微软推出的小模型复杂推理与自进化SLMs的创新技术

SPAR3D - Stability AI等机构推出的单试图重建 3D 网络模型

Search-o1 - 人大联合清华推出自主知识检索增强的推理框架

ConceptMaster - 高保真多概念视频定制生成的创新 AI 框架

日日新融合大模型 - 商汤科技推出的原生融合模态大模型

Agent Laboratory - AMD 联合约翰·霍普金斯大学推出的自主科研 Agent

新言意码 - 前月之暗面明超平创立的 AI Coding 项目

PPTAgent - 中科院推出的自动生成高质量演示文稿框架

HoloDrive - 商汤联合上海AI Lab等机构推出的2D-3D多模态街道场景生成框架

Perception-as-Control - 阿里通义实验室推出的图像动画框架

Motion Dreamer - 香港科技大学推出的运动合理视频生成框架

Sky-T1 - NovaSky 开源的推理 AI 模型，可从零开始复现该模型

FaceLift - Adobe 联合加州大学推出的单张图像到 3D 头部模型生成技术

SVFR - 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架

AI News

Seer - 上海 AI Lab 联合北大等机构推出的端到端操作模型

ArtCrafter - 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架

Ingredients - 多ID照片定制视频生成框架，基于多ID照片与视频扩散相结合

MultiBooth - 清华联合 Meta 等机构推出的多概念图像生成方法

Aria-UI - 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型

TransPixar - 港中文联合 Adobe 等机构开源的生成透明背景视频技术

STAR - 南大、字节、西南大学联合开源的现实世界视频超分辨率框架

万相2.1 - 通义万相最新推出的视频生成模型

星火纪要 - 科大讯飞推出的会议交流总结和分析平台

Hallo3 - 复旦联合百度开源的高动态与真实感肖像动画生成框架

rStar-Math - 微软推出的小模型复杂推理与自进化SLMs的创新技术

SPAR3D - Stability AI等机构推出的单试图重建 3D 网络模型

Search-o1 - 人大联合清华推出自主知识检索增强的推理框架

ConceptMaster - 高保真多概念视频定制生成的创新 AI 框架

日日新融合大模型 - 商汤科技推出的原生融合模态大模型

Agent Laboratory - AMD 联合约翰·霍普金斯大学推出的自主科研 Agent

新言意码 - 前月之暗面明超平创立的 AI Coding 项目

PPTAgent - 中科院推出的自动生成高质量演示文稿框架

HoloDrive - 商汤联合上海AI Lab等机构推出的2D-3D多模态街道场景生成框架

Perception-as-Control - 阿里通义实验室推出的图像动画框架

Motion Dreamer - 香港科技大学推出的运动合理视频生成框架

Sky-T1 - NovaSky 开源的推理 AI 模型，可从零开始复现该模型

FaceLift - Adobe 联合加州大学推出的单张图像到 3D 头部模型生成技术

SVFR - 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架