AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

VLOGGER - 谷歌推出的图像到合成人物动态视频的模型

VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型，专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能在于使用人工智...

AI Projects12/18/2025

Stable Video 3D (SV3D) - 多视角合成和3D生成模型，由Stability AI推出

Stable Video 3D（简称SV3D）是由Stability AI公司开发的一项先进的3D技术，能够从单张图片生成高质量的新视角视图和3D网格。该模型在之前发布的Stable Video...

AI Projects12/18/2025

AnimateDiff-Lightning - 字节推出的快速生成高质量视频的模型

AnimateDiff-Lightning由字节跳动的研究人员最新推出的一个高质量视频生成模型，利用了渐进式对抗性扩散蒸馏技术来实现快速的视频生成。该模型旨在解决现有视...

AI Projects12/18/2025

StreamMultiDiffusion - 实时生成和编辑图像的交互式框架

StreamMultiDiffusion是一个实时交互式的图像生成框架，结合了扩散模型的高质量图像合成能力和区域控制的灵活性，可根据用户指定的区域文本提示生成实时、交...

AI Projects12/18/2025

Mora - 微软等推出的可生成12秒视频的多AI智能体框架

Mora是由来自微软和理海大学的研究人员推出的一个多智能体（AI Agents）框架，专门用于通用视频生成任务，目标是模拟并扩展OpenAI的Sora视频生成模型。该框架...

AI Projects12/18/2025

LATTE3D - 英伟达推出的文本快速生成3D对象的模型

LATTE3D是由英伟达的研究人员推出的一个文本生成3D对象的模型，能够从文本提示描述快速生成高质量的3D内容（仅需400毫秒）。该技术的核心在于采用了一种称为“...

AI Projects12/18/2025

BrushNet - 腾讯推出的高质量图像照片修复模型

BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复（Inpainting）模型，通过分解的双分支架构来有效...

AI Projects12/18/2025

SUPIR - 高保真的AI图像修复和画质增强模型

SUPIR是一个突破性的图像修复和画质增强方法，利用了大规模的生成模型StableDiffusion-XL（SDXL）和模型扩展技术，通过深度学习和多模态方法，实现了对低质量...

AI Projects12/18/2025

StreamingT2V - PicsArt推出的可生成长达2分钟视频的模型

StreamingT2V是由PicsArt AI研究团队推出的一个文本到视频的生成模型，旨在解决现有模型仅能生成16帧或24帧的高质量短视频，在生成长视频时则会遇到如视频质...

AI Projects12/18/2025

VoiceCraft - 开源的语音编辑和文本转语音模型

VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言模型，专注于零样本语音编辑和文本到语音（TTS）任务。该模型采用Transformer架构...

AI Projects12/18/2025

Champ - 基于3D的人物图片转视频动画模型

Champ是由阿里巴巴、复旦大学和南京大学的研究人员共同提出的一种基于3D的将人物图片转换为视频动画的模型，该方法结合了3D参数化模型（特别是SMPL模型）和潜...

AI Projects12/18/2025

Jamba - AI21开源的首个基于Mamba架构的大模型

Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型，目前大部分的大模型（如GPT、Gemini 和 Llama）都是基于 Transformer 结构。而 Jamba 结...

AI Projects12/18/2025

Voice Engine - OpenAI公布的AI语音合成和声音克隆模型

Voice Engine是OpenAI最新推出的一项AI语音合成和声音克隆技术，能够利用简短的15秒音频样本和文本输入，生成接近原声的自然听起来的语音。该项技术自2022年...

AI Projects12/18/2025

SWE-agent - 普林斯顿开源的AI程序员智能体

SWE-agent是一个由普林斯顿大学NLP组研究人员开发的开源AI程序员和软件工程师系统，利用大型语言模型（如GPT-4）的能力，可以自动解决GitHub存储库中的问题。...

AI Projects12/18/2025

DreaMoving - 阿里开源的基于扩散模型的人类视频生成框架

DreaMoving是一个基于扩散模型的人类视频生成框架，由阿里巴巴集团的研究团队开发。DreaMoving通过视频控制网络和内容引导器实现对人物动作和外观的精确控制...

AI Projects12/18/2025

AniPortrait - 腾讯开源的照片对口型视频生成框架

AniPortrait是腾讯开源的照片对口型AI视频生成框架，类似于此前阿里推出的EMO，能够通过音频和一张参考肖像图片生成高质量的动画。

AI Projects12/18/2025

InstantStyle - 开源的个性化文本到图像生成框架，保留风格一致性

InstantStyle是小红书的InstantX团队开源的保留风格一致性的个性化文本到图像生成框架，旨在解决文本到图像生成中的一个关键问题：如何在保持风格一致性的同...

AI Projects12/18/2025

DesignEdit - 微软等开源的AI图像分层处理编辑框架

DesignEdit是由微软亚洲研究院和北京大学的研究团队共同开发的一个AI图像编辑框架，引入了设计领域的图层概念，采用多层潜在分解和融合的技术，实现了无需额...

AI Projects12/18/2025

CodeGemma - 谷歌开源推出的代码生成大模型

CodeGemma是由Google发布的专注于代码生成和理解的大型语言模型，该系列包含三种不同规模的模型，分别是2B预训练模型、7B预训练模型和7B指令微调模型，旨在提...

AI Projects12/18/2025

Parler-TTS - Hugging Face开源的文本转语音模型

Parler-TTS是由Hugging Face推出的一款开源的文本到语音（TTS）模型，能够通过输入提示描述模仿特定说话者的风格（性别、音调、说话风格等），生成高质量、听...

AI Projects12/18/2025

VASA-1 - 微软推出的静态照片对口型视频生成框架

VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架，能够根据单张静态人脸照片和一段语音音频，实时生成逼真的3D说话面部动画。

AI Projects12/18/2025

Llama 3 - Meta开源推出的新一代大语言模型

Llama 3是Meta公司最新开源推出的新一代大型语言模型（LLM），包含8B和70B两种参数规模的模型，标志着开源人工智能领域的又一重大进步。作为Llama系列的第三...

AI Projects12/18/2025

FunClip - 阿里达摩院开源的AI自动视频剪辑工具

FunClip是阿里达摩院推出的一款完全开源、本地部署的自动化视频剪辑工具，通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音识别...

AI Projects12/18/2025

Phi-3 - 微软最新推出的新一代小模型系列

Phi-3是微软研究院推出的新一代系列先进的小语言模型，包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在保持较小的参数规模的同时...

←1...28 29 30 31 32 33 34...137 →

AI News

AI Projects12/18/2025

VLOGGER - 谷歌推出的图像到合成人物动态视频的模型

AI Projects12/18/2025

Stable Video 3D (SV3D) - 多视角合成和3D生成模型，由Stability AI推出

Stable Video 3D（简称SV3D）是由Stability AI公司开发的一项先进的3D技术，能够从单张图片生成高质量的新视角视图和3D网格。该模型在之前发布的Stable Video...

AI Projects12/18/2025

AnimateDiff-Lightning - 字节推出的快速生成高质量视频的模型

AI Projects12/18/2025

StreamMultiDiffusion - 实时生成和编辑图像的交互式框架

AI Projects12/18/2025

Mora - 微软等推出的可生成12秒视频的多AI智能体框架

AI Projects12/18/2025

LATTE3D - 英伟达推出的文本快速生成3D对象的模型

AI Projects12/18/2025

BrushNet - 腾讯推出的高质量图像照片修复模型

AI Projects12/18/2025

SUPIR - 高保真的AI图像修复和画质增强模型

AI Projects12/18/2025

StreamingT2V - PicsArt推出的可生成长达2分钟视频的模型

AI Projects12/18/2025

VoiceCraft - 开源的语音编辑和文本转语音模型

AI Projects12/18/2025

Champ - 基于3D的人物图片转视频动画模型

AI Projects12/18/2025

Jamba - AI21开源的首个基于Mamba架构的大模型

Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型，目前大部分的大模型（如GPT、Gemini 和 Llama）都是基于 Transformer 结构。而 Jamba 结...

AI Projects12/18/2025

Voice Engine - OpenAI公布的AI语音合成和声音克隆模型

AI Projects12/18/2025

SWE-agent - 普林斯顿开源的AI程序员智能体

AI Projects12/18/2025

DreaMoving - 阿里开源的基于扩散模型的人类视频生成框架

AI Projects12/18/2025

AniPortrait - 腾讯开源的照片对口型视频生成框架

AniPortrait是腾讯开源的照片对口型AI视频生成框架，类似于此前阿里推出的EMO，能够通过音频和一张参考肖像图片生成高质量的动画。

AI Projects12/18/2025

InstantStyle - 开源的个性化文本到图像生成框架，保留风格一致性

AI Projects12/18/2025

DesignEdit - 微软等开源的AI图像分层处理编辑框架

AI Projects12/18/2025

CodeGemma - 谷歌开源推出的代码生成大模型

AI Projects12/18/2025

Parler-TTS - Hugging Face开源的文本转语音模型

AI Projects12/18/2025

VASA-1 - 微软推出的静态照片对口型视频生成框架

AI Projects12/18/2025

Llama 3 - Meta开源推出的新一代大语言模型

AI Projects12/18/2025

FunClip - 阿里达摩院开源的AI自动视频剪辑工具

AI Projects12/18/2025

All Categories

AI News

VLOGGER - 谷歌推出的图像到合成人物动态视频的模型

Stable Video 3D (SV3D) - 多视角合成和3D生成模型，由Stability AI推出

AnimateDiff-Lightning - 字节推出的快速生成高质量视频的模型

StreamMultiDiffusion - 实时生成和编辑图像的交互式框架

Mora - 微软等推出的可生成12秒视频的多AI智能体框架

LATTE3D - 英伟达推出的文本快速生成3D对象的模型

BrushNet - 腾讯推出的高质量图像照片修复模型

SUPIR - 高保真的AI图像修复和画质增强模型

StreamingT2V - PicsArt推出的可生成长达2分钟视频的模型

VoiceCraft - 开源的语音编辑和文本转语音模型

Champ - 基于3D的人物图片转视频动画模型

Jamba - AI21开源的首个基于Mamba架构的大模型

Voice Engine - OpenAI公布的AI语音合成和声音克隆模型

SWE-agent - 普林斯顿开源的AI程序员智能体

DreaMoving - 阿里开源的基于扩散模型的人类视频生成框架

AniPortrait - 腾讯开源的照片对口型视频生成框架

InstantStyle - 开源的个性化文本到图像生成框架，保留风格一致性

DesignEdit - 微软等开源的AI图像分层处理编辑框架

CodeGemma - 谷歌开源推出的代码生成大模型

Parler-TTS - Hugging Face开源的文本转语音模型

VASA-1 - 微软推出的静态照片对口型视频生成框架

Llama 3 - Meta开源推出的新一代大语言模型

FunClip - 阿里达摩院开源的AI自动视频剪辑工具

Phi-3 - 微软最新推出的新一代小模型系列

AI News

VLOGGER - 谷歌推出的图像到合成人物动态视频的模型

Stable Video 3D (SV3D) - 多视角合成和3D生成模型，由Stability AI推出

AnimateDiff-Lightning - 字节推出的快速生成高质量视频的模型

StreamMultiDiffusion - 实时生成和编辑图像的交互式框架

Mora - 微软等推出的可生成12秒视频的多AI智能体框架

LATTE3D - 英伟达推出的文本快速生成3D对象的模型

BrushNet - 腾讯推出的高质量图像照片修复模型

SUPIR - 高保真的AI图像修复和画质增强模型

StreamingT2V - PicsArt推出的可生成长达2分钟视频的模型

VoiceCraft - 开源的语音编辑和文本转语音模型

Champ - 基于3D的人物图片转视频动画模型

Jamba - AI21开源的首个基于Mamba架构的大模型

Voice Engine - OpenAI公布的AI语音合成和声音克隆模型

SWE-agent - 普林斯顿开源的AI程序员智能体

DreaMoving - 阿里开源的基于扩散模型的人类视频生成框架

AniPortrait - 腾讯开源的照片对口型视频生成框架

InstantStyle - 开源的个性化文本到图像生成框架，保留风格一致性

DesignEdit - 微软等开源的AI图像分层处理编辑框架

CodeGemma - 谷歌开源推出的代码生成大模型

Parler-TTS - Hugging Face开源的文本转语音模型

VASA-1 - 微软推出的静态照片对口型视频生成框架

Llama 3 - Meta开源推出的新一代大语言模型

FunClip - 阿里达摩院开源的AI自动视频剪辑工具

Phi-3 - 微软最新推出的新一代小模型系列