AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

EfficientTAM - Meta AI推出的视频对象分割和跟踪模型

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型，能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transforme...

AI Projects12/18/2025

Amazon Nova - 亚马逊推出的全新大模型系列，覆盖文本、图像、视频生成领域

Amazon Nova 是亚马逊云服务（AWS）推出的新一代AI基础模型系列，提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazo...

AI Projects12/18/2025

HunyuanVideo - 腾讯推出的开源视频生成模型，参数高达130亿

HunyuanVideo是腾讯开源的视频生成模型，拥有130亿参数，是目前参数量最大的开源视频模型之一。HunyuanVideo具备物理模拟、高文本语义还原度、动作一致性和电...

AI Projects12/18/2025

Lobe Vidol - AI数字人交互平台，可与虚拟人和 3D 模型聊天互动

Lobe Vidol是开源的数字人创作平台，让每个人都能轻松创建和互动自己的虚拟偶像。Lobe Vidol提供流畅的对话体验、背景设置、动作姿势库、优雅的用户界面、角...

AI Projects12/18/2025

GPT学术优化 - 专为学术研究和写作设计的多功能开源项目

GPT学术优化（GPT Academic）是功能丰富的开源项目，专为学术研究和写作设计。GPT学术优化集成一键论文翻译、源代码解析、互联网信息获取、Latex文章校对、论...

AI Projects12/18/2025

Vanna - 开源AI检索生成框架，自动生成精确的SQL查询

Vanna是开源的Python RAG（Retrieval-Augmented Generation）框架，能帮助用户基于大型语言模型（LLMs）为其数据库生成精确的SQL查询。Vanna用两步简单流程操...

AI Projects12/18/2025

PersonaCraft - 首尔国立大学推出的单参考图像生成多身份全身图像技术

PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术，结合扩散模型和3D人类建模，能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCr...

AI Projects12/18/2025

StableAnimator - 复旦联合微软等机构推出的端到端身份一致性视频扩散框架

StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学共同推出的端到端高质量身份保持视频扩散框架。StableAnimator能根据一张参考图像和一...

AI Projects12/18/2025

I2V-01-Live - 海螺AI推出的图生视频模型，将静态图像转化为动态视频

I2V-01-Live是海螺AI推出的图生视频模型，能将静态二维图像转化为动态视频。模型基于深度学习技术，增强动作的流畅度和生动性，让人物或对象的动作更加自然和...

AI Projects12/18/2025

Genie 2 - 谷歌DeepMind推出的最新一代基础世界模型

Genie 2是DeepMind推出的新一代大规模基础世界模型，能仅凭一张图片生成长达1分钟的可交互3D游戏世界。Genie 2能模拟出物体交互、角色动画、物理效果等复杂动...

AI Projects12/18/2025

Luma Photon - Luma AI 推出的全新图像生成模型

Luma Photon 是 Luma AI 推出的新一代图像生成模型，用创新的架构提供超高图像质量和低成本效率。Luma Photon支持个性化和创造性的图像生成，能理解自然语言...

AI Projects12/18/2025

TeleAI 视频生成大模型 - 中国电信AI研究院推出的视频生成模型

TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型，基于两阶段生成框架：先根据文本描述创建分镜头草图，再基于草图生成视频。TeleAI 视频生成大...

AI Projects12/18/2025

TPDM - 西湖大学联合北大等高校推出的时间预测扩散模型

TPDM（Time Prediction Diffusion Model）是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型，能自...

AI Projects12/18/2025

ConsisID - 北大联合鹏城实验室等机构推出的文本到视频生成模型

ConsisID是北京大学和鹏城实验室等机构推出的文本到视频（Text-to-Video, IPT2V）生成模型，基于频率分解技术保持视频中人物身份的一致性。模型用免调优（tun...

AI Projects12/18/2025

Perplexideez - 开源本地AI搜索助手，智能搜索信息来源追溯

Perplexideez是本地AI助手，支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础，支持Ollama或OpenAI兼容的端点，用SearXNG...

AI Projects12/18/2025

GenCast - 谷歌DeepMind推出的AI气象预测模型

GenCast是DeepMind推出的革命性AI气象预测模型，基于扩散模型技术，提供长达15天的全球天气预报。GenCast在97.2%的预测任务中超越全球顶尖的中期天气预报系统...

AI Projects12/18/2025

FullStack Bench - 字节豆包联合M-A-P社区开源的全新代码评估基准

FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估。FullStack Bench覆盖超过11种真实编...

AI Projects12/18/2025

Motion Prompting - 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术，基于运动轨迹（motion trajectories）控制和引导视频内容的生成。Motion...

AI Projects12/18/2025

Fish Speech 1.5 - Fish Audio 推出的语音合成模型，支持13种语言

Fish Speech 1.5 是Fish Audio 推出的文本到语音（TTS）模型，基于深度学习技术如Transformer、VITS、VQVAE和GPT等。Fish Speech 1.5支持英语、日语、韩语、...

AI Projects12/18/2025

ClearerVoice-Studio - 阿里通义实验室开源的语音处理框架

ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架，集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法，有效消除...

AI Projects12/18/2025

PaliGemma 2 - 谷歌DeepMind推出的全新视觉语言模型

PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型（VLM），作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规...

AI Projects12/18/2025

Optimus-1 - 哈工大联合鹏城实验室推出的智能体框架

Optimus-1是哈尔滨工业大学（深圳）和鹏城实验室推出的智能体框架，能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验，让智能体更...

AI Projects12/18/2025

Fox-1 - TensorOpera 开源的小语言模型系列

Fox-1是TensorOpera推出的一系列小型语言模型（SLMs），包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练，在50亿...

AI Projects12/18/2025

Llama 3.3 - Meta AI推出的纯文本语言模型

Llama 3.3是Meta AI推出的70B 参数模型，大型多语言预训练语言模型，性能与40B参数的Llama 3.1相当。模型专为多语言对话优化，支持英语、德语、法语、意大利...

←1...59 60 61 62 63 64 65...137 →

AI News

AI Projects12/18/2025

EfficientTAM - Meta AI推出的视频对象分割和跟踪模型

AI Projects12/18/2025

Amazon Nova - 亚马逊推出的全新大模型系列，覆盖文本、图像、视频生成领域

AI Projects12/18/2025

HunyuanVideo - 腾讯推出的开源视频生成模型，参数高达130亿

AI Projects12/18/2025

Lobe Vidol - AI数字人交互平台，可与虚拟人和 3D 模型聊天互动

AI Projects12/18/2025

GPT学术优化 - 专为学术研究和写作设计的多功能开源项目

AI Projects12/18/2025

Vanna - 开源AI检索生成框架，自动生成精确的SQL查询

Vanna是开源的Python RAG（Retrieval-Augmented Generation）框架，能帮助用户基于大型语言模型（LLMs）为其数据库生成精确的SQL查询。Vanna用两步简单流程操...

AI Projects12/18/2025

PersonaCraft - 首尔国立大学推出的单参考图像生成多身份全身图像技术

AI Projects12/18/2025

StableAnimator - 复旦联合微软等机构推出的端到端身份一致性视频扩散框架

AI Projects12/18/2025

I2V-01-Live - 海螺AI推出的图生视频模型，将静态图像转化为动态视频

AI Projects12/18/2025

Genie 2 - 谷歌DeepMind推出的最新一代基础世界模型

AI Projects12/18/2025

Luma Photon - Luma AI 推出的全新图像生成模型

AI Projects12/18/2025

TeleAI 视频生成大模型 - 中国电信AI研究院推出的视频生成模型

AI Projects12/18/2025

TPDM - 西湖大学联合北大等高校推出的时间预测扩散模型

AI Projects12/18/2025

ConsisID - 北大联合鹏城实验室等机构推出的文本到视频生成模型

AI Projects12/18/2025

Perplexideez - 开源本地AI搜索助手，智能搜索信息来源追溯

Perplexideez是本地AI助手，支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础，支持Ollama或OpenAI兼容的端点，用SearXNG...

AI Projects12/18/2025

GenCast - 谷歌DeepMind推出的AI气象预测模型

AI Projects12/18/2025

FullStack Bench - 字节豆包联合M-A-P社区开源的全新代码评估基准

AI Projects12/18/2025

Motion Prompting - 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术，基于运动轨迹（motion trajectories）控制和引导视频内容的生成。Motion...

AI Projects12/18/2025

Fish Speech 1.5 - Fish Audio 推出的语音合成模型，支持13种语言

Fish Speech 1.5 是Fish Audio 推出的文本到语音（TTS）模型，基于深度学习技术如Transformer、VITS、VQVAE和GPT等。Fish Speech 1.5支持英语、日语、韩语、...

AI Projects12/18/2025

ClearerVoice-Studio - 阿里通义实验室开源的语音处理框架

AI Projects12/18/2025

PaliGemma 2 - 谷歌DeepMind推出的全新视觉语言模型

PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型（VLM），作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规...

AI Projects12/18/2025

Optimus-1 - 哈工大联合鹏城实验室推出的智能体框架

AI Projects12/18/2025

Fox-1 - TensorOpera 开源的小语言模型系列

Fox-1是TensorOpera推出的一系列小型语言模型（SLMs），包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练，在50亿...

AI Projects12/18/2025

All Categories

AI News

EfficientTAM - Meta AI推出的视频对象分割和跟踪模型

Amazon Nova - 亚马逊推出的全新大模型系列，覆盖文本、图像、视频生成领域

HunyuanVideo - 腾讯推出的开源视频生成模型，参数高达130亿

Lobe Vidol - AI数字人交互平台，可与虚拟人和 3D 模型聊天互动

GPT学术优化 - 专为学术研究和写作设计的多功能开源项目

Vanna - 开源AI检索生成框架，自动生成精确的SQL查询

PersonaCraft - 首尔国立大学推出的单参考图像生成多身份全身图像技术

StableAnimator - 复旦联合微软等机构推出的端到端身份一致性视频扩散框架

I2V-01-Live - 海螺AI推出的图生视频模型，将静态图像转化为动态视频

Genie 2 - 谷歌DeepMind推出的最新一代基础世界模型

Luma Photon - Luma AI 推出的全新图像生成模型

TeleAI 视频生成大模型 - 中国电信AI研究院推出的视频生成模型

TPDM - 西湖大学联合北大等高校推出的时间预测扩散模型

ConsisID - 北大联合鹏城实验室等机构推出的文本到视频生成模型

Perplexideez - 开源本地AI搜索助手，智能搜索信息来源追溯

GenCast - 谷歌DeepMind推出的AI气象预测模型

FullStack Bench - 字节豆包联合M-A-P社区开源的全新代码评估基准

Motion Prompting - 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

Fish Speech 1.5 - Fish Audio 推出的语音合成模型，支持13种语言

ClearerVoice-Studio - 阿里通义实验室开源的语音处理框架

PaliGemma 2 - 谷歌DeepMind推出的全新视觉语言模型

Optimus-1 - 哈工大联合鹏城实验室推出的智能体框架

Fox-1 - TensorOpera 开源的小语言模型系列

Llama 3.3 - Meta AI推出的纯文本语言模型

AI News

EfficientTAM - Meta AI推出的视频对象分割和跟踪模型

Amazon Nova - 亚马逊推出的全新大模型系列，覆盖文本、图像、视频生成领域

HunyuanVideo - 腾讯推出的开源视频生成模型，参数高达130亿

Lobe Vidol - AI数字人交互平台，可与虚拟人和 3D 模型聊天互动

GPT学术优化 - 专为学术研究和写作设计的多功能开源项目

Vanna - 开源AI检索生成框架，自动生成精确的SQL查询

PersonaCraft - 首尔国立大学推出的单参考图像生成多身份全身图像技术

StableAnimator - 复旦联合微软等机构推出的端到端身份一致性视频扩散框架

I2V-01-Live - 海螺AI推出的图生视频模型，将静态图像转化为动态视频

Genie 2 - 谷歌DeepMind推出的最新一代基础世界模型

Luma Photon - Luma AI 推出的全新图像生成模型

TeleAI 视频生成大模型 - 中国电信AI研究院推出的视频生成模型

TPDM - 西湖大学联合北大等高校推出的时间预测扩散模型

ConsisID - 北大联合鹏城实验室等机构推出的文本到视频生成模型

Perplexideez - 开源本地AI搜索助手，智能搜索信息来源追溯

GenCast - 谷歌DeepMind推出的AI气象预测模型

FullStack Bench - 字节豆包联合M-A-P社区开源的全新代码评估基准

Motion Prompting - 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

Fish Speech 1.5 - Fish Audio 推出的语音合成模型，支持13种语言

ClearerVoice-Studio - 阿里通义实验室开源的语音处理框架

PaliGemma 2 - 谷歌DeepMind推出的全新视觉语言模型

Optimus-1 - 哈工大联合鹏城实验室推出的智能体框架

Fox-1 - TensorOpera 开源的小语言模型系列

Llama 3.3 - Meta AI推出的纯文本语言模型