AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Goku - 港大和字节联合推出的最新视频生成模型

Goku是香港大学和字节跳动联合发布的最新视频生成模型，专为图像和视频的联合生成设计。基于先进的rectified flow Transformer框架，支持文生视频、图生视频...

AI Projects12/18/2025

AnythingLLM - 开源的全栈 AI 客户端，支持本地部署和API集成

AnythingLLM 是开源免费且支持多模态交互的全栈 AI 客户端。AnythingLLM支持文本、图像和音频等多种输入方式，将任何文档或内容转化为上下文，供各种语言模型...

AI Projects12/18/2025

VideoCaptioner - AI视频字幕处理工具，支持字幕样式调整和多格式导出

VideoCaptioner（中文名：卡卡字幕助手）是基于大语言模型（LLM）的智能字幕处理工具，能简化视频字幕的生成与优化流程。VideoCaptioner支持语音识别、字幕断...

AI Projects12/18/2025

Zonos - ZyphraAI 开源的多语言 TTS 模型

Zonos是Zyphra推出的高保真文本到语音（TTS）模型。Zonos包含两个模型：16亿参数的Transformer模型和SSM混合模型，均在Apache 2.0许可下开源。Zonos根据文本...

AI Projects12/18/2025

InspireMusic - 阿里通义实验室开源的音乐生成技术

InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术，通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术，支持通过简单的文字描述或音频提示...

AI Projects12/18/2025

YAYI-Ultra - 中科闻歌推出的混合专家模型

YAYI-Ultra 是中科闻歌研发的企业级大语言模型的旗舰版本，具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领...

AI Projects12/18/2025

HUGWBC - 上海交大联合上海 AI Lab 推出的人形机器人全身控制器

HUGWBC（Humanoid Unified and General Whole-Body Controller）是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器，能实现精细的运动控制。HUGWBC...

AI Projects12/18/2025

TPO - AI优化框架，动态调整推理模型的输出，更符合人类偏好

TPO（Test-Time Preference Optimization）是新型的AI优化框架，在推理阶段对语言模型输出进行动态优化，更符合人类偏好。TPO通过将奖励信号转化为文本反馈，...

AI Projects12/18/2025

PDF to Podcast - 英伟达推出的 PDF 转音频内容 AI 工具

PDF to Podcast是NVIDIA推出的PDF转音频的AI工具，基于NVIDIA NIM微服务架构的，能将PDF文档转换为生动的音频内容，如播客。基于大型语言模型（LLM）、文本到...

AI Projects12/18/2025

InternVideo2.5 - 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展，特别是在长视频处...

AI Projects12/18/2025

HumanDiT - 浙大联合字节推出的姿态引导人体视频生成框架

HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器（Diffusion Transformer，DiT），能在大规模数据集上训练，生成...

AI Projects12/18/2025

ProtGPS - 麻省理工学院等机构推出的蛋白质语言模型

ProtGPS（Protein Localization Prediction Model）是麻省理工学院（MIT）和怀特黑德生物医学研究所推出的，基于深度学习的蛋白质语言模型，用在预测蛋白质在...

AI Projects12/18/2025

potpie.ai - AI代码库Agent构建平台，自动化代码分析、测试和开发任务

potpie.ai 是开源平台，基于AI技术为代码库创建定制化的工程代理（Agents）。potpie.ai基于构建代码库的知识图谱，深度理解代码组件之间的关系，实现自动化代...

AI Projects12/18/2025

MoMask - 文本驱动生成高质量3D人体动作的模型

MoMask是创新的3D人体动作生成工具，通过生成式掩码建模技术，能根据文本描述生成高质量的3D人体动作。MoMask采用分层量化方案，将人体运动表示为多层离散的...

AI Projects12/18/2025

UltraMem - 字节豆包大模型团队推出的全新超稀疏模型架构

UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构，解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率，显著降低推理成...

AI Projects12/18/2025

AxBench - 斯坦福大学推出评估语言模控制方法的基准测试框架

AxBench 是斯坦福大学推出的评估语言模型（LM）控制方法的基准测试框架。基于合成数据生成训练和评估数据，比较不同模型控制技术在概念检测和模型转向两个方...

AI Projects12/18/2025

Lumina-Video - 上海 AI Lab 和港中文推出的视频生成框架

Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架，基于Next-DiT架构，针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT架构，用不同大...

AI Projects12/18/2025

Pippo - Meta 推出的单图生成多视角高清人像视频模型

Pippo是Meta Reality Labs推出的图像到视频生成模型，能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器，预训练了30亿张人像图像，...

AI Projects12/18/2025

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术，通过结合环境信息生成更具真实感的角色动画。与传统方法不同，能从视频中提取...

AI Projects12/18/2025

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具，基于深度集成 DeepSeek R1 和 Claude 两大模型，结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应，支...

AI Projects12/18/2025

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

AuraFusion360是用于360°无边界场景修复的新型基于参考的方法，主要用于虚拟现实和建筑可视化等领域的三维场景修复。通过高斯散射表示的3D场景，实现了高质量...

AI Projects12/18/2025

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

RWKV-7-2.9B模型（RWKV-7-World-2.9B-V3）是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练，具有 29 亿参数，支持世界所有语言。模型...

AI Projects12/18/2025

Data Formulator - 微软研究院开源的 AI 数据可视化工具

Data Formulator 是微软研究院推出的开源 AI 驱动的数据可视化工具，帮助用户通过简单交互和指令快速创建丰富的数据可视化。结合了图形化用户界面（GUI）和自...

AI Projects12/18/2025

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型

Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型，基于优化内存消耗和推理延迟快速生成高质量视频片段。模型将复杂的文本到视频生成...

←1...78 79 80 81 82 83 84...137 →

AI News

AI Projects12/18/2025

Goku - 港大和字节联合推出的最新视频生成模型

AI Projects12/18/2025

AnythingLLM - 开源的全栈 AI 客户端，支持本地部署和API集成

AI Projects12/18/2025

VideoCaptioner - AI视频字幕处理工具，支持字幕样式调整和多格式导出

AI Projects12/18/2025

Zonos - ZyphraAI 开源的多语言 TTS 模型

Zonos是Zyphra推出的高保真文本到语音（TTS）模型。Zonos包含两个模型：16亿参数的Transformer模型和SSM混合模型，均在Apache 2.0许可下开源。Zonos根据文本...

AI Projects12/18/2025

InspireMusic - 阿里通义实验室开源的音乐生成技术

AI Projects12/18/2025

YAYI-Ultra - 中科闻歌推出的混合专家模型

AI Projects12/18/2025

HUGWBC - 上海交大联合上海 AI Lab 推出的人形机器人全身控制器

HUGWBC（Humanoid Unified and General Whole-Body Controller）是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器，能实现精细的运动控制。HUGWBC...

AI Projects12/18/2025

TPO - AI优化框架，动态调整推理模型的输出，更符合人类偏好

AI Projects12/18/2025

PDF to Podcast - 英伟达推出的 PDF 转音频内容 AI 工具

AI Projects12/18/2025

InternVideo2.5 - 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

AI Projects12/18/2025

HumanDiT - 浙大联合字节推出的姿态引导人体视频生成框架

AI Projects12/18/2025

ProtGPS - 麻省理工学院等机构推出的蛋白质语言模型

ProtGPS（Protein Localization Prediction Model）是麻省理工学院（MIT）和怀特黑德生物医学研究所推出的，基于深度学习的蛋白质语言模型，用在预测蛋白质在...

AI Projects12/18/2025

potpie.ai - AI代码库Agent构建平台，自动化代码分析、测试和开发任务

AI Projects12/18/2025

MoMask - 文本驱动生成高质量3D人体动作的模型

AI Projects12/18/2025

UltraMem - 字节豆包大模型团队推出的全新超稀疏模型架构

AI Projects12/18/2025

AxBench - 斯坦福大学推出评估语言模控制方法的基准测试框架

AI Projects12/18/2025

Lumina-Video - 上海 AI Lab 和港中文推出的视频生成框架

AI Projects12/18/2025

Pippo - Meta 推出的单图生成多视角高清人像视频模型

AI Projects12/18/2025

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

AI Projects12/18/2025

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具，基于深度集成 DeepSeek R1 和 Claude 两大模型，结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应，支...

AI Projects12/18/2025

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

AI Projects12/18/2025

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

RWKV-7-2.9B模型（RWKV-7-World-2.9B-V3）是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练，具有 29 亿参数，支持世界所有语言。模型...

AI Projects12/18/2025

Data Formulator - 微软研究院开源的 AI 数据可视化工具

AI Projects12/18/2025

All Categories

AI News

Goku - 港大和字节联合推出的最新视频生成模型

AnythingLLM - 开源的全栈 AI 客户端，支持本地部署和API集成

VideoCaptioner - AI视频字幕处理工具，支持字幕样式调整和多格式导出

Zonos - ZyphraAI 开源的多语言 TTS 模型

InspireMusic - 阿里通义实验室开源的音乐生成技术

YAYI-Ultra - 中科闻歌推出的混合专家模型

HUGWBC - 上海交大联合上海 AI Lab 推出的人形机器人全身控制器

TPO - AI优化框架，动态调整推理模型的输出，更符合人类偏好

PDF to Podcast - 英伟达推出的 PDF 转音频内容 AI 工具

InternVideo2.5 - 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

HumanDiT - 浙大联合字节推出的姿态引导人体视频生成框架

ProtGPS - 麻省理工学院等机构推出的蛋白质语言模型

potpie.ai - AI代码库Agent构建平台，自动化代码分析、测试和开发任务

MoMask - 文本驱动生成高质量3D人体动作的模型

UltraMem - 字节豆包大模型团队推出的全新超稀疏模型架构

AxBench - 斯坦福大学推出评估语言模控制方法的基准测试框架

Lumina-Video - 上海 AI Lab 和港中文推出的视频生成框架

Pippo - Meta 推出的单图生成多视角高清人像视频模型

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

Data Formulator - 微软研究院开源的 AI 数据可视化工具

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型

AI News

Goku - 港大和字节联合推出的最新视频生成模型

AnythingLLM - 开源的全栈 AI 客户端，支持本地部署和API集成

VideoCaptioner - AI视频字幕处理工具，支持字幕样式调整和多格式导出

Zonos - ZyphraAI 开源的多语言 TTS 模型

InspireMusic - 阿里通义实验室开源的音乐生成技术

YAYI-Ultra - 中科闻歌推出的混合专家模型

HUGWBC - 上海交大联合上海 AI Lab 推出的人形机器人全身控制器

TPO - AI优化框架，动态调整推理模型的输出，更符合人类偏好

PDF to Podcast - 英伟达推出的 PDF 转音频内容 AI 工具

InternVideo2.5 - 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

HumanDiT - 浙大联合字节推出的姿态引导人体视频生成框架

ProtGPS - 麻省理工学院等机构推出的蛋白质语言模型

potpie.ai - AI代码库Agent构建平台，自动化代码分析、测试和开发任务

MoMask - 文本驱动生成高质量3D人体动作的模型

UltraMem - 字节豆包大模型团队推出的全新超稀疏模型架构

AxBench - 斯坦福大学推出评估语言模控制方法的基准测试框架

Lumina-Video - 上海 AI Lab 和港中文推出的视频生成框架

Pippo - Meta 推出的单图生成多视角高清人像视频模型

Animate Anyone 2 - 阿里通义推出的高保真角色图像动画生成技术

DeepClaude - 开源AI应用开发平台，深度集成 DeepSeek R1 和 Claude 模型

AuraFusion360 - 三维场景修复技术，实现高质量物体去除和孔洞填充

RWKV-7-2.9B - RWKV 基金开源的 RNN 大语言模型

Data Formulator - 微软研究院开源的 AI 数据可视化工具

Magic 1-For-1 - 北大、英伟达等推出的高效视频生成模型