AI 资讯

全部快讯教程百科 AI项目 AI应用集

AI项目2026/4/19

LingBot-Map - 蚂蚁灵波开源的流式 3D 重建模型

LingBot-Map 是蚂蚁灵波科技开源的流式三维重建模型，普通 RGB 摄像头可在视频采集过程中实时完成相机位姿估计与场景三维结构重建。

AI项目2026/4/18

Claude Opus 4.7 - Anthropic 推出的最新旗舰大模型

Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型，为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出，SWE-bench Pro 得分提升至 64.3...

AI项目2026/4/18

Qwen3.6-35B-A3B - 阿里通义开源的混合专家 MoE 模型

Qwen3.6-35B-A3B是阿里通义千问团队推出的开源混合专家（MoE）模型，总参数量350亿，激活参数30亿。模型主打极致推理效率与智能体编程能力，在多项编程基准测...

AI项目2026/4/18

GPT-Rosalind - OpenAI 推出的生命科学专用推理模型

GPT-Rosalind是OpenAI推出的生命科学专用推理模型，用DNA双螺旋结构发现者罗莎琳德·富兰克林命名。模型针对50种生物学工作流深度调优，具备假设生成、实验设...

AI项目2026/4/17

GPT-image-2 - OpenAI推出的下一代原生图像生成模型

GPT-image-2 是OpenAI推出的下一代原生图像生成模型，据传内部代号为「Spud」，目前已在ChatGPT进行灰度测试。模型于2026年4月初以'maskingtape-alpha'等代号...

AI项目2026/4/17

Relax - 小红书开源的大模型强化学习训练引擎

Relax 是小红书AI平台团队开源的面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。基于 Megatron-LM 与 SGLang 构建，采用服务化容错架构（Ray Serve...

AI项目2026/4/17

Gemini 3.1 Flash TTS - 谷歌推出的文本转语音模型

Gemini 3.1 Flash TTS是Google推出的新一代文本转语音模型，提供更强的可控性、表现力和音质。模型支持70多种语言，引入音频标签技术，可通过自然语言指令精...

AI项目2026/4/17

混元3D世界模型 2.0 - 腾讯混元开源的多模态世界模型

混元3D世界模型 2.0（HY-World 2.0）是腾讯混元推出的开源多模态世界模型，支持从文本、单图、多视图或视频生成可漫游的3D高斯溅射（3DGS）场景。模型采用四...

AI项目2026/4/17

HappyOyster - 阿里推出的开放式世界模型产品

HappyOyster是阿里ATH创新事业部推出的开放式世界模型产品，定位为可实时构建与交互的AI生成式体验平台。产品基于世界模型技术，支持无限延展的实时内容生成...

AI项目2026/4/17

StepAudio 2.5 TTS - 阶跃星辰推出的语境感知语音生成模型

StepAudio 2.5 TTS是阶跃星辰推出的Contextual TTS（语境感知语音合成模型），首次将语境理解能力引入语音生成全流程。

AI项目2026/4/16

Marble 1.1 - 李飞飞 World Labs 推出的新一代生成式世界模型

Marble 1.1 是李飞飞 World Labs 推出的新一代生成式世界模型，主打画质优化。模型能将单张图片、视频或全景图转化为可自由探索的沉浸式 3D 场景，显著改善光...

AI项目2026/4/16

MAI-Image-2-Efficient - 微软推出的轻量版文生图模型

MAI-Image-2-Efficient是微软推出的自研文生图模型，为MAI-Image-2的轻量高效版本，主打高性价比商业量产，在保持照片级真实图像质量的同时，实现成本降低41%...

AI项目2026/4/16

SearchClaw - 中国人民大学推出的 AI 深度研究智能体

SearchClaw 是 RUC-NLPIR（中国人民大学信息检索实验室）推出的自托管式 AI 深度研究智能体，配备 Web 交互界面。用户提交问题后，系统自动执行多轮网络搜索...

AI项目2026/4/16

Spark 2.0 - World Labs 开源的Web端 3D 高斯溅射渲染引擎

Spark 2.0是World Labs（李飞飞创立）开源的Web端3D高斯溅射渲染引擎，基于Three.js和WebGL2构建。Spark 2.0首创LoD细节层次系统、渐进式流式传输与虚拟内存...

AI项目2026/4/16

ERNIE-Image - 百度文心开源的文生图模型

ERNIE-Image是百度文心团队开源的8B参数文生图模型，基于Diffusion Transformer架构，主打高可控性与精准长文本渲染。

AI项目2026/4/16

OmniShow - 字节联合港中文、港大等开源的视频生成模型

OmniShow是字节跳动联合港中文、莫纳什、港大开源的多模态人-物交互视频生成模型。作为首个支持RAP2V（参考图+音频+姿势）的端到端框架，模型统一处理文本、...

AI项目2026/4/15

Mano-P 1.0 - 明略科技开源的 GUI-VLA 智能体模型

Mano-P 1.0是明略科技开源的GUI-VLA智能体模型，采用纯视觉驱动，无需API可直接操控桌面软件与网页界面。模型提供72B完整版与4B量化版，支持Apple M4芯片本地...

AI项目2026/4/15

HeyGen CLI - HeyGen 推出的命令行工具

HeyGen CLI是HeyGen官方推出的命令行工具与MCP服务器，基于Model Context Protocol协议构建。工具支持开发者及AI助手（如Claude、Cursor）通过自然语言直接调...

AI项目2026/4/14

PokeClaw - 开源的全本地离线运行手机 AI Agent 应用

PokeClaw（全称 PocketClaw）是开源 Android AI 自动化应用，由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理，基于 Google Gemma 4 模...

AI项目2026/4/14

LPM 1.0 - 米哈游蔡浩宇推出的 AI 视频生成模型

LPM 1.0（Large Performance Model）是Anuttacon（蔡浩宇AI公司）推出的17B参数视频角色表演生成模型，支持实时全双工音视频对话。

AI项目2026/4/12

FIPO - 阿里通义推出的强化学习算法

FIPO（Future-KL Influenced Policy Optimization）是阿里通义实验室推出的强化学习算法，通过Future-KL机制量化每个token对后续推理轨迹的影响力，实现token...

AI项目2026/4/12

claude-code-best-practice - 开源的Claude Code系统化使用指南

claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从'氛围编程'进阶到'智能体工程'，收录 86+ 条实战技巧，涵盖 Agents、Commands、Skil...

AI项目2026/4/12

MiniMax Music 2.6 - MiniMax 推出的全新 AI 音乐生成模型

MiniMax Music 2.6是MiniMax推出的全新AI音乐生成模型，实现从底层架构到创作体验的全维进化。该版本将首包延迟压缩至20秒内，突破性解决'开盲盒'痛点，实现...

AI项目2026/4/11

VimRAG - 阿里通义开源的全模态知识库 RAG 框架

VimRAG是阿里通义实验室开源的全模态RAG框架，支持图文视频混合知识库。框架创新采用多模态记忆图（DAG）替代线性上下文，将推理建模为动态有向无环图实现路...

←1...11 12 13 14 15 16 17...137 →

AI 资讯

AI项目2026/4/19

LingBot-Map - 蚂蚁灵波开源的流式 3D 重建模型

LingBot-Map 是蚂蚁灵波科技开源的流式三维重建模型，普通 RGB 摄像头可在视频采集过程中实时完成相机位姿估计与场景三维结构重建。

AI项目2026/4/18

Claude Opus 4.7 - Anthropic 推出的最新旗舰大模型

Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型，为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出，SWE-bench Pro 得分提升至 64.3...

AI项目2026/4/18

Qwen3.6-35B-A3B - 阿里通义开源的混合专家 MoE 模型

AI项目2026/4/18

GPT-Rosalind - OpenAI 推出的生命科学专用推理模型

AI项目2026/4/17

GPT-image-2 - OpenAI推出的下一代原生图像生成模型

GPT-image-2 是OpenAI推出的下一代原生图像生成模型，据传内部代号为「Spud」，目前已在ChatGPT进行灰度测试。模型于2026年4月初以'maskingtape-alpha'等代号...

AI项目2026/4/17

Relax - 小红书开源的大模型强化学习训练引擎

Relax 是小红书AI平台团队开源的面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。基于 Megatron-LM 与 SGLang 构建，采用服务化容错架构（Ray Serve...

AI项目2026/4/17

Gemini 3.1 Flash TTS - 谷歌推出的文本转语音模型

AI项目2026/4/17

混元3D世界模型 2.0 - 腾讯混元开源的多模态世界模型

AI项目2026/4/17

HappyOyster - 阿里推出的开放式世界模型产品

AI项目2026/4/17

StepAudio 2.5 TTS - 阶跃星辰推出的语境感知语音生成模型

StepAudio 2.5 TTS是阶跃星辰推出的Contextual TTS（语境感知语音合成模型），首次将语境理解能力引入语音生成全流程。

AI项目2026/4/16

Marble 1.1 - 李飞飞 World Labs 推出的新一代生成式世界模型

AI项目2026/4/16

MAI-Image-2-Efficient - 微软推出的轻量版文生图模型

AI项目2026/4/16

SearchClaw - 中国人民大学推出的 AI 深度研究智能体

AI项目2026/4/16

Spark 2.0 - World Labs 开源的Web端 3D 高斯溅射渲染引擎

Spark 2.0是World Labs（李飞飞创立）开源的Web端3D高斯溅射渲染引擎，基于Three.js和WebGL2构建。Spark 2.0首创LoD细节层次系统、渐进式流式传输与虚拟内存...

AI项目2026/4/16

ERNIE-Image - 百度文心开源的文生图模型

ERNIE-Image是百度文心团队开源的8B参数文生图模型，基于Diffusion Transformer架构，主打高可控性与精准长文本渲染。

AI项目2026/4/16

OmniShow - 字节联合港中文、港大等开源的视频生成模型

AI项目2026/4/15

Mano-P 1.0 - 明略科技开源的 GUI-VLA 智能体模型

AI项目2026/4/15

HeyGen CLI - HeyGen 推出的命令行工具

HeyGen CLI是HeyGen官方推出的命令行工具与MCP服务器，基于Model Context Protocol协议构建。工具支持开发者及AI助手（如Claude、Cursor）通过自然语言直接调...

AI项目2026/4/14

PokeClaw - 开源的全本地离线运行手机 AI Agent 应用

PokeClaw（全称 PocketClaw）是开源 Android AI 自动化应用，由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理，基于 Google Gemma 4 模...

AI项目2026/4/14

LPM 1.0 - 米哈游蔡浩宇推出的 AI 视频生成模型

LPM 1.0（Large Performance Model）是Anuttacon（蔡浩宇AI公司）推出的17B参数视频角色表演生成模型，支持实时全双工音视频对话。

AI项目2026/4/12

FIPO - 阿里通义推出的强化学习算法

FIPO（Future-KL Influenced Policy Optimization）是阿里通义实验室推出的强化学习算法，通过Future-KL机制量化每个token对后续推理轨迹的影响力，实现token...

AI项目2026/4/12

claude-code-best-practice - 开源的Claude Code系统化使用指南

claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从'氛围编程'进阶到'智能体工程'，收录 86+ 条实战技巧，涵盖 Agents、Commands、Skil...

AI项目2026/4/12

MiniMax Music 2.6 - MiniMax 推出的全新 AI 音乐生成模型

AI项目2026/4/11

全部分类

AI 资讯

LingBot-Map - 蚂蚁灵波开源的流式 3D 重建模型

Claude Opus 4.7 - Anthropic 推出的最新旗舰大模型

Qwen3.6-35B-A3B - 阿里通义开源的混合专家 MoE 模型

GPT-Rosalind - OpenAI 推出的生命科学专用推理模型

GPT-image-2 - OpenAI推出的下一代原生图像生成模型

Relax - 小红书开源的大模型强化学习训练引擎

Gemini 3.1 Flash TTS - 谷歌推出的文本转语音模型

混元3D世界模型 2.0 - 腾讯混元开源的多模态世界模型

HappyOyster - 阿里推出的开放式世界模型产品

StepAudio 2.5 TTS - 阶跃星辰推出的语境感知语音生成模型

Marble 1.1 - 李飞飞 World Labs 推出的新一代生成式世界模型

MAI-Image-2-Efficient - 微软推出的轻量版文生图模型

SearchClaw - 中国人民大学推出的 AI 深度研究智能体

Spark 2.0 - World Labs 开源的Web端 3D 高斯溅射渲染引擎

ERNIE-Image - 百度文心开源的文生图模型

OmniShow - 字节联合港中文、港大等开源的视频生成模型

Mano-P 1.0 - 明略科技开源的 GUI-VLA 智能体模型

HeyGen CLI - HeyGen 推出的命令行工具

PokeClaw - 开源的全本地离线运行手机 AI Agent 应用

LPM 1.0 - 米哈游蔡浩宇推出的 AI 视频生成模型

FIPO - 阿里通义推出的强化学习算法

claude-code-best-practice - 开源的Claude Code系统化使用指南

MiniMax Music 2.6 - MiniMax 推出的全新 AI 音乐生成模型

VimRAG - 阿里通义开源的全模态知识库 RAG 框架

AI 资讯

LingBot-Map - 蚂蚁灵波开源的流式 3D 重建模型

Claude Opus 4.7 - Anthropic 推出的最新旗舰大模型

Qwen3.6-35B-A3B - 阿里通义开源的混合专家 MoE 模型

GPT-Rosalind - OpenAI 推出的生命科学专用推理模型

GPT-image-2 - OpenAI推出的下一代原生图像生成模型

Relax - 小红书开源的大模型强化学习训练引擎

Gemini 3.1 Flash TTS - 谷歌推出的文本转语音模型

混元3D世界模型 2.0 - 腾讯混元开源的多模态世界模型

HappyOyster - 阿里推出的开放式世界模型产品

StepAudio 2.5 TTS - 阶跃星辰推出的语境感知语音生成模型

Marble 1.1 - 李飞飞 World Labs 推出的新一代生成式世界模型

MAI-Image-2-Efficient - 微软推出的轻量版文生图模型

SearchClaw - 中国人民大学推出的 AI 深度研究智能体

Spark 2.0 - World Labs 开源的Web端 3D 高斯溅射渲染引擎

ERNIE-Image - 百度文心开源的文生图模型

OmniShow - 字节联合港中文、港大等开源的视频生成模型

Mano-P 1.0 - 明略科技开源的 GUI-VLA 智能体模型

HeyGen CLI - HeyGen 推出的命令行工具

PokeClaw - 开源的全本地离线运行手机 AI Agent 应用

LPM 1.0 - 米哈游蔡浩宇推出的 AI 视频生成模型

FIPO - 阿里通义推出的强化学习算法

claude-code-best-practice - 开源的Claude Code系统化使用指南

MiniMax Music 2.6 - MiniMax 推出的全新 AI 音乐生成模型

VimRAG - 阿里通义开源的全模态知识库 RAG 框架