AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects4/2/2026

Wan2.7-Image - 阿里通义推出的 AI 图像生成与编辑模型

Wan2.7-Image是通义实验室推出的AI图像生成与编辑模型，支持深度自定义人物形象（脸型、眼型、骨相等），告别千篇一律的「AI标准脸」，可精准生成4000+字符及...

AI Projects4/2/2026

Lightpanda - 开源的 AI 浏览器，兼容主流自动化框架

Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器，用 Zig 语言从零编写，不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16，执行速度...

AI Projects4/2/2026

Veo 3.1 Lite - 谷歌推出的 AI 视频生成模型

Veo 3.1 Lite 是 Google 最新推出的AI视频生成模型，成本比 Veo 3.1 Fast 降低 50% 以上，同时保持同等生成速度。模型支持文本/图像生成视频，可灵活切换横竖...

AI Projects4/2/2026

TeamClaw - AI Agent管理平台，智能拆解任务、分派协作

TeamClaw 是AI 员工团队管理平台，定位'一个人的 AI 办公室'。平台能让用户像招聘真实员工一样定义 AI 岗位（CEO、分析师等），角色秒级到岗；支持为 AI 安装...

AI Projects4/1/2026

ColaMD - 开源 Markdown 编辑器，实时同步修改内容

ColaMD 是开源的 Markdown 编辑器。工具解决了传统编辑器在 AI 修改文件后需手动刷新才能看到更新的痛点，实现 Agent 后台修改与前台内容的实时同步，如同观...

AI Projects4/1/2026

harrier-oss-v1 - 微软开源的多语言文本嵌入模型

harrier-oss-v1 是微软开源的多语言文本嵌入模型，在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构，通过最后 token 池化和 L2 归...

AI Projects4/1/2026

LongCat-AudioDiT - 美团开源的文本转语音模型

LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音（TTS）模型，核心创新在于直接在波形潜空间进行扩散生成，非传统梅尔频谱等中间表示，有效避免误差累...

AI Projects4/1/2026

Vision2Web - 清华联合智谱AI推出的视觉网站开发评估基准

Vision2Web是清华大学和智谱AI联合推出的视觉网站开发评估基准，用于评估多模态AI Agent的端到端建站能力。Vision2Web包含193个真实网站任务，分为三层递进难...

AI Projects4/1/2026

wecom-cli - 企业微信官方开源的命令行工具

wecom-cli（企业微信 CLI）是企业微信官方团队开源的命令行工具，让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文...

AI Projects4/1/2026

PixVerse V6 - 爱诗科技推出的最新 AI 视频生成模型

PixVerse V6 是爱诗科技推出的最新 AI 视频生成模型。模型在镜头控制、角色表现和多镜头音视频生成方面实现突破，运镜更精准，角色情绪跨帧连贯，物理交互更...

AI Projects4/1/2026

Pretext - 开源 AI 前端开发工具，解决中文字布局性能瓶颈

Pretext 是前 React 核心成员 Cheng Lou 开源的，纯 JavaScript/TypeScript 的多行文本测量与布局库，用于纯算术方式精确测量多行文本尺寸，完全绕过 DOM 重排。

AI Projects3/31/2026

Pascal Editor - 开源 3D 建筑编辑工具，在浏览器直接运行

Pascal Editor 是基于 Web 的开源 3D 建筑编辑器，由 Claude 辅助开发。工具无需安装，浏览器可运行，采用 WebGPU 技术实现高性能渲染。

AI Projects3/31/2026

Qwen3.5-Omni - 阿里通义推出的全模态大模型

Qwen3.5-Omni 是阿里通义实验室推出的全模态大模型，可同时理解文本、图像、音频及音视频输入。模型采用Thinker-Talker分工架构与Hybrid-MoE技术，在215项音...

AI Projects3/31/2026

Mureka V9 - 昆仑万维推出的最新AI音乐模型

Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品，登顶Artificial Analysis人声和乐器...

AI Projects3/31/2026

GigaWorld-1 - 极佳视界开源的具身世界模型

GigaWorld-1 是极佳视界推出的具身世界模型，在 WorldArena 评测中登顶全球第一。模型采用 AC-WM（动作控制世界模型）架构，结合显式动作建模与可微分物理引...

AI Projects3/31/2026

MicroCoder - 微软联合剑桥等推出的大模型训练优化框架

MicroCoder是微软亚洲研究院联合剑桥大学、普林斯顿大学推出的代码大模型训练优化项目，针对Qwen3等新一代模型训练瓶颈，从算法、数据、评估、经验四维度全面...

AI Projects3/31/2026

KAT-Coder-Pro V2 - 快手KwaiKAT推出的旗舰级AI编程模型

KAT-Coder-Pro V2是快手KwaiKAT团队推出的旗舰级AI编程模型，专为Agentic Coding场景深度优化。模型原生兼容Claude Code、Cline、OpenClaw等10余种主流AI编码...

AI Projects3/31/2026

Matrix-Game 3.0 - 昆仑万维推出的实时交互式世界模型

Matrix-Game 3.0 是昆仑万维（Skywork AI）推出的实时交互式世界模型，支持720p@40FPS实时生成。模型采用误差缓冲机制实现自校正，结合相机感知记忆检索确保...

AI Projects3/29/2026

Star Office UI - 开源 AI 可视化看板，Agent实时工作状态

Star Office UI 是开源的像素风格的 AI 可视化状态看板，支持将 AI 助手的工作状态实时可视化。Star Office UI 支持 6 种状态映射到不同办公区域，配备昨日工...

AI Projects3/29/2026

AnyClaw - 专为 AI Agent 设计的开源智能转接头

AnyClaw 是专为 AI Agent 设计的开源智能转接头，扮演'Agent 互联网与传统互联网的连接器'角色。能将传统互联网分散的 API、脚本、网页自动化工作流等工具，...

AI Projects3/28/2026

Gemini 3.1 Flash Live - 谷歌推出的实时语音模型

Gemini 3.1 Flash Live是Google最新推出的高质量实时语音模型，专为自然流畅的对话交互设计。模型在语调理解、推理能力和响应速度上均有显著提升，能精准识别...

AI Projects3/28/2026

Voxtral TTS - Mistral AI开源的文本转语音模型

Voxtral TTS 是 Mistral AI开源的文本转语音模型，基于 40 亿参数架构，支持 9 种语言。模型具备 90 毫秒超低延迟和 6 倍实时生成速度，仅需 3-5 秒音频可实...

AI Projects3/28/2026

MOCR - 小红书联合华中科技推出的多模态文档解析模型

MOCR（Multimodal OCR）是华中科技大学与小红书hi lab联合推出的多模态文档解析模型，仅3B参数在文档解析和图形重建上实现突破性表现。

AI Projects3/27/2026

daVinci-MagiHuman - Sand.ai等开源的音视频生成模型

daVinci-MagiHuman 是上海创智学院 GAIR 实验室与 Sand.ai 联合开源的音视频联合生成基座模型。模型采用 150 亿参数的单流 Transformer 架构，统一建模文本、...

←1...13 14 15 16 17 18 19...137 →

AI News

AI Projects4/2/2026

Wan2.7-Image - 阿里通义推出的 AI 图像生成与编辑模型

AI Projects4/2/2026

Lightpanda - 开源的 AI 浏览器，兼容主流自动化框架

Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器，用 Zig 语言从零编写，不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16，执行速度...

AI Projects4/2/2026

Veo 3.1 Lite - 谷歌推出的 AI 视频生成模型

AI Projects4/2/2026

TeamClaw - AI Agent管理平台，智能拆解任务、分派协作

AI Projects4/1/2026

ColaMD - 开源 Markdown 编辑器，实时同步修改内容

AI Projects4/1/2026

harrier-oss-v1 - 微软开源的多语言文本嵌入模型

harrier-oss-v1 是微软开源的多语言文本嵌入模型，在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构，通过最后 token 池化和 L2 归...

AI Projects4/1/2026

LongCat-AudioDiT - 美团开源的文本转语音模型

AI Projects4/1/2026

Vision2Web - 清华联合智谱AI推出的视觉网站开发评估基准

AI Projects4/1/2026

wecom-cli - 企业微信官方开源的命令行工具

AI Projects4/1/2026

PixVerse V6 - 爱诗科技推出的最新 AI 视频生成模型

AI Projects4/1/2026

Pretext - 开源 AI 前端开发工具，解决中文字布局性能瓶颈

Pretext 是前 React 核心成员 Cheng Lou 开源的，纯 JavaScript/TypeScript 的多行文本测量与布局库，用于纯算术方式精确测量多行文本尺寸，完全绕过 DOM 重排。

AI Projects3/31/2026

Pascal Editor - 开源 3D 建筑编辑工具，在浏览器直接运行

Pascal Editor 是基于 Web 的开源 3D 建筑编辑器，由 Claude 辅助开发。工具无需安装，浏览器可运行，采用 WebGPU 技术实现高性能渲染。

AI Projects3/31/2026

Qwen3.5-Omni - 阿里通义推出的全模态大模型

AI Projects3/31/2026

Mureka V9 - 昆仑万维推出的最新AI音乐模型

AI Projects3/31/2026

GigaWorld-1 - 极佳视界开源的具身世界模型

AI Projects3/31/2026

MicroCoder - 微软联合剑桥等推出的大模型训练优化框架

AI Projects3/31/2026

KAT-Coder-Pro V2 - 快手KwaiKAT推出的旗舰级AI编程模型

KAT-Coder-Pro V2是快手KwaiKAT团队推出的旗舰级AI编程模型，专为Agentic Coding场景深度优化。模型原生兼容Claude Code、Cline、OpenClaw等10余种主流AI编码...

AI Projects3/31/2026

Matrix-Game 3.0 - 昆仑万维推出的实时交互式世界模型

AI Projects3/29/2026

Star Office UI - 开源 AI 可视化看板，Agent实时工作状态

AI Projects3/29/2026

AnyClaw - 专为 AI Agent 设计的开源智能转接头

AI Projects3/28/2026

Gemini 3.1 Flash Live - 谷歌推出的实时语音模型

AI Projects3/28/2026

Voxtral TTS - Mistral AI开源的文本转语音模型

AI Projects3/28/2026

MOCR - 小红书联合华中科技推出的多模态文档解析模型

MOCR（Multimodal OCR）是华中科技大学与小红书hi lab联合推出的多模态文档解析模型，仅3B参数在文档解析和图形重建上实现突破性表现。

AI Projects3/27/2026

daVinci-MagiHuman - Sand.ai等开源的音视频生成模型

daVinci-MagiHuman 是上海创智学院 GAIR 实验室与 Sand.ai 联合开源的音视频联合生成基座模型。模型采用 150 亿参数的单流 Transformer 架构，统一建模文本、...

All Categories

AI News

Wan2.7-Image - 阿里通义推出的 AI 图像生成与编辑模型

Lightpanda - 开源的 AI 浏览器，兼容主流自动化框架

Veo 3.1 Lite - 谷歌推出的 AI 视频生成模型

TeamClaw - AI Agent管理平台，智能拆解任务、分派协作

ColaMD - 开源 Markdown 编辑器，实时同步修改内容

harrier-oss-v1 - 微软开源的多语言文本嵌入模型

LongCat-AudioDiT - 美团开源的文本转语音模型

Vision2Web - 清华联合智谱AI推出的视觉网站开发评估基准

wecom-cli - 企业微信官方开源的命令行工具

PixVerse V6 - 爱诗科技推出的最新 AI 视频生成模型

Pretext - 开源 AI 前端开发工具，解决中文字布局性能瓶颈

Pascal Editor - 开源 3D 建筑编辑工具，在浏览器直接运行

Qwen3.5-Omni - 阿里通义推出的全模态大模型

Mureka V9 - 昆仑万维推出的最新AI音乐模型

GigaWorld-1 - 极佳视界开源的具身世界模型

MicroCoder - 微软联合剑桥等推出的大模型训练优化框架

KAT-Coder-Pro V2 - 快手KwaiKAT推出的旗舰级AI编程模型

Matrix-Game 3.0 - 昆仑万维推出的实时交互式世界模型

Star Office UI - 开源 AI 可视化看板，Agent实时工作状态

AnyClaw - 专为 AI Agent 设计的开源智能转接头

Gemini 3.1 Flash Live - 谷歌推出的实时语音模型

Voxtral TTS - Mistral AI开源的文本转语音模型

MOCR - 小红书联合华中科技推出的多模态文档解析模型

daVinci-MagiHuman - Sand.ai等开源的音视频生成模型

AI News

Wan2.7-Image - 阿里通义推出的 AI 图像生成与编辑模型

Lightpanda - 开源的 AI 浏览器，兼容主流自动化框架

Veo 3.1 Lite - 谷歌推出的 AI 视频生成模型

TeamClaw - AI Agent管理平台，智能拆解任务、分派协作

ColaMD - 开源 Markdown 编辑器，实时同步修改内容

harrier-oss-v1 - 微软开源的多语言文本嵌入模型

LongCat-AudioDiT - 美团开源的文本转语音模型

Vision2Web - 清华联合智谱AI推出的视觉网站开发评估基准

wecom-cli - 企业微信官方开源的命令行工具

PixVerse V6 - 爱诗科技推出的最新 AI 视频生成模型

Pretext - 开源 AI 前端开发工具，解决中文字布局性能瓶颈

Pascal Editor - 开源 3D 建筑编辑工具，在浏览器直接运行

Qwen3.5-Omni - 阿里通义推出的全模态大模型

Mureka V9 - 昆仑万维推出的最新AI音乐模型

GigaWorld-1 - 极佳视界开源的具身世界模型

MicroCoder - 微软联合剑桥等推出的大模型训练优化框架

KAT-Coder-Pro V2 - 快手KwaiKAT推出的旗舰级AI编程模型

Matrix-Game 3.0 - 昆仑万维推出的实时交互式世界模型

Star Office UI - 开源 AI 可视化看板，Agent实时工作状态

AnyClaw - 专为 AI Agent 设计的开源智能转接头

Gemini 3.1 Flash Live - 谷歌推出的实时语音模型

Voxtral TTS - Mistral AI开源的文本转语音模型

MOCR - 小红书联合华中科技推出的多模态文档解析模型

daVinci-MagiHuman - Sand.ai等开源的音视频生成模型