AI 资讯

全部快讯教程百科 AI项目 AI应用集

AI项目2026/7/8

GPT-Realtime-2.1 - OpenAI推出的新一代实时语音模型

GPT-Realtime-2.1是OpenAI推出的新一代实时语音模型。2.1旗舰版显著提升了字母数字识别、静音噪音处理及中断响应能力，支持语音、文本和图像输入，具备强大推...

AI项目2026/7/8

MemGUI-Agent - 浙大联合快手推出的长程手机GUI智能体

MemGUI-Agent 是浙大与快手联合推出的长程手机GUI智能体，专为跨App、多步骤、长链条的移动端自动化任务设计。

AI项目2026/7/8

InternAgentS - 上海 AI Lab 开源的国产科研智能体工作台

InternAgentS 是上海AI实验室开源的国产科研智能体工作台，面向 AI for Science 场景，将论文阅读、实验分析、代码迭代、远程计算、科研写作等分散环节整合到...

AI项目2026/7/7

Fun-ASR-Realtime - 阿里千问推出的流式实时语音识别模型

Fun-ASR-Realtime 是阿里千问推出的流式实时语音识别大模型。模型通过 WebSocket 流式协议实现边说边出字，首字延迟百毫秒，尾字延迟同样极低。

AI项目2026/7/7

Hy3 - 腾讯混元开源的混合专家模型

Hy3 是腾讯混元开源的 295B 参数混合专家（MoE）模型。模型在 Agent 能力、推理与长上下文任务上显著进步，多项基准比肩参数规模 2-5 倍的旗舰模型。

AI项目2026/7/7

FuckClaude - 开源的浏览器环境自测工具，是否会被CC标记

FuckClaude 是轻量、SEO 友好、中英双语的单页浏览器检测工具，用于扫描用户的浏览器环境并判断其是否会被 Claude Code 标记为'中国用户'。点击运行后，工具...

AI项目2026/7/7

Elements Claw - 阿里达摩院推出的超导材料发现 AI 智能体

ElementsClaw 是阿里达摩院联合中国人民大学、中国科学院大学推出的行业首个超导材料发现 AI 智能体，采用专通融合架构，将 10 亿参数原子基础模型 Elements ...

AI项目2026/7/6

ComAct - 上海AI Lab等推出软件自动化操作的研究范式

ComAct（COM-as-Action）是重新定义专业软件自动化操作的研究范式，由Jiaxin Ai等人提出。范式将Windows的Component Object Model（COM）识别为统一的可执行...

AI项目2026/7/6

Page Agent - 阿里开源的 JavaScript GUI 智能体库

Page Agent 是阿里巴巴开源的纯前端 JavaScript 智能体库，通过一行代码嵌入网页，可让用户用自然语言操控页面 DOM 元素。

AI项目2026/7/6

EdgeBench - 字节跳动推出的 AI 学习能力基准测试框架

EdgeBench 是字节跳动 Seed 团队推出的基准测试框架，用于评估自主 AI Agent 在真实世界环境中的长期学习能力。

AI项目2026/7/6

Vidu S1 - 生数科技推出的实时交互视频基础模型

Vidu S1 是生数科技推出的全球领先实时交互视频基础模型，标志着 AI 视频从离线生成迈入实时双向互动时代。基于自回归扩散架构，支持 540P 分辨率、25FPS（最...

AI项目2026/7/5

AReaL 2.0 - 蚂蚁等开源的Agent在线强化学习基础架构

AReaL 2.0是蚂蚁联合香港科技大学、清华大学开源的Agent在线强化学习基础架构，能让已部署的Agent从真实交互轨迹中持续自我演进。

AI项目2026/7/5

Ego Lite - 专为AI Agent设计的浏览器，实现人与AI协同工作

Ego Lite 是基于 Chromium 的人与 AI 智能体并行协作的浏览器。Ego Lite是为 AI Agent 提供底层浏览器操作能力的基础设施。

AI项目2026/7/4

video-use - Browser Use 团队开源的 AI 视频剪辑 Agent

Video-use 是 Browser Use 团队开源的 AI 视频剪辑 Agent，通过自然语言对话替代传统时间线操作。用户只需将原始素材放入文件夹并描述需求，Agent 自动完成素...

AI项目2026/7/4

ViiTorVoice - 云上曲率推出的 AI 语音合成模型

ViiTorVoice 是云上曲率推出的全球首个支持局部编辑的 AI 语音合成模型，登顶 Seed-TTS 权威评测榜首。它采用 NAR 非自回归架构，实现'像改 Word 一样修语音'...

AI项目2026/7/4

Octo - 明略科技开源的 AI-native 团队协作平台

Octo 是明略科技开源的 AI-native 团队协作平台，将分散的 AI Agent 聚合到统一空间，通过 IM 形态实现人与 Agent、Agent 与 Agent 的高效编排。

AI项目2026/7/4

SemanticAudio - 港中文等推出的音频生成与编辑框架

SemanticAudio 是香港中文大学、LIGHTSPEED、上海交通大学联合推出的音频生成与编辑框架。框架将文本到音频生成拆分为'语义规划'与'声学合成'两阶段，在高层...

AI项目2026/7/3

GeneBench-Pro - OpenAI 推出的计算生物学研究级基准测试

GeneBench-Pro 是 OpenAI 推出的研究级基准测试，用于评估 AI 模型在计算生物学中处理判断密集型分析的能力。GeneBench-Pro 包含 129 个跨基因组学、定量生物...

AI项目2026/7/3

WorldCupVoice - 开源的 AI 实时体育解说系统

WorldCupVoice 是开源的 AI 实时体育解说系统，通过接入 Agora RTC 直播流，由视觉模型分析比赛画面并生成实时语音解说，回传至直播间与观众同步收听。

AI项目2026/7/3

Nemotron-Labs-TwoTower - 英伟达开源的双塔架构扩散语言模型

NVIDIA Nemotron-Labs-TwoTower 是英伟达开源的双塔架构扩散语言模型，总参数约60B、活跃参数3B。模型将上下文理解与去噪生成解耦为两个独立塔，冻结的AR上下...

AI项目2026/7/2

LiveWorld - 阿德莱德大学等推出的生成式视频世界模型

LiveWorld 是阿德莱德大学、澳大利亚国立大学等机构联合推出的生成式视频世界模型，核心解决视野外动态问题，当物体离开相机视野后，传统模型会将其状态冻结...

AI项目2026/7/2

Mirawork - 桌面 AI 办公智能体，覆盖办公全场景创作

Mirawork 是安全优先的桌面 AI 办公智能体，支持 macOS/Windows/Linux。用户用自然语言下达任务，Mirawork能自动拆解需求、调用内置技能链完成执行，覆盖文档...

AI项目2026/7/2

Nano Banana 2 Lite - 谷歌推出的轻量级 AI 图像生成模型

Nano Banana 2 Lite 是谷歌推出的自研轻量级 AI 图像生成模型，定位速度优先的极速版，可在 4 秒内生成单张图像，每千张收费仅 0.034 美元。

AI项目2026/7/2

LocateAnything - 英伟达推出的视觉语言定位模型

LocateAnything是英伟达推出的视觉语言定位模型，基于并行框解码技术，用户输入自然语言即可在图像中精准框选目标。模型支持多目标检测、GUI定位、OCR文本检...

←1 2 3 4 5 6 7...137 →

AI 资讯

AI项目2026/7/8

GPT-Realtime-2.1 - OpenAI推出的新一代实时语音模型

AI项目2026/7/8

MemGUI-Agent - 浙大联合快手推出的长程手机GUI智能体

MemGUI-Agent 是浙大与快手联合推出的长程手机GUI智能体，专为跨App、多步骤、长链条的移动端自动化任务设计。

AI项目2026/7/8

InternAgentS - 上海 AI Lab 开源的国产科研智能体工作台

AI项目2026/7/7

Fun-ASR-Realtime - 阿里千问推出的流式实时语音识别模型

Fun-ASR-Realtime 是阿里千问推出的流式实时语音识别大模型。模型通过 WebSocket 流式协议实现边说边出字，首字延迟百毫秒，尾字延迟同样极低。

AI项目2026/7/7

Hy3 - 腾讯混元开源的混合专家模型

Hy3 是腾讯混元开源的 295B 参数混合专家（MoE）模型。模型在 Agent 能力、推理与长上下文任务上显著进步，多项基准比肩参数规模 2-5 倍的旗舰模型。

AI项目2026/7/7

FuckClaude - 开源的浏览器环境自测工具，是否会被CC标记

AI项目2026/7/7

Elements Claw - 阿里达摩院推出的超导材料发现 AI 智能体

AI项目2026/7/6

ComAct - 上海AI Lab等推出软件自动化操作的研究范式

ComAct（COM-as-Action）是重新定义专业软件自动化操作的研究范式，由Jiaxin Ai等人提出。范式将Windows的Component Object Model（COM）识别为统一的可执行...

AI项目2026/7/6

Page Agent - 阿里开源的 JavaScript GUI 智能体库

Page Agent 是阿里巴巴开源的纯前端 JavaScript 智能体库，通过一行代码嵌入网页，可让用户用自然语言操控页面 DOM 元素。

AI项目2026/7/6

EdgeBench - 字节跳动推出的 AI 学习能力基准测试框架

EdgeBench 是字节跳动 Seed 团队推出的基准测试框架，用于评估自主 AI Agent 在真实世界环境中的长期学习能力。

AI项目2026/7/6

Vidu S1 - 生数科技推出的实时交互视频基础模型

AI项目2026/7/5

AReaL 2.0 - 蚂蚁等开源的Agent在线强化学习基础架构

AReaL 2.0是蚂蚁联合香港科技大学、清华大学开源的Agent在线强化学习基础架构，能让已部署的Agent从真实交互轨迹中持续自我演进。

AI项目2026/7/5

Ego Lite - 专为AI Agent设计的浏览器，实现人与AI协同工作

Ego Lite 是基于 Chromium 的人与 AI 智能体并行协作的浏览器。Ego Lite是为 AI Agent 提供底层浏览器操作能力的基础设施。

AI项目2026/7/4

video-use - Browser Use 团队开源的 AI 视频剪辑 Agent

AI项目2026/7/4

ViiTorVoice - 云上曲率推出的 AI 语音合成模型

AI项目2026/7/4

Octo - 明略科技开源的 AI-native 团队协作平台

Octo 是明略科技开源的 AI-native 团队协作平台，将分散的 AI Agent 聚合到统一空间，通过 IM 形态实现人与 Agent、Agent 与 Agent 的高效编排。

AI项目2026/7/4

SemanticAudio - 港中文等推出的音频生成与编辑框架

AI项目2026/7/3

GeneBench-Pro - OpenAI 推出的计算生物学研究级基准测试

AI项目2026/7/3

WorldCupVoice - 开源的 AI 实时体育解说系统

WorldCupVoice 是开源的 AI 实时体育解说系统，通过接入 Agora RTC 直播流，由视觉模型分析比赛画面并生成实时语音解说，回传至直播间与观众同步收听。

AI项目2026/7/3

Nemotron-Labs-TwoTower - 英伟达开源的双塔架构扩散语言模型

AI项目2026/7/2

LiveWorld - 阿德莱德大学等推出的生成式视频世界模型

AI项目2026/7/2

Mirawork - 桌面 AI 办公智能体，覆盖办公全场景创作

AI项目2026/7/2

Nano Banana 2 Lite - 谷歌推出的轻量级 AI 图像生成模型

Nano Banana 2 Lite 是谷歌推出的自研轻量级 AI 图像生成模型，定位速度优先的极速版，可在 4 秒内生成单张图像，每千张收费仅 0.034 美元。

AI项目2026/7/2

全部分类

AI 资讯

GPT-Realtime-2.1 - OpenAI推出的新一代实时语音模型

MemGUI-Agent - 浙大联合快手推出的长程手机GUI智能体

InternAgentS - 上海 AI Lab 开源的国产科研智能体工作台

Fun-ASR-Realtime - 阿里千问推出的流式实时语音识别模型

Hy3 - 腾讯混元开源的混合专家模型

FuckClaude - 开源的浏览器环境自测工具，是否会被CC标记

Elements Claw - 阿里达摩院推出的超导材料发现 AI 智能体

ComAct - 上海AI Lab等推出软件自动化操作的研究范式

Page Agent - 阿里开源的 JavaScript GUI 智能体库

EdgeBench - 字节跳动推出的 AI 学习能力基准测试框架

Vidu S1 - 生数科技推出的实时交互视频基础模型

AReaL 2.0 - 蚂蚁等开源的Agent在线强化学习基础架构

Ego Lite - 专为AI Agent设计的浏览器，实现人与AI协同工作

video-use - Browser Use 团队开源的 AI 视频剪辑 Agent

ViiTorVoice - 云上曲率推出的 AI 语音合成模型

Octo - 明略科技开源的 AI-native 团队协作平台

SemanticAudio - 港中文等推出的音频生成与编辑框架

GeneBench-Pro - OpenAI 推出的计算生物学研究级基准测试

WorldCupVoice - 开源的 AI 实时体育解说系统

Nemotron-Labs-TwoTower - 英伟达开源的双塔架构扩散语言模型

LiveWorld - 阿德莱德大学等推出的生成式视频世界模型

Mirawork - 桌面 AI 办公智能体，覆盖办公全场景创作

Nano Banana 2 Lite - 谷歌推出的轻量级 AI 图像生成模型

LocateAnything - 英伟达推出的视觉语言定位模型

AI 资讯

GPT-Realtime-2.1 - OpenAI推出的新一代实时语音模型

MemGUI-Agent - 浙大联合快手推出的长程手机GUI智能体

InternAgentS - 上海 AI Lab 开源的国产科研智能体工作台

Fun-ASR-Realtime - 阿里千问推出的流式实时语音识别模型

Hy3 - 腾讯混元开源的混合专家模型

FuckClaude - 开源的浏览器环境自测工具，是否会被CC标记

Elements Claw - 阿里达摩院推出的超导材料发现 AI 智能体

ComAct - 上海AI Lab等推出软件自动化操作的研究范式

Page Agent - 阿里开源的 JavaScript GUI 智能体库

EdgeBench - 字节跳动推出的 AI 学习能力基准测试框架

Vidu S1 - 生数科技推出的实时交互视频基础模型

AReaL 2.0 - 蚂蚁等开源的Agent在线强化学习基础架构

Ego Lite - 专为AI Agent设计的浏览器，实现人与AI协同工作

video-use - Browser Use 团队开源的 AI 视频剪辑 Agent

ViiTorVoice - 云上曲率推出的 AI 语音合成模型

Octo - 明略科技开源的 AI-native 团队协作平台

SemanticAudio - 港中文等推出的音频生成与编辑框架

GeneBench-Pro - OpenAI 推出的计算生物学研究级基准测试

WorldCupVoice - 开源的 AI 实时体育解说系统

Nemotron-Labs-TwoTower - 英伟达开源的双塔架构扩散语言模型

LiveWorld - 阿德莱德大学等推出的生成式视频世界模型

Mirawork - 桌面 AI 办公智能体，覆盖办公全场景创作

Nano Banana 2 Lite - 谷歌推出的轻量级 AI 图像生成模型

LocateAnything - 英伟达推出的视觉语言定位模型