Qwen3.5-LiveTranslate - 阿里通义推出的实时同声传译模型
Qwen3.5-LiveTranslate 是阿里通义团队推出的实时同声传译大模型,支持60语种输入、29语种输出与3500+翻译组合,通过可读单元流式技术将端到端字均延迟压缩至...
Qwen3.5-LiveTranslate 是阿里通义团队推出的实时同声传译大模型,支持60语种输入、29语种输出与3500+翻译组合,通过可读单元流式技术将端到端字均延迟压缩至...
Composer 2.5 是 Cursor 推出的自研 Agentic 编程模型。在智能水平和行为表现上较 Composer 2 有大幅提升,在 SWE-Bench Multilingual(79.8%) 和 CursorBen...
Chronicles-OCR 是腾讯混元联合中国科学院信息工程研究所、安阳师范学院、南开大学及故宫博物院共同推出的业界首个覆盖中国汉字'七体之变'完整演化轨迹的跨时...
ESP-Claw 是乐鑫推出的物联网设备 AI Agent 框架,采用'Chat Coding'理念,让用户通过自然语言对话可定义和修改硬件设备行为。
Qwen3.7 Preview 是阿里通义千问团队推出的下一代旗舰大模型预览版,包含Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两个版本。
MemPrivacy 是记忆张量(MemTensor)团队联合荣耀 AI 团队及同济大学共同开源的端云协同 Agent 隐私保护框架。针对云端 Agent 长期记忆场景中的隐私泄露风险...
PPT Master 是开源的AI驱动PPT生成标准化工作流(Skill),可在具备Agent智能体能力的AI IDE中运行,实现PDF、DOCX、XLSX、网址、Markdown、PPTX等任意格式文...
Higgs Avatar v1 是BosonAI推出的面向语音智能体的实时 AI 数字人模型。模型仅需一张静态照片,可生成具备口型同步、面部表情与头部动作的实时交互数字人。
Violin 是牛津大学博士后 Kevin Lin 开源的端到端 AI 视频翻译工具,打破高质量视频内容的语言壁垒。集成 Whisper 语音识别、大语言模型翻译与 TTS 语音合成...
Intern-S2-Preview 是上海人工智能实验室开源的新一代书生科学多模态大模型预览版,以35B参数规模实现比肩万亿参数模型的科学能力。模型通过'通专融合'全链路...
OpenHuman 是 tinyhumansai 团队推出的开源个人 AI 超级智能助手,定位为'Your Personal AI super intelligence',主打私有、简单且极其强大。非传统聊天机器...
Pixal3D 是腾讯 ARC 实验室联合清华大学、惠灵顿维多利亚大学推出的单图像 3D 生成项目。Pixal3D通过反向投影将像素特征显式提升到三维空间,建立直接的像素...
HiCAD 是开源的 AI 参数化 3D CAD 建模平台,专为 3D 打印爱好者设计。用户用自然语言描述需求,AI 可秒级生成可编辑的 JSCAD 参数化代码,配合实时 3D 预览...
Kimi WebBridge 是月之暗面推出的浏览器扩展插件,面向 Kimi Code、Claude Code、Cursor、Codex 等本地 AI Agent。
TencentDB Agent Memory是腾讯云数据库团队开源的AI Agent分层记忆管理工具,采用MIT协议。工具通过独创的L0-L3四层渐进式记忆架构与上下文卸载+Mermaid任务...
General365 是美团 LongCat 团队开源的通用推理评测基准,包含 365 道原创种子题及 1095 个扩展变体,覆盖八大推理挑战维度。
AGenUI 是高德地图联合阿里千问 C 端应用团队推出的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。
Xiaomi OneVL是小米具身智能团队推出的开源自动驾驶大模型,在业内首次将VLA视觉-语言-动作、世界模型与潜空间推理三大技术路线统一于单一框架。
OpenMontage 是全球首个开源的 Agentic 视频制作系统,由 AI 编程助手自主编排完成从概念到成片的全流程。
AI 时代大家最缺的资源不外乎就是 Token 了,特别是玩龙虾的,烧起 Token 来就像流水一样,根本就停不下来。
9Router 是开源的 AI 编程路由代理工具,可将 Claude Code、Codex、Cursor、Cline 等主流 AI 编程工具统一接入本地代理层,智能调度 40+ 供应商与 100+ 模型。
ELF(Embedded Language Flows)是何恺明团队推出的首个扩散语言模型,采用连续扩散范式替代传统自回归路线。模型全程在连续 embedding 空间中去噪生成文本,...
InsForge 是面向 AI 编程 Agent 的开源后端平台。工具通过 MCP Server 和 CLI 接口,让 Cursor、Claude Code、Copilot 等 Agent 像后端工程师一样自主操作数...
AudioLib 是杨樾与 43Music 团队推出的音频版OpenRouter,将团队一年多创作的 10 万+首原创音乐用 API 形式开放给开发者。无需 SDK、播放器、版权谈判或曲库...