InsForge - 面向 AI 编程 Agent 的开源后端平台
InsForge 是面向 AI 编程 Agent 的开源后端平台。工具通过 MCP Server 和 CLI 接口,让 Cursor、Claude Code、Copilot 等 Agent 像后端工程师一样自主操作数...
InsForge 是面向 AI 编程 Agent 的开源后端平台。工具通过 MCP Server 和 CLI 接口,让 Cursor、Claude Code、Copilot 等 Agent 像后端工程师一样自主操作数...
AudioLib 是杨樾与 43Music 团队推出的音频版OpenRouter,将团队一年多创作的 10 万+首原创音乐用 API 形式开放给开发者。无需 SDK、播放器、版权谈判或曲库...
AI Job Search是基于Claude Code的开源AI求职框架,通过/setup建立详细职业档案,/scrape智能评估职位匹配度,/apply启动'起草-复审'双代理工作流,自动生成...
HiDream-O1-Image 是智象未来开源的 8B 像素级原生统一图像生成模型,采用全球首创的 UiT 架构,无需 VAE 和独立文本编码器即可在单一 token 空间内直接生成 ...
OpenAI CLI 是 OpenAI 官方推出的命令行界面工具,由 Codex 团队开发者体验工程师 Jason Liu 主导推出。
Camofox Browser 是开源 AI Agent 反检测浏览器服务器,基于 Camoufox(Firefox C++ 级指纹魔改版)构建。通过 REST API 为 AI 提供结构化网页快照(体积缩减...
Multica 是开源的 AI Agent 团队协作平台,由前 TikTok 工程师 Jiayuan 创立。平台将 Claude Code、Codex、Kimi 等 coding agent 变成真正的队友,在看板上与...
WebWorld 是阿里巴巴 Qwen 团队开源的大规模网页世界模型系列,基于 Qwen3 底座训练,包含 8B、14B、32B 三个版本。模型通过在模拟浏览器环境中预测网页状态...
TACO 是曼彻斯特大学、北京航空航天大学、香港科技大学以及MAP 团队开源的无需训练、即插即用的终端智能体自进化观测压缩框架。
Mirage 是 strukto-ai 团队推出的面向 AI Agent 的统一虚拟文件系统。工具将 S3、Slack、Gmail、GitHub、MongoDB 等异构数据源统一挂载为同一棵虚拟文件树,...
SkillClaw 是 AMAP-ML(高德地图机器学习团队)开源的 AI Agent 技能集体进化框架。框架通过本地 API 代理拦截 Agent 会话,在后台自动从真实交互中提取、去...
GPT-5.5-Cyber 是 OpenAI 推出的网络安全专用模型,面向经身份验证的防御者提供有限预览。模型基于 GPT-5.5 构建,通过可信网络访问框架降低安全限制,支持漏...
StepAudio 2.5 Realtime 是阶跃星辰推出的端到端实时语音大模型,主打真人级语音对话体验。模型支持内容层面的深度交互,在声音表现力上完全贴近真人,具备顶...
Ring-2.6-1T是蚂蚁百灵推出的万亿参数深度推理模型,属于Ring系列,专注数学竞赛、代码生成等复杂认知任务的慢思考能力。模型采用MoE混合专家架构,在高参数...
文心5.1(ERNIE 5.1)是百度推出的旗舰大语言模型,基于文心5.0知识蒸馏与Once-for-All弹性训练框架,将预训练成本降至业界同规模模型的6%。
Doubao-Seed-2.0-lite 是字节跳动豆包团队推出的首款全模态理解模型。模型支持视频、图像、音频、文本的原生统一理解,同步升级了 Agent、Coding 与 GUI 能力。
GPT-Realtime-Translate 是 OpenAI 推出的实时语音翻译模型,支持 70 余种输入语言实时翻译为 13 种输出语言,采用端到端架构直接处理原始音频,跳过文字中间...
GPT-Realtime-Whisper 是 OpenAI 推出的流式语音转文字模型,基于 Whisper 架构升级而来,能在用户说话的同时实时输出文字,延迟极低。
GPT-Realtime-2 是 OpenAI 推出的第二代实时语音模型,是目前 Realtime API 中推理能力最强的语音 Agent。模型具备 GPT-5 级推理能力,能在语音对话中边听边...
SenseNova 6.7 Flash-Lite是商汤科技推出的新一代轻量化多模态智能体模型,采用原生多模态架构,专为真实世界工作流设计。
Grok Voice Think Fast 1.0是xAI推出的旗舰级语音智能体模型,专攻复杂多步骤真实场景。模型在τ-voice Bench排名第一,支持25种语言与全双工对话,具备低延迟...
Realtime TTS-2 是 Inworld AI 推出的新一代实时语音合成模型,专为对话式 AI 场景打造。模型能将文本转为自然语音,更能'听懂'对话上下文的音频情绪、语调和...
GenericAgent(GA)是 A3 Lab 推出的通用自进化 LLM Agent 系统,以'上下文信息密度最大化'为核心设计原则。GenericAgent通过 9 个原子工具、30k 上下文窗口...
Models.dev 是 OpenCode 团队开源的 AI 模型数据库。Models.dev 以标准化 TOML 格式整合 OpenAI、Anthropic、Google 等数十家主流厂商的模型信息,涵盖价格、...