project
AgentScope 2.0 - 通义实验室开源的多智能体开发框架
AgentScope 2.0 是通义实验室推出的开源多智能体开发框架,聚焦真实场景下的稳定运行、安全控制与生产部署,新增模型容错、权限系统、上下文管理重构、Middle...
AgentScope 2.0 是什么
AgentScope 2.0 是通义实验室推出的开源多智能体开发框架,聚焦真实场景下的稳定运行、安全控制与生产部署,新增模型容错、权限系统、上下文管理重构、Middleware 扩展、Workspace 执行解耦和 Agent Service 服务化部署等系统性能力,让智能体从跑通 Demo走向稳定生产。
AgentScope 2.0 的主要功能
- 模型容错:支持 Qwen、Anthropic、DeepSeek、Gemini、OpenAI、Grok、Moonshot 等主流模型统一接入。引入自动重试与备用模型切换机制,主模型调用失败时自动尝试备用模型,保证长链路任务不中断。
- 过程透明与事件系统:重构消息模块,通过统一 Content Block 承载文本、文件/图片、工具结果、模型思考等多种消息类型。引入事件流系统,支持流式输出模型调用开始、文本增量、工具调用、用户确认等事件,实现执行过程实时可见、可交互、可干预。
- 安全边界与权限系统:系统化权限控制覆盖工具调用、文件读写、命令执行。基于静态规则、工具类型和输入内容进行风险判断,支持自动允许、拒绝或进入用户审批流程,可识别危险目录、敏感文件、高风险命令和危险删除操作。
- 上下文管理重构:结构化压缩保留任务目标、当前状态、关键发现、下一步计划等关键信息。工具结果自动截断避免超长日志撑爆上下文。文件读写新增缓存机制,强制”先读后改”,减少重复 IO。
- Middleware 扩展机制:支持在模型调用、思考规划、工具执行等关键节点插入自定义逻辑,用于日志追踪、安全检查、业务策略注入、动态上下文注入等,无需修改框架源码。
- Workspace 执行解耦:抽象执行环境,统一本地、Docker 容器、E2B 云沙箱等不同后端接口。智能体运行逻辑与环境解耦,支持一次编写、本地云端无缝切换。内置预热池机制,支持并行场景的批量环境初始化。
- Agent Service 服务化部署:将 Runtime 的 Agent Service 能力合并至主库,打通开发与部署。提供标准服务接口、流式输出、会话恢复能力,支持被前端应用、外部系统、工作流稳定调用。
AgentScope 2.0 的技术原理
- 统一消息结构:用 Content Block 抽象承载文本、文件/图片、工具结果、模型思考等多模态消息,DataBlock 支持 base64 与 URL 两类数据源,兼容不同模型 API 的多模态能力。
- 事件驱动架构:一次 Agent 回复不再只是返回最终文本,而是流式产生模型调用开始、文本增量、工具调用、工具结果、用户确认、外部执行等事件,让前端 UI 实时展示执行进度。
- 权限检查流程:智能体发起工具调用、文件读写或命令执行时,权限系统依次进行规则检查、输入分析、风险判断,输出允许、拒绝或用户确认三种结果。
- 上下文管理策略:针对长期任务的多轮推理、工具结果和文件内容,采用结构化压缩保留关键状态,自动截断超长工具结果,并通过文件缓存机制减少重复读取。
- Middleware 插桩:在模型调用、思考规划、工具执行等关键执行环节预留钩子,开发者可插入自定义逻辑实现日志、权限、上下文等横切关注点的统一处理。
- Workspace 抽象层:通过 WorkspaceBase 抽象出身份标识、生命周期、资源发现、上下文卸载和动态资源管理等通用能力,不同执行后端(本地、容器、云沙箱)实现同一套接口即可接入。
如何使用AgentScope 2.0
- 安装框架:通过 pip 安装 AgentScope:
pip install agentscope - 配置模型接入:在配置中指定主模型和备用模型,设置重试次数和切换策略。
- 定义智能体与工具:用 ReActAgent 创建智能体,注册所需工具函数到 Toolkit。
- 设置权限规则:配置工具调用、文件读写、命令执行的权限策略,定义允许/拒绝/确认规则。
- 选择执行环境:通过 Workspace 选择本地、Docker 容器或 E2B 云沙箱作为执行后端。
- 启动服务或本地运行:用 Agent Service 启动标准接口服务,或通过脚本本地运行智能体工作流。
AgentScope 2.0的核心优势
-
稳定性强:模型层自动重试+备用切换、上下文结构化压缩、文件缓存,保障长链路任务持续执行不中断。
-
安全性高:系统化权限系统支持规则检查、风险判断和用户审批,为高危操作建立自动拦截与审批机制。
-
透明可控:事件流系统让执行过程实时可见,支持人工确认和人工介入,告别黑盒回复。
-
扩展灵活:Middleware 机制允许不改源码即插即用业务逻辑,Workspace 支持本地/容器/云沙箱无缝切换。
-
生产就绪:内置 Agent Service 提供标准接口、流式输出和会话恢复,可直接从开发脚本上线为生产服务。
-
多模态领先:支持图像生成、TTS、语音输入、实时语音等丰富多模态能力,以及 MCP、A2A 协议。
AgentScope 2.0的项目地址
- 项目官网:https://docs.agentscope.io/zh/v2
AgentScope 2.0的同类竞品对比
| 对比维度 | AgentScope 2.0 | AutoGen (Microsoft) | CrewAI |
|---|---|---|---|
| 核心定位 | 企业级多智能体开发框架 | 多智能体对话编排框架 | 角色化多智能体编排框架 |
| 设计哲学 | Agent-Oriented Programming,强调智能体自主性与组织架构 | 对话即工作流,强调多 Agent 协作对话 | 角色扮演团队,自然语言定义 Agent 角色与目标 |
| 多模型支持 | Qwen、Anthropic、DeepSeek、Gemini、OpenAI、Grok、Moonshot 等 | OpenAI、Azure OpenAI、Anthropic、本地模型等 | OpenAI、Anthropic、Gemini、Ollama、开源模型等 |
| 模型容错 | 自动重试 + 备用模型切换 | ️ 依赖模型层自身容错 | 无内置容错机制 |
| 执行过程透明 | 事件流系统,流式展示执行过程,支持人工介入 | ️ 基于对话历史,过程可见性有限 | 仅展示任务输出,无过程事件流 |
| 权限与安全 | 系统化权限系统,支持规则检查、风险判断、用户审批 | ️ 基础安全控制,无系统化权限 | 无系统化权限控制 |
| 上下文管理 | 结构化压缩 + 结果截断 + 文件缓存 | ️ 对话历史管理,无结构化压缩 | ️ 基础任务输出传递,无上下文压缩 |
| 执行环境 | Workspace 抽象,本地/容器/云沙箱无缝切换 | ️ 需自行配置执行环境 | 无执行环境抽象 |
| 服务化部署 | Agent Service 内置,标准接口 + 流式输出 + 会话恢复 | ️ 需结合外部服务部署 | ️ 需 CrewAI Enterprise 平台 |
| 扩展机制 | Middleware 机制,即插即用 | ️ 通过 Selector 机制扩展 | ️ 通过 Flows 扩展,灵活性有限 |
| 多模态支持 | 图像生成、TTS、语音输入、实时语音 | ️ 文本为主,多模态需自定义 | 无内置多模态支持 |
| 协议支持 | MCP (HTTP+Stdio)、A2A | ️ MCP 社区支持 | ️ A2A 协议支持中 |
| 适用场景 | 企业级复杂协作、实时语音 Agent、多模态应用 | 快速原型、多角色对话模拟、代码生成 | 快速原型、内容生成、研究分析、角色协作 |
| 上手难度 | 中等(需理解 async/await) | 低(10分钟上手) | 极低(20行代码即可运行) |
| 生产就绪度 | 高(内置沙箱、服务化、监控) | 中(2025年10月生产就绪) | 中(企业平台有延迟问题) |
AgentScope 2.0的应用场景
-
企业级复杂协作系统:需要多智能体层级协作、严格组织管理的业务流程自动化。
-
实时语音 Agent:构建支持语音输入、实时对话的多模态智能体应用。
-
安全敏感型任务:涉及文件操作、命令执行等需要严格权限控制和审计轨迹的场景。
-
长链路持续任务:需要多轮推理、多次工具调用、跨轮次状态保持的复杂工作流。
-
多云/混合部署:需要在本地开发、容器测试、云沙箱生产之间灵活切换的环境。