project
Qwen3.6-Max-Preview - 阿里通义推出的下一代旗舰模型
Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus,模型在智能体编程、世界知识和指令遵循三大维度实现显著提升...
Qwen3.6-Max-Preview是什么
Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus,模型在智能体编程、世界知识和指令遵循三大维度实现显著提升,在 SWE-bench Pro、Terminal-Bench 2.0、SciCode 等六项编程基准测试中取得最高分。用户可通过 Qwen Studio 在线体验,或通过阿里云百炼 API 调用。
Qwen3.6-Max-Preview的主要功能
-
智能体编程:在 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench 等六项编程基准中取得最高分,支持代码生成、终端操作与长程代码任务。
-
世界知识增强:研究生级别知识问答(SuperGPQA)与中文知识(QwenChineseBench)能力显著提升。
-
指令遵循优化:真实场景工具调用格式遵循(ToolcallFormatIFBench)表现更优。
-
思维链保留:支持
preserve_thinking功能,可在多轮对话中保留前序思维内容,适配复杂智能体任务。 -
协议兼容:API 兼容 OpenAI(chat completions/responses)与 Anthropic 接口规范,便于无缝接入现有工作流。
如何使用Qwen3.6-Max-Preview
- 在线体验:访问 Qwen Studio,选择 Qwen3.6-Max-Preview 模型可开始交互对话。
- API 调用
- 访问阿里云百炼官网,获取 API Key。
- 调用时模型名称填写
qwen3.6-max-preview。 - 支持 OpenAI 标准协议(chat completions / responses)及 Anthropic API 接口,可直接替换现有工作流中的模型名称接入。
Qwen3.6-Max-Preview的关键信息和使用要求
-
产品定位:阿里通义千问下一代旗舰大模型的早期预览版,继 Qwen3.6-Plus 后的升级版本。
-
核心提升:智能体编程能力显著增强,世界知识与指令遵循表现更优。
-
性能表现:在 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench、SciCode 六项编程基准中取得最高分。
-
状态说明:目前仍为预览版,模型正在积极迭代中,后续版本将持续优化。
Qwen3.6-Max-Preview的核心优势
-
智能体编程领先:在 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench 等六项编程基准中取得最高分,代码生成与终端操作能力大幅超越前代。
-
世界知识增强:研究生级知识问答(SuperGPQA)与中文知识(QwenChineseBench)表现显著提升,知识可靠性更优。
-
指令遵循更精准:真实场景工具调用格式遵循(ToolcallFormatIFBench)能力更强,复杂任务执行更稳定。
-
竞品表现突出:多项基准超越 Claude 4.5 Opus、GLM 5.1 等主流前沿模型。
-
生态兼容性强:API 兼容 OpenAI 与 Anthropic 协议,支持
preserve_thinking功能,可无缝接入现有智能体工作流。
Qwen3.6-Max-Preview的同类竞品对比
| 对比维度 | Qwen3.6-Max-Preview | Claude 4.5 Opus | GLM 5.1 |
|---|---|---|---|
| SWE-bench Pro(工程代码) | 57.3 | 50.9 | 58.4 |
| Terminal-Bench 2.0(终端编程) | 65.4 | 59.3 | 63.5 |
| SkillsBench(智能体技能) | 55.6 | 45.3 | 53.1 |
| SciCode(科研代码) | 47.0 | 49.5 | — |
| NL2Repo(长程代码) | 42.9 | 43.2 | 42.7 |
| QwenWebBench(前端开发) | 1532 | — | 1558 |
| SuperGPQA(研究生知识) | 73.9 | 70.6 | — |
| QwenChineseBench(中文知识) | 84.0 | 69.0 | — |
| ToolcallFormatIFBench(指令遵循) | 86.1 | 84.2 | 60.1 |
| GDPval-AA(真实世界任务) | 51.0 | 48.0 | 52.0 |
Qwen3.6-Max-Preview的应用场景
-
软件开发:支持代码生成、调试、终端操作与仓库级长程编程任务,适配全栈开发流程。
-
科研计算:辅助研究型代码编写与数据分析,提升科研自动化效率。
-
前端构建:生成网页设计、Web 应用、游戏、SVG、数据可视化、动画及 3D 内容。
-
智能体自动化:模型能执行真实世界复杂任务,通过工具调用串联多步骤工作流。
-
知识问答:模型提供研究生级别专业知识解答与中文领域深度知识服务。