AiBoss站跨市场 · 多语言 AI 工具发现站

project2026年4月21日

Qwen3.6-Max-Preview - 阿里通义推出的下一代旗舰模型

Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus，模型在智能体编程、世界知识和指令遵循三大维度实现显著提升...

Qwen3.6-Max-Preview是什么

Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus，模型在智能体编程、世界知识和指令遵循三大维度实现显著提升，在 SWE-bench Pro、Terminal-Bench 2.0、SciCode 等六项编程基准测试中取得最高分。用户可通过 Qwen Studio 在线体验，或通过阿里云百炼 API 调用。

Qwen3.6-Max-Preview的主要功能

智能体编程：在 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench 等六项编程基准中取得最高分，支持代码生成、终端操作与长程代码任务。
世界知识增强：研究生级别知识问答（SuperGPQA）与中文知识（QwenChineseBench）能力显著提升。
指令遵循优化：真实场景工具调用格式遵循（ToolcallFormatIFBench）表现更优。
思维链保留：支持 preserve_thinking 功能，可在多轮对话中保留前序思维内容，适配复杂智能体任务。
协议兼容：API 兼容 OpenAI（chat completions/responses）与 Anthropic 接口规范，便于无缝接入现有工作流。

如何使用Qwen3.6-Max-Preview

在线体验：访问 Qwen Studio，选择 Qwen3.6-Max-Preview 模型可开始交互对话。
API 调用
- 访问阿里云百炼官网，获取 API Key。
- 调用时模型名称填写 qwen3.6-max-preview。
- 支持 OpenAI 标准协议（chat completions / responses）及 Anthropic API 接口，可直接替换现有工作流中的模型名称接入。

Qwen3.6-Max-Preview的关键信息和使用要求

产品定位：阿里通义千问下一代旗舰大模型的早期预览版，继 Qwen3.6-Plus 后的升级版本。
核心提升：智能体编程能力显著增强，世界知识与指令遵循表现更优。
性能表现：在 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench、SciCode 六项编程基准中取得最高分。
状态说明：目前仍为预览版，模型正在积极迭代中，后续版本将持续优化。

Qwen3.6-Max-Preview的核心优势

智能体编程领先：在 SWE-bench Pro、Terminal-Bench 2.0、SkillsBench 等六项编程基准中取得最高分，代码生成与终端操作能力大幅超越前代。
世界知识增强：研究生级知识问答（SuperGPQA）与中文知识（QwenChineseBench）表现显著提升，知识可靠性更优。
指令遵循更精准：真实场景工具调用格式遵循（ToolcallFormatIFBench）能力更强，复杂任务执行更稳定。
竞品表现突出：多项基准超越 Claude 4.5 Opus、GLM 5.1 等主流前沿模型。
生态兼容性强：API 兼容 OpenAI 与 Anthropic 协议，支持 preserve_thinking 功能，可无缝接入现有智能体工作流。

Qwen3.6-Max-Preview的同类竞品对比

对比维度	Qwen3.6-Max-Preview	Claude 4.5 Opus	GLM 5.1
SWE-bench Pro（工程代码）	57.3	50.9	58.4
Terminal-Bench 2.0（终端编程）	65.4	59.3	63.5
SkillsBench（智能体技能）	55.6	45.3	53.1
SciCode（科研代码）	47.0	49.5	—
NL2Repo（长程代码）	42.9	43.2	42.7
QwenWebBench（前端开发）	1532	—	1558
SuperGPQA（研究生知识）	73.9	70.6	—
QwenChineseBench（中文知识）	84.0	69.0	—
ToolcallFormatIFBench（指令遵循）	86.1	84.2	60.1
GDPval-AA（真实世界任务）	51.0	48.0	52.0

Qwen3.6-Max-Preview的应用场景

软件开发：支持代码生成、调试、终端操作与仓库级长程编程任务，适配全栈开发流程。
科研计算：辅助研究型代码编写与数据分析，提升科研自动化效率。
前端构建：生成网页设计、Web 应用、游戏、SVG、数据可视化、动画及 3D 内容。
智能体自动化：模型能执行真实世界复杂任务，通过工具调用串联多步骤工作流。
知识问答：模型提供研究生级别专业知识解答与中文领域深度知识服务。