project
Qwen3.5-Max-Preview - 阿里通义推出的新一代旗舰模型
Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版。模型在LMArena评测平台以1464分跻身全球前五、国内第一,在基础能力评测中排名全球第六。
Qwen3.5-Max-Preview是什么
Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版。模型在LMArena评测平台以1464分跻身全球前五、国内第一,在基础能力评测中排名全球第六。相比前代,模型在创意写作、数学推理、文本理解等能力上提升显著,数学能力进入全球前五。模型大概率仍为闭源旗舰产品,延续Qwen3.5系列的技术路线,标志着阿里在大模型竞赛中持续保持头部竞争力。
Qwen3.5-Max-Preview的主要功能
-
数学推理:数学能力进入全球前五,相比前代提升49分,可处理复杂数学计算与逻辑推导任务。
-
创意写作:创意写作能力提升57分,能生成高质量的文学、营销及创意文案内容。
-
文本理解:整体文本理解能力提升45分,可精准把握长文本语义与上下文关联。
-
专家级文本处理:在Arena Expert榜单位列前十,胜任专业领域的深度文本分析与生成。
-
编程能力:在Coding评测中表现优异,支持代码生成、调试及技术文档撰写。
-
长文本处理:支持Longer Query任务,可处理超长上下文窗口的复杂查询。
-
指令遵循:Instruction Following能力显著增强,能准确理解并执行用户复杂指令。
-
多轮对话:Multi-Turn能力支持流畅的多轮交互,保持上下文连贯性。
Qwen3.5-Max-Preview的关键信息和使用要求
-
发布时间:2026年3月20日
-
模型定位:阿里通义千问最新旗舰预览版,是核心技术人员林俊旸离职后阿里推出的首个原创大模型
-
评测成绩:在LMArena平台获得1464分,使阿里千问跻身全球大模型实验室前五、国内第一;在基础能力评测(without style control)中获得1470分,排名全球第六、国内第一
-
架构推测:可能采用MoE(混合专家)架构,参考同系列Qwen3.5-Plus的3970亿总参数、170亿激活参数设计
-
当前状态:该模型目前处于预览阶段(Preview),正式版本尚未发布
Qwen3.5-Max-Preview的核心优势
-
国内领先:LMArena评测国内第一,使阿里千问跻身全球大模型实验室前五。
-
能力跃升:创意写作提升57分、数学推理提升49分、整体文本能力提升45分,多维度全面增强。
-
数学突出:数学能力进入全球前五,复杂逻辑推导与计算能力显著。
-
专家级表现:Arena Expert榜单位列前十,超越GPT-5.2、Claude Sonnet 4.5等主流模型。
-
均衡全能:在编程、长文本处理、指令遵循、多轮对话等十余个细分场景均表现优异。
如何使用Qwen3.5-Max-Preview
模型目前处于预览阶段(Preview),尚未公布具体使用渠道。
Qwen3.5-Max-Preview的同类竞品对比
| 对比维度 | Qwen3.5-Max-Preview | Claude Opus 4.6 | GPT-5.4 High | Gemini 3.1 Pro |
|---|---|---|---|---|
| LMArena总分 | 1464分(全球第5) | 1502分(第1) | 1486分(第4) | 1494分(第2) |
| 基础能力排名 | 1470分(全球第6) | 1499分(第1) | 1476分(第5) | 1489分(第3) |
| Arena Expert排名 | 1498分(第10) | 1506分(第6) | 1508分(第5) | 1501分(第8) |
| 数学能力 | 全球前5 | 领先 | 领先 | 领先 |
| 创意写作提升 | +57分(较前代) | – | – | – |
| 模型性质 | 闭源预览版 | 闭源 | 闭源 | 闭源 |
| 所属实验室 | 阿里千问 | Anthropic | OpenAI |
Qwen3.5-Max-Preview的应用场景
-
创意写作:模型可生成高质量的文学、营销及创意文案内容,该能力较前代提升57分。
-
数学推理:模型能处理复杂数学计算与逻辑推导任务,数学能力已进入全球前五。
-
编程开发:支持代码自动生成、程序调试优化及技术文档撰写工作。
-
医疗健康:适用医学文献深度分析、辅助诊断建议及专业健康咨询服务。
-
法律政务:模型可完成合同条款审查、法规政策解读及政府事务文书处理。