阿里发布重磅AI模型Qwen3-Max 剑指行业前三
9月24日,2025云栖大会正式开幕。会上阿里正式发布了通义千问旗舰级大模型Qwen3-Max,其综合性能表现超越GPT5和Claude Opus 4等国际竞品,成功挺进全球AI大模型第一阵营。
双版本并行 全球排名亮眼
Qwen3-Max创新性地推出"指令(Instruct)"和"推理(Thinking)"两个专项版本。目前预览版已在国际权威AI评测平台Chatbot Arena位列第三,预计正式版将带来更多性能突破。
万亿级参数的王者实力
作为通义千问系列目前最强的基座模型,Qwen3-Max展现了令人瞩目的技术实力:
- 训练数据达36万亿token量级
- 总参数量突破万亿大关
- 编程能力和智能体工具调用能力突出
在国际编程能力测试SWE-Bench Verified中,Qwen3-Max Instruct版以69.6的高分进入全球第一梯队;而在智能体工具调用测试Tau2-Bench中更是创下74.8分的记录,领先Claude Opus4和DeepSeek-V3.1等强劲对手。

推理能力获重大突破
Qwen3-Max的强化版Qwen3-Max-Thinking-Heavy在并行推理技术的加持下表现惊艳:
- 数学推理测试AIME 25和中国高中数学联赛(HMMT)双满分
- 开创业内首个100分纪录
- 首创代码求解+工具调用的解题模式
该模型的卓越表现源于两项关键技术突破:首先是在解题过程中灵活调用计算工具的能力,其次是充分利用了计算资源的扩展优势。

全栈产品矩阵正式成型
通义千问系列已完成从5亿到超万亿参数的全尺寸布局,包含300余款细分模型,覆盖各类应用场景。即日起用户可通过以下途径体验:
- QwenChat免费试用Qwen3-Max
- 阿里云百炼平台调用API服务
