2025年9月24日,在云栖大会开幕式上,阿里正式发布了旗舰级大模型Qwen3-Max,其性能表现超越GPT5和Claude Opus 4等国际顶级模型,成功跻身全球前三。该模型提供指令(Instruct)和推理(Thinking)两大版本,其预览版已在Chatbot Arena排行榜斩获第三名的佳绩,预计正式版将带来更惊艳的性能突破。
作为通义千问家族中最强大的一款基础模型,Qwen3-Max拥有36T tokens的预训练数据和万亿级参数规模。在核心技术能力上,该模型展现出卓越的编程能力和Agent工具调用水平。在SWE-Bench Verified测试中,Instruct版本以69.6的高分位居全球第一梯队;而在Tau2-Bench测试中的74.8分,更是超越了Claude Opus4和DeepSeek-V3.1等竞争对手。

大模型预训练的核心原理Scaling Law指出,持续扩展数据量和参数规模是实现AGI的重要路径之一。虽然当前有观点认为自然数据量的限制会导致Scaling Law接近上限,但Qwen3-Max的成功突破证明,通过扩大数据规模和模型参数,依然可以获得更强大的模型性能。目前通义千问系列已完成从0.5B到超万亿的全尺寸覆盖,包含300多款大模型,能满足各类应用场景的需求。
用户现可通过通义千问QwenChat免费体验Qwen3-Max的强大功能,也可选择阿里云百炼平台调用其API服务。
