11月2日,阿里通义千问系列最新旗舰模型Qwen3-Max已在官网正式上线"深度思考"模式。这一模式通过强化推理链构建与多步骤问题拆解能力,显著提升了模型在处理复杂任务时的效率与准确性。
此前,阿里云于9月24日发布了Qwen3-Max,作为通义系列迄今为止参数规模最大、综合性能最强的语言模型,其参数量超过1万亿,预训练数据达到36T+tokens。其中,Qwen3-Max-Instruct正式版在代码生成、智能体执行、知识理解、逻辑推理、指令遵循、人类偏好对齐及多语言处理等多项核心能力上取得突破,在多项综合性基准测试中表现达到行业领先水平。
据通义团队介绍,Qwen3-Max-Thinking版本在结合外部工具并增加推理阶段计算资源的条件下,已在AIME+25、HMMT等高难度数学推理基准测试中实现100%准确率,展现出强大的深度分析与问题求解能力。
