阿里云旗下通义团队近日宣布,其最新研发的旗舰语言模型Qwen3-Max正式上线,并首次引入"深度思考"功能模块。该技术通过强化推理链的逻辑分析与复杂问题的多步骤拆解机制,在处理高难度任务时展现出显著效率提升。
作为通义系列规模最大的语言模型,Qwen3-Max的参数量突破万亿级门槛,预训练阶段使用的数据规模达到36万亿token。这一技术突破使得模型在知识储备和语义理解层面达到全新高度,为复杂推理任务提供了更强大的底层支撑。
在专项测试中,配备"深度思考"功能的Qwen3-Max-Thinking版本表现尤为突出。通过结合工具调用与动态计算资源分配机制,该模型在AIME+25数学竞赛基准测试和HMMT(哈佛-麻省理工数学锦标赛)模拟测试中均取得满分成绩,展现出在数学推理领域的卓越能力。
据公开资料显示,阿里云于今年第三季度末正式推出Qwen3-Max基础版本。此次升级的"深度思考"模式,标志着通义团队在语言模型架构设计上取得重要进展,通过模拟人类思维过程中的分步推导机制,有效提升了模型在逻辑推理、多步骤决策等场景下的表现。
