五月二十六日,阿里通义千问团队研发的Qwen3.7-Max模型,在国际权威编程能力评测平台Code Arena上取得了154分的优异成绩,位列全球第四。这一里程碑式的成就,不仅超越了Claude Opus 4.6等国际知名模型,更标志着国产大模型在代码生成、逻辑推理等核心编程任务上的综合实力达到了全新高度。

Code Arena平台在AI编程领域具有重要影响力。其评测采用用户随机盲测机制,全面考察模型在代码生成、错误调试、代码优化与重构等多维度的实际能力。从最新榜单来看,前三名由Claude Opus 4.7系列模型占据,而Qwen3.7-Max则稳居第四位,表现优于Claude Opus 4.6、GLM-5.1及Kimi-K2.6等强劲竞争者。此外,在同期发布的Design Arena设计能力榜单中,该模型同样跻身前十,展现了其在多模态任务上的均衡实力。
国产大模型的突破呈现多点开花之势。几乎同期,面壁智能发布了开源的轻量级模型MiniCPM5-1B,其在十亿参数级别下性能超越所有同类小模型,体现了极高的效率优势;昆仑万维则正式推出了支持百万级上下文长度的智能体模型SkyClaw-v1.0,为长文本理解和复杂任务规划提供了新工具。这些进展共同表明,中国大模型产业正聚焦于编程能力提升与智能体应用两大关键技术赛道,持续进行深度创新,加速追赶并缩小与国际前沿水平的差距。
