首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
阿里千问3.7编程能力全球第二,仅次于Claude

阿里千问3.7编程能力全球第二,仅次于Claude

热心网友
30
转载
2026-05-26

5月26日凌晨,全球最具公信力的第三方编程能力评测平台Code Arena公布了最新榜单。阿里云最新发布的旗舰大模型Qwen3.7-Max以1541分的优异成绩,一举超越了GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等众多强劲对手,在全球大模型厂商中排名第二,仅次于Claude系列。这一里程碑式的成绩,标志着阿里千问3.7在代码生成与理解这一核心领域,已稳居全球顶尖水平。

编程权威榜单:千问3.7仅次于Claude,阿里全球第二

图说:Code Arena最新榜单显示,阿里凭借Qwen3.7-Max位列全球第二

当前,编程能力已成为评估大模型智能水平的关键指标。Code Arena榜单由知名的大模型盲测平台LMArena推出,是全球公认最具影响力的实战评测之一。其评测机制与传统代码测试截然不同:它不考核孤立的算法题,而是采用更贴近真实开发的“硬核”模式——由开发者出题,要求模型从零开始构建一个完整、可交互的Web应用程序。随后,所有匿名模型生成的作品将进行两两对决,由全球开发者根据实际使用体验进行投票,最终综合得出排名。这种“实战盲测”相结合的模式,使其被广泛视为检验AI编程能力的终极试金石。

那么,千问3.7在此次实战中的具体表现如何?经过全球开发者的匿名投票,其编程能力成功进入榜单前四。这一突破意义重大,因为它打破了此前长期由Claude-Opus-4.7和4.6主导的前四名格局。尤为值得关注的是,Qwen3.7-Max是目前榜单上唯一一个突破1540分门槛的国产大模型,这无疑是中国AI技术发展的一个重要里程碑。

此次能力突破,根植于模型本身的技术进化。专为智能体(Agent)场景深度优化的Qwen3.7-Max,在代码编程、智能体协作与复杂长程任务处理等核心维度实现了显著跃升。其能力已远超编写代码片段,能够独立完成端到端的复杂项目开发。测试表明,它能在数小时内交付一个通常需要专业开发团队耗时两周才能完成的项目,这为办公自动化与企业级生产力提升带来了巨大想象空间。更令人印象深刻的是,该模型能够持续运行超过35小时,累计进行超1000次工具调用,完成如自我编程优化芯片内核等极端复杂的长程任务,展现了卓越的任务持久性与规划能力。

Qwen3.7-Max发布后,迅速在全球开发者社区与行业内部引发热烈反响。众多独立开发者、AI创作者及企业用户第一时间在社交平台分享了测评体验。许多开发者评价其“长程自主执行能力惊人”,堪称“真正能独立完成全流程任务的智能体基座模型”。有AI研究机构在相同提示词下,对Qwen3.7-Max、Claude-4.7和GPT-5.5进行了横向对比,结果显示千问3.7相比其前代模型性能提升幅度最大,同时在推理成本上更具优势。在代码生成速度与输出质量这两个关键指标上,相较于其他主流模型也展现出强劲的竞争力。

来源:https://www.qbitai.com/2026/05/425150.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

索拉纳现货与合约交易指南:如何选择适合你的投资策略
web3.0
索拉纳现货与合约交易指南:如何选择适合你的投资策略

现货交易直接买卖资产,适合长期持有与新手。合约交易采用杠杆,支持做多做空,收益与风险极高。投资者应根据自身风险承受能力与投资目标,谨慎评估并选择适合的交易方式。

热心网友
05.26
中国占全球人形机器人九成出货量或成下个电动车产业
业界动态
中国占全球人形机器人九成出货量或成下个电动车产业

摩根士丹利报告指出,中国在人形机器人领域已处全球领先地位,预计2025年全球出货量的约90%将来自中国。该产业正处爆发前夜,有望成为驱动中国制造与出口增长的新引擎。凭借规模化制造与供应链优势,中国正推动机器人在仓储、巡检等服务场景落地,预计2030年运行规模将达26万台,开启生产力新。

热心网友
05.26
荣耀600系列京东现货发售 心动购物季抢先下单优先发货
业界动态
荣耀600系列京东现货发售 心动购物季抢先下单优先发货

荣耀600系列于5月25日发布,含元气版、超级版及Pro三款机型,起售价自2294 15元至3399元。新机采用全新“幸运星”设计及3D星河工艺,搭载不同旗舰处理器,全系配备2亿像素主摄与专业防抖,Pro版支持全焦段4KLive直出。京东平台已开启预售,参与“先人一步”计划可享优先发货及多重优惠。

热心网友
05.26
2026年中高端电视选购指南 三星退市后实测推荐
业界动态
2026年中高端电视选购指南 三星退市后实测推荐

三星逐步退出中国市场后,消费者面临重新选择。当前中高端电视市场以MiniLED和大屏为主流。东芝Z7PRO凭借RGBMiniLED和火箭炮音质,提供卓越影音体验;R700则侧重高刷与游戏优化,适合影游用户。飞利浦9599的流光溢彩功能增强沉浸感,长虹85Q10K以智能交互和实用性见长。建议根据自身核心需求选择最合适的产品。

热心网友
05.26
百元价位动态血糖仪哪款性价比最高
业界动态
百元价位动态血糖仪哪款性价比最高

动态血糖仪进入百元市场,挑选需综合考量技术参数。精准度核心指标MARD值普遍低于10%,国产品牌表现优异。数据采样频率存在分钟级差异,高频监测能更细腻捕捉血糖波动。部分产品采用先进酶技术提升抗干扰能力。佩戴舒适性、操作简便性及监测时长也影响长期体验,需根据个人控糖需求权衡。

热心网友
05.26