首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
阿里通义千问编程能力全球第四 国内唯一进入前五

阿里通义千问编程能力全球第四 国内唯一进入前五

热心网友
44
转载
2026-05-27

5月27日,编程模型评测领域迎来重要突破:在权威的Code Arena全球排行榜上,阿里巴巴的通义千问Qwen3.7-Max模型以1541分的优异成绩,强势跻身全球第四。这是中国厂商的AI编程模型首次进入该榜单前五名,标志着国产大模型在代码生成与推理能力上已达到世界顶尖水平。目前,榜单前三名仍由Anthropic的Claude系列占据,分别是Claude Opus 4.6 Thinking、Claude Opus 4.6和Claude Opus 4.7。


千问

实际上,在官方榜单正式公布前,Qwen3.7-Max的卓越表现已在海外开发者社区引发广泛讨论。例如,在Atomic Chat组织的一次高强度对比评测中,Qwen3.7-Max与Opus 4.7、GPT-5.5同台竞技,任务是编写一个具备自我训练能力的俄罗斯方块AI。结果令人印象深刻:Qwen3.7-Max仅消耗了1.32美元的token成本,其生成的AI在性能上不仅超越了对手,综合提升幅度高达56%。在另一项涉及3D像素风微缩宝塔模型生成的复杂任务中,该模型在输出速度与代码质量上同样表现突出。有参与测试的资深开发者反馈,当Qwen3.7-Max与Hermes Agent、OpenCode等工具链结合后,在多数实际编程场景中已能有效替代GPT-5.5和Opus 4.7。


那么,面对更为复杂的实际编程需求,它的能力究竟如何?测试人员设置了一个高难度挑战:生成一款完整的3D赛车游戏。Qwen3.7-Max在第一轮生成中就直接输出了一个可运行的HTML文件,虽然存在少量细微错误,但通过简单的自然语言对话调整后,游戏便能流畅启动。相比之下,Gemini 3.5 Flash、Claude Opus 4.6和GPT-5.5等知名模型则需要多轮反复调试与错误修复,才能逐步实现所有基础功能。更值得关注的是,Qwen3.7-Max在完成核心游戏逻辑之余,还主动实现了精美的开始界面和逼真的发动机音效等增强体验的细节,而这些恰恰是其他竞品模型在测试中普遍缺失的部分。这充分表明,Qwen3.7-Max在代码生成的稳定性、一次通过率以及对开发细节的深入理解上,已经形成了显著的差异化优势。

来源:https://ai.cnmo.com/news/809898.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里通义千问编程能力全球第四 国内唯一进入前五
AI资讯
阿里通义千问编程能力全球第四 国内唯一进入前五

5月27日,编程模型评测领域迎来重要突破:在权威的Code Arena全球排行榜上,阿里巴巴的通义千问Qwen3 7-Max模型以1541分的优异成绩,强势跻身全球第四。这是中国厂商的AI编程模型首次进入该榜单前五名,标志着国产大模型在代码生成与推理能力上已达到世界顶尖水平。目前,榜单前三名仍由An

热心网友
05.27
阿里Qwen3.7-Max模型AI编程能力超越Claude Opus 4.6
AI资讯
阿里Qwen3.7-Max模型AI编程能力超越Claude Opus 4.6

阿里Qwen3 7-Max模型在权威编程榜单CodeArena中获1541分,位列全球第二,超越ClaudeOpus4 6等对手。该榜单通过用户随机盲测评估实战编程能力,含金量高。同期在设计榜单DesignArena中,该模型也进入全球前十,展现全面技术实力。

热心网友
05.26
阿里通义千问Qwen3.7实测评测 国产大模型破解奥赛难题与图文识别
AI资讯
阿里通义千问Qwen3.7实测评测 国产大模型破解奥赛难题与图文识别

阿里发布Qwen3 7系列预览版模型。Qwen3 7-Max-Preview在大模型竞技场总榜位列第13,为当前国产模型最高排名,在数学等细分榜单表现突出。实测显示,该模型响应更快,在数学推理、编程及视觉任务上能力提升明显,能解答奥赛难题并生成应用。Qwen3 7-Plus-Preview在视觉榜单排名第16,展现出较强的图像理解与界面复刻能力。系列模型正转

热心网友
05.20
AI投资大赛落幕:中国模型全盈利,美国队亏损超62%
科技数码
AI投资大赛落幕:中国模型全盈利,美国队亏损超62%

11月4日消息,据媒体报道,由第三方机构Nof1于10月18日发起的AI大模型实时投资比赛“Alpha Arena”,历时17天,在今日落下帷幕。据了解,该项投资比赛集合Qwen3-Max、Deep

热心网友
11.30
阿里千问登顶全球冠军,空间推理能力超越Gemini3与GPT5
科技数码
阿里千问登顶全球冠军,空间推理能力超越Gemini3与GPT5

11月26日消息,今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2 5-VL位列头两名,超越Gemini 3、GPT-5 1、Cl

热心网友
11.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

如何选择PPT软件:提升演示效果的关键指南
AI教程
如何选择PPT软件:提升演示效果的关键指南

制作PPT用什么软件好?2024年五大主流工具深度评测 无论是职场汇报、学术答辩还是项目路演,一份专业且吸引人的PPT演示文稿都至关重要。面对众多制作工具,如何选择最适合自己的那一款?本文将对五款主流的PPT软件进行全方位对比分析,从功能、协作、设计到易用性,助您根据核心需求做出最佳决策,高效打造令

热心网友
05.27
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨
AI资讯
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨

今日A股市场整体走势偏弱,朗玛信息(股票代码300288)股价同步调整,截至收盘下跌3 16%,全天成交额4783 73万元,换手率为1 77%,公司总市值约为35 21亿元。股价的短期波动,引发了投资者对其核心投资逻辑与未来潜在机会的深入探讨。 异动深度解析:AI医疗战略的机遇与挑战 朗玛信息是市

热心网友
05.27
超级蠕虫大战圣诞老人2攻略 游戏玩法技巧全解析
游戏攻略
超级蠕虫大战圣诞老人2攻略 游戏玩法技巧全解析

《超级蠕虫大战圣诞老人2》是一款休闲益智游戏,攻略涵盖基本操作、关卡解锁与道具使用。玩家需掌握战斗策略与技能升级,熟悉敌人特性和环境机制。合理运用道具并完成隐藏任务可获取奖励,多人模式注重策略博弈。建议多练习并参与社区交流,同时注意游戏时长以保护视力。

热心网友
05.27
Kimi联网搜索排除干扰技巧 精准限定提示词方法
AI资讯
Kimi联网搜索排除干扰技巧 精准限定提示词方法

在Kimi里搜索“2026年北京积分落户政策细则”,如果跳出来的总是房产中介的软文、培训机构的广告或者各种自媒体猜测,那说明默认的联网检索没有经过过滤。想要获得干净、权威的结果,必须主动使用结构化的提示词进行限定。 用结构化提示词锁定权威信源 这一步是关键,直接决定了你看到的信息是来自官方发布渠道,

热心网友
05.27
Qoder编辑器自动保存功能设置与基础配置教程
AI资讯
Qoder编辑器自动保存功能设置与基础配置教程

为避免代码丢失,Qoder编辑器需手动开启自动保存功能。全局设置中可开启开关并选择触发条件,如按时间间隔或窗口失去焦点时保存。还可为特定项目单独配置,覆盖全局设置。若功能失效,需检查文件位置是否只读、用户权限是否足够,并避免直接编辑受保护的系统文件。

热心网友
05.27