首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
GLM-5.1登顶Artificial Analysis编码智能体基准开源榜首

GLM-5.1登顶Artificial Analysis编码智能体基准开源榜首

热心网友
50
转载
2026-05-16

全球AI编程助手领域的权威评测迎来重要升级。知名分析机构Artificial Analysis今日正式推出全新的Coding Agent基准体系——Artificial Analysis Coding Agent Index。这一全新评估框架旨在系统、客观地测评各类AI编程助手及其底层大模型在实际开发场景中的综合能力。评测体系全面覆盖SWE-Bench-Pro-Hard-AA、Terminal-Bench v2以及SWE-Atlas-QnA等多项业界公认的核心编程基准测试,为开发者选择高效编程工具提供了权威参考依据。

首轮评测结果正式公布,排名格局呈现显著特点。在闭源模型赛道中,Opus 4.7(基于Cursor CLI环境运行)表现卓越,以领先优势荣获全球综合评分第一。而在开源模型领域,GLM-5.1(在Claude Code环境中部署)展现出强劲实力,成功夺得开源AI编程助手排行榜首位,体现了其在代码生成、问题解决等方面的优异性能。

GLM-5.1获Artificial Analysis全新Coding Agent基准开源第一

来源:https://www.163.com/dy/article/KSONCA6V053469RG.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯云开源Agent Memory技术大幅降低61%的Token消耗
AI
腾讯云开源Agent Memory技术大幅降低61%的Token消耗

腾讯云开源了TencentDBAgentMemory分层记忆引擎,采用MIT协议。该引擎通过“上下文卸载”和“Mermaid任务画布”两项核心技术,在多任务连续会话中最高可降低61 38%的Token消耗,并将任务成功率相对提升51 52%。它解决了长周期任务中记忆跨会话断裂、事实与偏好混淆以及上下文膨胀三大痛点。项目已适配主流Agent框架,支持一键集成与

热心网友
05.15
腾讯开源Agent Memory技术 大幅降低61%的Token消耗
业界动态
腾讯开源Agent Memory技术 大幅降低61%的Token消耗

腾讯云开源AgentMemory技术,提供短期记忆压缩与长期个性化记忆能力。该技术通过上下文卸载与结构化任务图,将过程信息移至外部存储,降低长任务中的Token消耗并提升任务成功率。实验显示其最高可减少61%的Token使用,且已适配主流Agent框架,支持一键集成部署。

热心网友
05.14
蚂蚁开源LingBot-VLA真机训练代码
AI
蚂蚁开源LingBot-VLA真机训练代码

灵波科技开源具身智能模型LingBot-VLA的真机训练工具链,涵盖数据处理至部署全流程。该模型基于约两万小时真实机器人数据训练,仅需少量示教即可高效迁移任务,训练效率达主流框架1 5至2 8倍。在多项测试中,其跨本体泛化能力与任务成功率显著领先,并已完成与多家厂商的适配验证。

热心网友
05.14
阿里高德开源原生AGenUI框架A2UI详解
业界动态
阿里高德开源原生AGenUI框架A2UI详解

高德与阿里联合推出AGenUI框架,旨在解决AI文本回复向交互界面转化难题。该框架基于A2UI协议,支持iOS、Android和HarmonyOS三端原生渲染,可将AI生成的界面描述直接转化为高性能交互卡片。其核心能力包括流式实时渲染、丰富组件生态及内置设计系统,显著提升开发效率与用户体验,推动AI应用进入生成式交互时代。

热心网友
05.14
TurnSense 语音判停模型开源 47M 参数性能超越 7B
业界动态
TurnSense 语音判停模型开源 47M 参数性能超越 7B

你的语音助手又抢话了。 用户刚说“我想订那个……就是上次去过的那家……”,话还没说完,AI已经兴冲冲地回了一句“好的,请问您想订什么?” “帮我查一下那个……”——话音未落,AI拿着半句话就开始生成回复了。 更让人哭笑不得的是:用户咳嗽一声,AI开始正经回答一个不存在的问题;用户清了清嗓子,AI说“

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

iQOO 15T新机预约启动 延续Ultra系列旗舰设计风格
业界动态
iQOO 15T新机预约启动 延续Ultra系列旗舰设计风格

iQOO手机官方今日正式宣布,iQOO 15T已开启全渠道预约。随着预约启动,官方预热海报也首次揭示了新机的侧边轮廓设计。 关于这款新机的更多细节,此前已有数码博主提前剧透。据称,iQOO 15T将延续自家Ultra系列的设计语言,采用标志性的透明风格方形摄像头模组。更引人注目的是其屏幕配置——据爆

热心网友
05.16
美团外卖五折优惠直送寝室无需下楼
业界动态
美团外卖五折优惠直送寝室无需下楼

期末复习在图书馆熬到深夜,突然下起暴雨,裹紧羽绒服还得冒雨下楼拿外卖;军训结束累得只想瘫倒,宿管阿姨却把骑手拦在宿舍区外;想和室友凑单改善伙食,又被复杂的满减、助力规则搞得晕头转向……这大概是许多大学新生的共同经历,差点以为“冲刺取餐”成了宿舍生存的必备技能。其实,只要掌握正确方法,完全能省去这些奔

热心网友
05.16
三星家电退出中国市场 电视显示器等产品停售
业界动态
三星家电退出中国市场 电视显示器等产品停售

一则来自三星(中国)投资有限公司的业务调整通知,在今日引发了广泛关注。通知的核心内容相当明确:为应对急剧变化的市场环境,三星电子决定在中国大陆市场停止销售包括电视、显示器在内的所有家电产品。 这意味着,一个曾经在中国家电市场占据重要地位的品牌,其消费端的产品销售画上了句号。当然,市场更关心的是,存量

热心网友
05.16
一加16全能性能旗舰曝光 搭载骁龙8 Elite Gen6 Pro芯片
业界动态
一加16全能性能旗舰曝光 搭载骁龙8 Elite Gen6 Pro芯片

关于一加下一代旗舰手机一加 16 的最新爆料信息,近期引发了数码圈的广泛关注。知名数码博主 @数码闲聊站 最新透露了一款代号为 SM8975(即骁龙 8 Elite Gen6 Pro 平台)的子品牌新机细节,结合其暗示的表情符号,这款新机极有可能就是备受期待的一加 16。 根据最新的爆料信息,一加

热心网友
05.16
三星家电全面退出中国市场销售
业界动态
三星家电全面退出中国市场销售

三星电子的一则公告,在市场上激起了不小的波澜。根据其官方发布的消息,为应对当前急剧变化的市场环境,公司经过慎重评估,决定在中国大陆市场停止销售包括电视、显示器在内的所有家电产品。 图为三星电子发布的公告截图 这意味着,消费者未来将无法在官方渠道购买到三星品牌的电视、显示器等家用电器。不过,对于已经购

热心网友
05.16