GLM-5.1登顶Artificial Analysis编码智能体基准开源榜首
全球AI编程助手领域的权威评测迎来重要升级。知名分析机构Artificial Analysis今日正式推出全新的Coding Agent基准体系——Artificial Analysis Coding Agent Index。这一全新评估框架旨在系统、客观地测评各类AI编程助手及其底层大模型在实际开发场景中的综合能力。评测体系全面覆盖SWE-Bench-Pro-Hard-AA、Terminal-Bench v2以及SWE-Atlas-QnA等多项业界公认的核心编程基准测试,为开发者选择高效编程工具提供了权威参考依据。
首轮评测结果正式公布,排名格局呈现显著特点。在闭源模型赛道中,Opus 4.7(基于Cursor CLI环境运行)表现卓越,以领先优势荣获全球综合评分第一。而在开源模型领域,GLM-5.1(在Claude Code环境中部署)展现出强劲实力,成功夺得开源AI编程助手排行榜首位,体现了其在代码生成、问题解决等方面的优异性能。

相关攻略
腾讯云开源了TencentDBAgentMemory分层记忆引擎,采用MIT协议。该引擎通过“上下文卸载”和“Mermaid任务画布”两项核心技术,在多任务连续会话中最高可降低61 38%的Token消耗,并将任务成功率相对提升51 52%。它解决了长周期任务中记忆跨会话断裂、事实与偏好混淆以及上下文膨胀三大痛点。项目已适配主流Agent框架,支持一键集成与
腾讯云开源AgentMemory技术,提供短期记忆压缩与长期个性化记忆能力。该技术通过上下文卸载与结构化任务图,将过程信息移至外部存储,降低长任务中的Token消耗并提升任务成功率。实验显示其最高可减少61%的Token使用,且已适配主流Agent框架,支持一键集成部署。
灵波科技开源具身智能模型LingBot-VLA的真机训练工具链,涵盖数据处理至部署全流程。该模型基于约两万小时真实机器人数据训练,仅需少量示教即可高效迁移任务,训练效率达主流框架1 5至2 8倍。在多项测试中,其跨本体泛化能力与任务成功率显著领先,并已完成与多家厂商的适配验证。
高德与阿里联合推出AGenUI框架,旨在解决AI文本回复向交互界面转化难题。该框架基于A2UI协议,支持iOS、Android和HarmonyOS三端原生渲染,可将AI生成的界面描述直接转化为高性能交互卡片。其核心能力包括流式实时渲染、丰富组件生态及内置设计系统,显著提升开发效率与用户体验,推动AI应用进入生成式交互时代。
你的语音助手又抢话了。 用户刚说“我想订那个……就是上次去过的那家……”,话还没说完,AI已经兴冲冲地回了一句“好的,请问您想订什么?” “帮我查一下那个……”——话音未落,AI拿着半句话就开始生成回复了。 更让人哭笑不得的是:用户咳嗽一声,AI开始正经回答一个不存在的问题;用户清了清嗓子,AI说“
热门专题
热门推荐
iQOO手机官方今日正式宣布,iQOO 15T已开启全渠道预约。随着预约启动,官方预热海报也首次揭示了新机的侧边轮廓设计。 关于这款新机的更多细节,此前已有数码博主提前剧透。据称,iQOO 15T将延续自家Ultra系列的设计语言,采用标志性的透明风格方形摄像头模组。更引人注目的是其屏幕配置——据爆
期末复习在图书馆熬到深夜,突然下起暴雨,裹紧羽绒服还得冒雨下楼拿外卖;军训结束累得只想瘫倒,宿管阿姨却把骑手拦在宿舍区外;想和室友凑单改善伙食,又被复杂的满减、助力规则搞得晕头转向……这大概是许多大学新生的共同经历,差点以为“冲刺取餐”成了宿舍生存的必备技能。其实,只要掌握正确方法,完全能省去这些奔
一则来自三星(中国)投资有限公司的业务调整通知,在今日引发了广泛关注。通知的核心内容相当明确:为应对急剧变化的市场环境,三星电子决定在中国大陆市场停止销售包括电视、显示器在内的所有家电产品。 这意味着,一个曾经在中国家电市场占据重要地位的品牌,其消费端的产品销售画上了句号。当然,市场更关心的是,存量
关于一加下一代旗舰手机一加 16 的最新爆料信息,近期引发了数码圈的广泛关注。知名数码博主 @数码闲聊站 最新透露了一款代号为 SM8975(即骁龙 8 Elite Gen6 Pro 平台)的子品牌新机细节,结合其暗示的表情符号,这款新机极有可能就是备受期待的一加 16。 根据最新的爆料信息,一加
三星电子的一则公告,在市场上激起了不小的波澜。根据其官方发布的消息,为应对当前急剧变化的市场环境,公司经过慎重评估,决定在中国大陆市场停止销售包括电视、显示器在内的所有家电产品。 图为三星电子发布的公告截图 这意味着,消费者未来将无法在官方渠道购买到三星品牌的电视、显示器等家用电器。不过,对于已经购





