首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
智谱GLM51正式发布 代码能力超越国际顶尖水平

智谱GLM51正式发布 代码能力超越国际顶尖水平

热心网友
79
转载
2026-05-13

2026年4月8日,智谱AI重磅推出新一代开源大语言模型GLM-5.1。此次版本迭代实现了两大核心突破:卓越的长上下文任务执行能力与顶尖的专业代码生成与修复能力。该模型能够自主规划并完成耗时长达8小时的复杂工作流,并在软件工程领域公认的高难度基准测试SWE-Bench Pro中,其代码Bug修复成功率一举超越了包括GPT-5.4、Claude Opus4.6在内的国际主流闭源模型。具体而言,GLM-5.1在单次任务中可自主执行超过1200个操作步骤,其最终产出成果经评估,相当于4名经验丰富的软件工程师协同工作一周的交付物。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

近期,一段在技术社区广泛传播的AI智能体工作实录引发了高度关注。视频显示,在全程无人为干预的情况下,一个AI模型独立完成了从环境配置、源码编译到系统部署与功能测试的完整Linux桌面环境构建,总耗时约8小时。整个过程连贯执行了1200余个步骤,未出现任务迷失或逻辑断层。这段录屏所展示的,正是全新发布的GLM-5.1模型。

纵观AI发展历程,无论是开源还是闭源模型,其能力范围通常被限制在数分钟至数十分钟的短周期、低复杂度任务中。一旦面对步骤交织、周期漫长的系统性工程,模型普遍会出现记忆丢失或推理链断裂的问题。GLM-5.1的核心升级,正是精准地攻克了这一长期存在的技术瓶颈。它实现了业界领先的**最长8小时连续自主作业能力**。在上述构建Linux桌面的实测中,模型仅用20分钟便输出了一个可运行的基础版本,而最终成品的功能完备性与稳定性,经评估相当于**4名资深后端开发工程师持续工作一周的成果**,其展现出的工程效率与自动化水平达到了前所未有的高度。

为严谨评估其专业工程能力,研发团队采用了业界权威的硬核基准——**SWE-Bench Pro**进行全面测试。该测试集涵盖了从数百个真实世界开源项目中提取的高难度代码缺陷修复任务。最终测试数据表明,GLM-5.1在Bug精准定位与有效修复的成功率上,均超越了当前公认的顶级闭源模型GPT-5.4和Claude Opus4.6,从而成为全球首个在此权威基准上取得领先地位的开源大模型。值得关注的是,其强大能力不仅限于代码范畴,在向量数据库性能调优、真实机器学习工作流下的模型自我优化等前沿方向,GLM-5.1同样展现出显著优于同类模型的巨大潜力。

长期以来,AI智能体的实际应用大多停留在简单的信息查询与日常辅助层面,一旦涉及需要深度专业知识和长链条逻辑的复杂任务,其表现往往差强人意。GLM-5.1的诞生,为行业提供了一个拥有强大专业生产力、且完全开源可深度定制的基础平台。开发者与企业无需承担高昂的预训练成本,即可基于此模型构建能够独立完成软件开发、系统运维、数据科学分析等长周期、高复杂度任务的专属智能体。这无疑为AI在未来企业级研发、运维与自动化场景中的大规模、深层次应用,铺平了道路,开启了广阔的新篇章。

来源:https://cxgn.cn/12048.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智谱GLM51正式发布 代码能力超越国际顶尖水平
业界动态
智谱GLM51正式发布 代码能力超越国际顶尖水平

2026年4月8日,智谱AI重磅推出新一代开源大语言模型GLM-5 1。此次版本迭代实现了两大核心突破:卓越的长上下文任务执行能力与顶尖的专业代码生成与修复能力。该模型能够自主规划并完成耗时长达8小时的复杂工作流,并在软件工程领域公认的高难度基准测试SWE-Bench Pro中,其代码Bug修复成功

热心网友
05.13
GLM-5.1开源模型发布 编码智能体实现数小时自主运行
业界动态
GLM-5.1开源模型发布 编码智能体实现数小时自主运行

近日,国内领先的AI技术公司Z ai正式发布了其新一代开源大模型GLM-5 1。该模型展现出一项突破性能力:其驱动的AI编程智能体能够实现长达数小时的自主连续运行,无需人工介入,并可执行数百轮自我迭代与优化。这为处理周期漫长、步骤复杂的软件开发任务,提供了全新的自动化解决方案。在全球范围内,AI编码

热心网友
05.12
国产大模型Minimax 2.7开源 编程能力媲美国际顶尖水平
业界动态
国产大模型Minimax 2.7开源 编程能力媲美国际顶尖水平

2026年4月13日,中国人工智能行业迎来里程碑事件:稀宇科技正式宣布开源其重磅产品——Minimax 2 7大语言模型。此举紧随智谱AI开源GLM-5 1之后,标志着2026年国产大模型开源进程全面提速,为全球开发者社区注入了新的活力。 相较于需商业授权、调用受限的闭源模型,开源大模型允许企业自由

热心网友
05.12
拥抱中国开源大模型 硅谷大厂被美国政府调查
科技数码
拥抱中国开源大模型 硅谷大厂被美国政府调查

“速度快、成本低”,中国开源大模型让硅谷直呼“真香” 最近科技圈有个挺有意思的现象:像Airbnb、Cursor这样的美国公司,开始悄悄转换赛道,弃用本土的大模型,转而拥抱中国的开源技术。理由很简单,就六个字:速度快、成本低。市场用脚投票,这本是再正常不过的商业选择,却意外地触动了一些人的神经。 昨

热心网友
04.30
谷歌DeepMind发布Gemma 4开源模型 最小2B可端侧运行免费商用
业界动态
谷歌DeepMind发布Gemma 4开源模型 最小2B可端侧运行免费商用

2026年4月3日:谷歌DeepMind开源迄今最强开放大模型Gemma 4系列 2026年4月3日,AI界迎来一个重磅消息:谷歌DeepMind正式开源推出了旗下迄今为止最强的开放大模型系列——Gemma 4。这个系列覆盖了4种参数规模,最小的版本仅仅2B参数,可以直接在手机端顺畅运行。最关键的是

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

截图软件推荐与好用截图工具排行榜
游戏资讯
截图软件推荐与好用截图工具排行榜

在日常工作、线上沟通或是学习过程中,截图几乎成了每个人的高频操作。面对市面上琳琅满目的截图工具,如何选择一款清晰、高效又功能趁手的软件,确实是个值得聊聊的话题。今天,我们就来盘点几款备受好评的截图应用,希望能帮你轻松应对各种截图场景。 1、截图帝:功能全面的效率助手 这款工具主打操作简便与功能实用,

热心网友
05.13
日语学习软件推荐 精选高效自学工具与资源
游戏资讯
日语学习软件推荐 精选高效自学工具与资源

对于日语学习者而言,选择合适的工具往往能让学习效果事半功倍。面对市场上琳琅满目的学习资源,一款设计科学、功能匹配的App,能够高效地帮助你从五十音图入门,逐步攻克词汇、语法乃至听说读写的各个难关。那么,目前有哪些备受好评的日语学习软件值得推荐呢?以下这几款应用,或许能成为你日语进阶之路上的得力伙伴。

热心网友
05.13
赛睿寒冰新星Pro OMNI耳机新品发布与评测
游戏资讯
赛睿寒冰新星Pro OMNI耳机新品发布与评测

近期,CGMagazine对赛睿SteelSeries推出的旗舰级游戏耳机Arctis Nova Pro OMNI进行了全面评测。这款耳机的最大亮点,无疑是其创新的OMNIplay多设备互联功能——它允许用户在多个音源设备间实现无缝切换,甚至能同步监听多个音频输入。设想一下,当你沉浸于激烈的游戏对战

热心网友
05.13
韩援选手美图鉴赏 精致Cosplay造型与身材展示
游戏资讯
韩援选手美图鉴赏 精致Cosplay造型与身材展示

探讨Cosplay的魅力,总离不开那些令人印象深刻的精彩演绎。今天为大家带来的这组作品,出自韩国知名Coser(@baby_hippo__)之手,她也被粉丝们亲切地称为“韩援大姐姐”。凭借其出众的身材条件和极具张力的形体表现,这组作品再次证明,在视觉艺术领域,完美的“身材数据”本身就是一种极具说服力

热心网友
05.13
明日方舟终末地1.2版本前瞻兑换码领取攻略
游戏资讯
明日方舟终末地1.2版本前瞻兑换码领取攻略

在《明日方舟:终末地》中,前瞻兑换码是玩家开荒阶段获取资源的重要途径,能有效加速前期发展,积累宝贵物资。不过,如何高效领取并使用这些福利,其中有一些实用技巧值得了解。 首先,关键在于信息获取。官方渠道始终是最可靠的信息来源,建议密切关注游戏官网公告、官方社交媒体账号以及游戏内的系统邮件。一旦有新的兑

热心网友
05.13