游乐游手机版
首页/科技数码/文章详情

大模型技术细节首次公开:核心架构与实战解析

时间:2026-02-23 13:44
2月22日,“大模型第一股”智谱发布了最新一代基础模型GLM-5的技术报告,披露了GLM-5实现性能大幅跃升的技术细节。其中,异步智能体强化学习算法作为核心创新点,引发许多技术圈人士的关注,被视作G

2月22日,被誉为“大模型第一股”的智谱正式发布了新一代基础模型GLM-5的技术报告,详细披露了该模型实现性能大幅跃升的核心技术细节。其中,异步智能体强化学习算法作为关键创新点,引发了技术圈的广泛关注。这项技术被视为GLM-5能够在真实编程场景中展现卓越表现的底层逻辑支撑。

作为一款致力于推动编程范式从“氛围编程”向“智能体工程”转型的新一代基础模型,GLM-5在编程能力与智能体能力方面表现突出。据智谱介绍,GLM-5实现性能的大幅提升主要得益于以下四大技术创新:

首先,引入了DSA稀疏注意力机制。这种全新架构显著降低了训练与推理成本。此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不损失长上下文理解和推理深度的前提下,算力开销得到大幅削减。得益于此,GLM-5将模型参数规模成功扩展至744B(7440亿),同时将训练Token规模提升至28.5T(28.5万亿)。

其次,构建了全新的异步RL基础设施。基于GLM-4.5时期slime框架“训练与推理解耦”的设计理念,智谱的新基建进一步实现了“生成与训练”的深度解耦,将GPU利用率推向极致。该系统支持模型开展大规模的智能体轨迹探索,大幅缓解了以往拖慢迭代速度的同步瓶颈,让RL(强化学习)后训练流程的效率实现了质的飞跃。

第三,提出了全新的异步Agent RL算法。该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依赖迭代自蒸馏和结果监督来训练Agent;而在GLM-5中,智谱研发的异步算法使模型能够从多样化的长周期交互中持续学习,这一算法针对动态环境下的规划与自我纠错能力进行了深度优化。

第四,全面拥抱国产算力生态。从模型发布伊始,GLM-5就原生适配了中国GPU生态,已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。

通过在OpenRouter平台上匿名发布GLM-5(代号为“Pony Alpha”),智谱不仅在技术圈引发了轰动,其在资本市场的表现也格外亮眼。股价从2月9日至今已实现翻倍,最高触及725港元/股,彰显了市场对其技术实力和未来前景的高度认可。

值得关注的是,作为一款开源模型,GLM-5的效果受到全球热捧,而此次公开披露GLM-5的技术细节,再次提振了开源社区的信心。最近,硅谷顶级风投机构a16z发布了一组数据,将智谱的开源模型GLM-5和全球闭源模型天花板之一的Claude Opus 4.6进行对比,结果显示开源大模型和顶级闭源模型之间的能力差距正在以肉眼可见的速度快速收窄。

智谱在技术报告的最后也指出,GLM-5有力回应了长期以来外界对中国本土模型技术水准的质疑,并强调开源追赶闭源的战役仍在继续,公司将坚定不移地探索技术前沿,构建更高效、更智能的底层系统。

来源:https://www.163.com/dy/article/KMEUCMSU053469RG.html
上一篇Jeep角斗士Whitecap限量版:纯白软顶与复古拉花设计 下一篇大厂AI下沉:中老年用户比年轻人更活跃
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。