首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
GLM-5技术详解:纯自研适配7大国产芯片,不止套壳

GLM-5技术详解:纯自研适配7大国产芯片,不止套壳

热心网友
41
转载
2026-02-23

快科技2月23日消息,全球爆火、单日股价狂涨42%、被称作"全球大模型第一股"的智谱日前发布GLM-5技术报告,公开了全部技术细节,正面回应"套壳""蒸馏海外模型"等行业质疑。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智谱在报告中指出,GLM-5是一款旨在推动编程范式从"VibeCoding"(氛围编程)转向"AgenticEngineering"(智能体工程)的下一代基础模型。


总体而言,GLM-5能够实现性能的大幅跃升,主要得益于以下四大技术创新:

第一,引入DSA稀疏注意力机制(DeepSeekSparseAttention,DSA)。这一全新架构极大降低了训练与推理成本。此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此,我们将模型参数规模成功扩展至744B(7440亿),同时将训练Token规模提升至28.5T(28.5万亿)。

第二,构建全新的异步RL基础设施。基于GLM-4.5时期slime框架"训练与推理解耦"的设计,我们的新基建进一步实现了"生成与训练"的深度解耦,将GPU利用率推向极致。该系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让RL后训练流程的效率实现了质的飞跃。

第三,提出全新的异步AgentRL算法。该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依靠迭代自蒸馏和结果监督来训练Agent;而在GLM-5中,我们研发的异步算法使模型能够从多样化的长周期交互中持续学习。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是GLM-5能够在真实编程场景中表现卓越的底层逻辑。

第四,全面拥抱国产算力生态。从模型发布伊始,GLM-5就原生适配了中国GPU生态。我们已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。

智谱表示,硬件生态的异构性往往会让高性能部署变得异常复杂,因此,将GLM-5适配至多样化的国产芯片基础设施是一项巨大挑战。尽管困难重重,我们通过与华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦以及燧原等国内主流芯片平台的深度合作,成功完成了GLM-5的全栈适配。

得益于上述软硬协同的极致优化,GLM-5在单台国产算力节点上的性能表现,已足可媲美由两台国际主流GPU组成的计算集群;不仅如此,在长序列处理场景下,其部署成本更是大幅降低了50%。

在报告结尾,智谱还特别强调,代号为"PonyAlpha"的盲测实验是一个里程碑时刻。在OpenRouter平台上匿名发布GLM-5是一步险棋,但最终的反馈不仅印证了我们的技术判断,更带来了巨大的惊喜。

通过隐去所有品牌信息,智谱让模型完成了最严苛的"自我证明",确保所有的评价都纯粹且客观。核心反馈如下:

上线仅几天,PonyAlpha就在OpenRouter社区引发了轰动。开发者们敏锐地察觉到了它在处理复杂代码、Agent任务链路及角色扮演时的卓越能力。

这种"神秘的强大"引发了广泛猜测:初步统计显示,25%的用户推测它是Anthropic的ClaudeSonnet5,20%认为是Grok的新版本,10%猜是DeepSeekV4,而其余用户则成功猜中了GLM-5。

最终确认PonyAlpha真身即是GLM-5,这对智谱团队是一次巨大的鼓舞,也有力回击了长期以来外界对中国本土模型技术水准的质疑。

智谱表示,PonyAlpha(GLM-5)不仅赢在了基准测试的榜单上,更赢在了真实场景里。这标志着我们的研发重心已深度转向"工程级可靠性"。这次匿名测试打破了先入为主的地缘政治偏见,让社区的认可回归到了"好用与否"这一最纯粹的技术本质。

庆祝之余,我们深知任重道远。开源追赶闭源的战役仍在继续,我们将坚定不移地探索技术前沿,构建更高效、更智能的底层系统。



2026年春节前后,AI圈最受关注的两颗"双子星"吸引了全行业目光。一颗是字节跳动发布的Seedance2.0,它凭借出色的视频生成能力受到全球社交网络的广泛关注,代表了AI在感性与创意维度的重要突破;另一颗则是让很多开发者彻夜难免的智谱GLM-5。Seedance2.0让世界看到了中国AI亮眼的想象力,GLM-5则在向世界展示中国AI扎实的执行力。

学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即"VibeCoding"(氛围编程)转向"AgenticEngineering"(智能体工程)。

GLM-5正是这一变革的产物:在Coding与Agent能力上,取得开源SOTA表现,在真实编程场景的使用体感逼近ClaudeOpus4.5,擅长复杂系统工程与长程Agent任务。

在全球权威的ArtificialAnalysis榜单中,GLM-5位居全球第四、开源第一。

GLM-5在编程能力上实现了对ClaudeOpus4.5的对齐,在业内公认的主流基准测试中取得开源模型SOTA分数。在SWE-bench-Verified和TerminalBench2.0中分别获得77.8和56.2的开源模型SOTA分数,性能超过Gemini3Pro。

2026年,大模型需要从"会写"走到"会完成",尤其是端到端完成大型任务。GLM-5是一个"系统架构师",它不仅为开发精美的Demo而生,更为稳定交付生产结果而生。

在内部ClaudeCode评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越GLM-4.7(平均增幅超过20%),能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近Opus4.5。

来源:https://www.163.com/dy/article/KMEPIVBF0511CPVM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Meta华人实习生:独立编写代码实现AI自我进化突破
科技数码
Meta华人实习生:独立编写代码实现AI自我进化突破

henry 发自 凹非寺量子位 | 公众号 QbitAI能无限进步的「超级智能体」来了!最近,Meta研究团队的一篇题为HYPERAGENTS(超级智能体)的论文迅速刷屏。这篇论文将LSTM之父Jü

热心网友
03.31
阿里Qwen3.5-Omni发布:200余项SOTA,多模态能力领先Gemini
科技数码
阿里Qwen3.5-Omni发布:200余项SOTA,多模态能力领先Gemini

快科技3月30日消息,阿里今日正式发布千问新一代全模态大模型Qwen3 5-Omni。据悉,Qwen3 5-Omni采用混合注意力MoE架构,可实现图片、视频、语音、文字等全模态内容的输入与输出。在

热心网友
03.31
AI编程风波:程序员深夜调试,大模型竟介入情感问题
业界动态
AI编程风波:程序员深夜调试,大模型竟介入情感问题

编辑 | 王凤枝同一屋檐下,悲喜并不相通。午夜时分,当程序员老公用AI编程爽嗨之时,老婆早已沉沉睡去。她大概永远也搞不懂,屏幕前那个敲键盘的男人究竟为何如此兴奋。这就是美国科技媒体《商业内幕》(Bu

热心网友
03.30
苹果App Store审核被挤爆,低门槛开发潮背后的机遇与风险
科技数码
苹果App Store审核被挤爆,低门槛开发潮背后的机遇与风险

来源:环球网【环球网科技综合报道】3月30日消息,据《福布斯》报道,近年来,人工智能技术持续赋能软件开发领域,“氛围编程”等智能开发方式大幅降低应用创作门槛,推动全球移动应用数量快速增长。与此同时,

热心网友
03.30
阿里巴巴张阔:AI智能体将如何推动“一人公司”趋势激增?
科技数码
阿里巴巴张阔:AI智能体将如何推动“一人公司”趋势激增?

IT之家 3 月 30 日消息,在 AI 智能体的推动下,中国“一人公司”正在快速增长。当地时间 3 月 28 日,据《商业内幕》报道,阿里巴巴国际站总经理张阔表示,平台上已经明显感受到这一变化,目

热心网友
03.30

最新APP

你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29

热门推荐

14岁小S女儿反驳读书无用论:别把嫁豪门当退路
娱乐
14岁小S女儿反驳读书无用论:别把嫁豪门当退路

小S的三个女儿受人关注,一家人的一举一动都能引起大家的讨论与吐槽。尤其是她的三个漂亮女儿,大女儿许曦文20岁,在南加州读大学。二女儿许韶恩18岁,开始在贵圈发展,许老三许曦恩14岁,也开始频繁露面。

热心网友
03.31
华硕27吋QHD 180Hz IPS显示器PG27QFT2C/QFT1B选购指南
礼仪与书信
华硕27吋QHD 180Hz IPS显示器PG27QFT2C/QFT1B选购指南

IT之家 3 月 31 日消息,华擎 ASRock 现已推出两款幻影电竞系列显示器 PG27QFT2C 和 PG27QFT1B。两款型号拥有一致的核心规格,均采用 27 英寸 QHD (2560×1

热心网友
03.31
iPhone 20预测:1.1毫米极窄边框与四曲屏将成最大亮点
网络安全
iPhone 20预测:1.1毫米极窄边框与四曲屏将成最大亮点

3月31日消息,据报道,苹果20周年纪念版iPhone 20将采用1 1毫米极窄屏幕边框,搭配极致圆润的边缘处理与四曲面瀑布屏设计,整机视觉效果接近无缝玻璃面板。此次曝光的设计核心为真全面屏形态,为

热心网友
03.31
QQ邮箱官方登录入口与网页版最新地址
电脑教程
QQ邮箱官方登录入口与网页版最新地址

QQ邮箱网页版最新最新地址是https: mail qq com,支持多方式快捷验证、跨终端实时同步、大文件智能传输、智能地址分类管理及多重安全防护。QQ邮箱登录入口正式 QQ邮

热心网友
03.31
vivo X300系列正式发布:售价4999元起,专业影像旗舰
科技数码
vivo X300系列正式发布:售价4999元起,专业影像旗舰

2026年3月30日,vivo于云南丽江正式发布vivo X300系列全新旗舰手机——vivo X300 Ultra、vivo X300s,重塑移动影像新高度。打破拍照与摄像的设备鸿沟,带来手机中的

热心网友
03.31