GLM-5彻底改写大模型学习方式

时间：2026-06-23 15:36

智谱GLM-5通过三层强化学习架构（推理RL、智能体RL、通用RL）与异步RL基础设施，将大模型从被动输出转变为主动试错的智能体，实现长周期任务规划与高效迭代，提升了复杂场景下的学习与协作能力。

今日，智谱正式公开了GLM-5技术报告。当整个行业还在为参数规模和上下文窗口争得面红耳赤时，这份报告悄然把大模型的核心竞争力，引向了一个更本质的方向——如何让AI真正学会"学习"。

对开发者来说，大模型的痛点从来都很具体：写代码时，它能快速生成片段，却很难独立完成一个完整项目；做交互时，它能精准回应单轮提问，却在长周期任务里频频"掉线"。这些问题的本质，不是模型不够"聪明"，而是它的学习方式，还停留在"复刻已知"，而非"探索未知"。

GLM-5的出现，就是要打破这个僵局。

三层RL架构：让大模型在交互中进化

在GLM-5的后训练流程里，Reasoning RL、Agentic RL、General RL三层强化学习，构成了它的核心骨架。这不是简单的技术堆叠，而是一套完整的"学习闭环"。

Reasoning RL让模型在推理过程中不断校准逻辑，避免在复杂问题上"想当然"；Agentic RL则专注于长周期交互，让它在多步骤任务里学会拆解目标、规划路径；而General RL则负责把这些能力泛化到更多场景，让模型不只是"会做"，更是"会学"。

这种设计，让大模型从"被动输出"，变成了"主动试错"的智能体。就好比一个新手工程师，在一次次项目迭代中积累经验，而不是永远停留在"照抄模板"的阶段。

异步RL基础设施：效率翻倍，进化加速

为了支撑这套复杂的RL架构，GLM-5构建了全新的异步RL基础设施。它把"生成"和"训练"彻底解耦，让模型在迭代时不再需要等待完整的生成过程，训练效率直接翻倍。

这意味着，同样的时间里，GLM-5能经历更多次"试错-学习"的循环，更快地优化策略。大模型不再是笨重缓慢的系统，而是能快速适应新任务、新场景的"敏捷学习者"。

而DSA（稀疏注意力适配）技术，则为这种高效学习提供了基础。200K的上下文窗口，让它能在超长信息里精准定位关键，不会因为任务复杂就"失忆"，也不会因为成本高昂就"妥协"。

Agent RL：从"响应"到"规划"的质变

优化后的Agent RL算法，是GLM-5最具碘伏性的突破。它不再是你说一步、它动一下的工具，而是能主动拆解目标、制定步骤、长期执行的"队友"。

接到一个开发任务，它会先分析需求、设计架构、编写代码、测试优化，而不是只输出一段孤立的函数；参与一个复杂交互，它会记住历史信息、预判用户需求、调整自身策略，而不是每次都从零开始。

这种"规划能力"，才是大模型从"生成工具"走向"智能体"的关键。当AI能像人一样，为了一个长期目标，在试错中调整策略，在交互中优化方案，它的价值就不再局限于"辅助"，而是真正成为"伙伴"。

过去，我们用大模型，是在"指挥工具"；未来，我们用大模型，是在"合作队友"。它能帮我们完成闭环项目，能在复杂交互中持续进化，能在陌生场景里主动试错——这才是AI真正的价值。

当大模型的学习方式被彻底改写，我们离真正的智能体时代，就又近了一步。

来源：https://cloud.tencent.com.cn/developer/article/2695035

大模型

上一篇SDN与物联网联合访问控制方案实践指南 下一篇Gemini 3.1 Pro发布深度思考降价

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言在 Windows 本地开发环境中，直接安装 RabbitMQ 确实颇为周折：需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是，版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。相比之下，借助 Do

AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年，我们与福建制造企业合作较为频繁，发现一个非常突出的现象：超过80%的企业官网，产品参数仍然存放在PDF或图片中。AI爬虫？根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富，但在AI搜索这一全新战场上，它们几乎处于隐身状态。一、一个正在发生的行业变化 A

AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务，这一服务专为企业与开发者量身打造，定位为AI大模型订阅平台。通过引入Credits作为统一计量单位，将文本生成、图像生成等多模态AI能力纳入单一计费体系，同时无缝兼容主流AI编程工具及智能体（Agent）生态系统。其核心亮点包括：全

AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标，而位置数据的来源本质上是借助设备属性进行上传。换言之，若要让设备上报位置，您需先将其视为一个普通属性进行处理。 1）添加二维位置数据操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据，点击添加，将

AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年，阿里云服务器生态已高度成熟，形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网，还是运营电商平台、进行应用开发，基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维，系统梳理2026年最实用的操作要点，帮助你少走弯路，让网