智谱近日正式发布并开源新一代大模型GLM-5,在编程与智能体能力领域实现重大突破。该模型在全球权威评测榜单Artificial Analysis中位列开源模型首位、全球第四,其真实场景编程体验已接近行业标杆Claude Opus 4.5,尤其在复杂系统开发与长程任务执行方面展现显著优势。

技术架构层面,GLM-5通过三项核心创新构建能力基座:参数规模从3550亿扩展至7440亿,预训练数据量增长24%至28.5TB;全新研发的异步强化学习框架支持超大规模模型训练,配合异步智能体算法实现长程交互学习;首次集成稀疏注意力机制,在保持长文本处理能力的同时降低40%部署成本。这些升级使其在SWE-bench-Verified和Terminal Bench 2.0基准测试中分别取得77.8和56.2的开源模型最高分,超越Gemini 3 Pro等竞品。
在智能体能力维度,GLM-5创下多项开源纪录:在联网信息理解、多工具任务执行和复杂场景规划测评中均获第一;模拟自动售货机经营的测试中,其账户余额达4432美元,经营策略与Claude Opus 4.5持平。这些能力使模型具备真正的自主任务处理特性,可完成目标保持、资源管理和多步骤依赖处理等复杂操作。

实际应用场景中,GLM-5已展现强大生产力价值。开发者利用该模型开发出横版解谜游戏、论文版知识分享平台等可上线应用;通用助手接入GLM-5后,可实现搜索、资讯整理、代码编写等全天候自动化服务;全新推出的编程平台支持需求拆解、多智能体协作、调试部署全流程,用户甚至可通过手机远程指挥桌面端完成工程任务。在办公领域,该模型可直接将文本素材转换为docx、pdf、xlsx等格式文件,支持生成产品需求文档、教案、财务报表等复杂文档。
值得关注的是,GLM-5的线上服务得到国产芯片集群的强力支撑。目前该模型已完成与华为昇腾、摩尔线程、寒武纪等7家国产算力平台的深度适配,通过底层算子优化实现高吞吐、低延迟运行。为应对全球需求爆发,最新同步升级服务套餐:Max用户即刻可用,Pro用户将在5日内获得支持,并推出飞书集成、Excel原生插件等专属权益。
该模型现已在Hugging Face和ModelScope平台开源,采用MIT License协议。此次发布标志着大模型技术从代码生成向工程交付的关键跃迁,其开源策略将加速智能体开发生态的构建与发展。
