6月17日,智谱AI正式上线并开源了新一代旗舰级大模型GLM-5.2。值得关注的是,壁仞科技基于壁砺166系列GPU,借助vLLM推理框架,在模型发布当天即完成了首次适配与性能调优。
壁仞科技方面表示,此次Day0适配的成功实现,得益于其自主研发的SUPACODE多智能体编排平台以及BIRENSUPA软件栈的支撑。

在具体实施过程中,技术团队综合运用了专家并行调度、稀疏注意力算子优化等多种策略,在确保精度不受损失的前提下,显著提升了推理性能。
此外,BIRENSUPA软件栈对PyTorch、vLLM等主流AI框架实现了深度兼容,目前已支持超过500个AI模型实现“开箱即用”。
首先来看GLM-5.2的实际表现。该模型在Code Arena——一个由全球百万用户参与盲测的前端开发评估系统——中取得了当前最佳成绩,这一结果颇具说服力。
更具体的数据进一步印证了这一点。在FrontierSWE、Terminal-Bench等权威评测中,GLM-5.2与海外头部模型Claude Opus 4.8的差距已缩小至1%到4%。尤为关键的是,它是目前排名最高的开源模型。
GLM-5.2在架构设计上专门针对长程任务进行了优化,支持Solid 1M无损上下文。其在SWE-bench Pro评测中得分达到62.1。一个直观的案例是,该模型一次性完成了一个覆盖Web、移动端和小程序的完整应用开发交付,累计处理了88万tokens。
在1M上下文长度下,该模型将单位token的FLOPs降低至2.9倍。
最后,关于开源与商用方面。GLM-5.2采用MIT协议开源,模型权重已同步上线Hugging Face和ModelScope,支持自由下载、部署和商用。对应的API也已同步登陆BigModel开放平台。

