壁仞科技壁砺166首日适配智谱GLM-5.2

时间：2026-06-18 13:34

壁仞科技基于壁砺166GPU，在GLM-5 2发布首日完成适配，通过自研平台与软件栈，运用专家并行调度等策略提升推理性能且精度无损。GLM-5 2在CodeArena取得最佳成绩，与海外头部模型差距仅1%-4%，支持1M无损上下文，SWE-benchPro得分62 1，采用MIT协议开源。

6月17日，智谱AI正式上线并开源了新一代旗舰级大模型GLM-5.2。值得关注的是，壁仞科技基于壁砺166系列GPU，借助vLLM推理框架，在模型发布当天即完成了首次适配与性能调优。

壁仞科技方面表示，此次Day0适配的成功实现，得益于其自主研发的SUPACODE多智能体编排平台以及BIRENSUPA软件栈的支撑。

壁仞科技宣布：壁砺166首日适配智谱GLM-5.2

在具体实施过程中，技术团队综合运用了专家并行调度、稀疏注意力算子优化等多种策略，在确保精度不受损失的前提下，显著提升了推理性能。

此外，BIRENSUPA软件栈对PyTorch、vLLM等主流AI框架实现了深度兼容，目前已支持超过500个AI模型实现“开箱即用”。

首先来看GLM-5.2的实际表现。该模型在Code Arena——一个由全球百万用户参与盲测的前端开发评估系统——中取得了当前最佳成绩，这一结果颇具说服力。

更具体的数据进一步印证了这一点。在FrontierSWE、Terminal-Bench等权威评测中，GLM-5.2与海外头部模型Claude Opus 4.8的差距已缩小至1%到4%。尤为关键的是，它是目前排名最高的开源模型。

GLM-5.2在架构设计上专门针对长程任务进行了优化，支持Solid 1M无损上下文。其在SWE-bench Pro评测中得分达到62.1。一个直观的案例是，该模型一次性完成了一个覆盖Web、移动端和小程序的完整应用开发交付，累计处理了88万tokens。

在1M上下文长度下，该模型将单位token的FLOPs降低至2.9倍。

最后，关于开源与商用方面。GLM-5.2采用MIT协议开源，模型权重已同步上线Hugging Face和ModelScope，支持自由下载、部署和商用。对应的API也已同步登陆BigModel开放平台。

壁仞科技宣布：壁砺166首日适配智谱GLM-5.2