6月17日,大模型领域迎来重要里程碑——新一代旗舰级开源模型GLM-5.2正式发布,海光DCU在第一时间完成了Day 0适配。这意味着国内开发者无需再忍受漫长的等待与繁琐的代码重构,即可在国产算力平台上直接体验其完整性能与强劲实力。
GLM-5.2是智谱专为Coding与长程任务打造的旗舰开源模型,代码能力目前在开源模型中位列榜首。在全球百万开发者参与的Code Arena前端盲测中,它甚至排名全球所有可用模型第一位。再看几项关键性能指标:在Terminal-Bench 2.1(AI Agent命令行操作评测)中,仅比Claude Opus 4.8低4%,较上一代GLM-5.1提升了17.5%;在MCP-Atlas(工具使用评测)上,与Opus 4.8的差距仅有0.8%。综合来看,其代码实力大致处于Opus 4.7到4.8之间,主流编程基准均保持开源SOTA水平。

本次适配最值得关注的核心亮点,在于对Solid1M(100万)无损上下文的出色支持。过去,受限于算力带宽与显存管理效率不足,长上下文在实际应用中性能常出现明显劣化。而海光DCU凭借高带宽内存访问能力以及针对长序列推理的优化指令集,成功实现了1M上下文窗口下的稳定表现——这为长程任务提供了坚实的物理基础,也让AI从“辅助对话”进化到“自主执行”层面,进一步释放了开发者的生产力。
海光DCU针对GLM-5.2的两个核心场景进行了定向优化。在长上下文推理方面,通过改进内存调度机制并引入IndexShare技术(在每四层稀疏注意力层之间复用索引器),显著降低了1M上下文下单位Token的FLOPs消耗,确保了超大规模序列处理的稳定性与效率。在代码生成方面,则对关键算子进行了专项调优,保障了复杂系统工程下的推理性能。

在实际长程任务中,海光DCU为GLM-5.2提供了持续可靠的算力支撑。模型可在平台上连续完成覆盖Web、移动端和小程序的多端应用开发,累计处理超过88万tokens。再加上IndexShare架构与海光DCU硬件特性的高度协同,双方在有限算力资源下实现了超大规模任务的处理。这不仅意味着国内开发者无需等待就能在国产平台上体验到媲美国际顶级的模型性能,更意味着核心数据与关键业务逻辑可以在完全自主可控的算力底座上安全运行。
海光信息与智谱正在持续推进GLM-5.2的深度优化,进一步释放硬件潜力。接下来,双方将围绕长程任务和代码能力展开更多场景化验证,加速推动模型在真实软件开发与系统优化中的规模化落地。
