5月23日,腾讯研究院发布了最新一期AI前沿每周关键词热度榜单。数据显示,在5月18日至22日这一周,智谱(02513.HK)提出的创新性“ZCube”组网架构,凭借其技术突破性,力压群雄,成功登顶关键词热度榜首。紧随其后的,是摩尔线程-U(688795.SH)发布的“MUSA 5.1”以及谷歌的“Gemini 3.5”模型。
此次登顶榜首的“ZCube”关键词,背后代表了一项具有实际应用价值的重大技术进展。智谱公司联合驭驯网络与清华大学研究团队,共同研发并提出了这一新型组网架构ZCube,目前已在GLM-5.1 coding模型的生产推理环境中成功部署应用。其核心技术创新在于,有效解决了当前PD分离推理架构中普遍存在的结构性网络拥塞难题,为大规模AI推理提供了更优的网络基础。
一项技术的优劣,最终需要通过实际性能数据来验证。根据公布的实测结果,ZCube架构相比业界此前广泛采用的ROFT架构,在效率与成本方面均实现了显著优化。具体性能提升数据如下:交换机与光模块相关的硬件成本降低了33%,GPU集群的平均推理吞吐量提升了15%。尤为关键的是,影响用户体验的首字延迟(TTFT)P99指标大幅降低了40.6%。这些数据表明,ZCube架构能够带来更稳定、更快速的系统响应,从而显著提升终端用户的AI使用体验。

