智谱AI发布Infra新成果 不加GPU算力提升15%
5月21日,智谱AI联合驭驯网络与清华大学宣布,其新一代高性能网络架构ZCube已在GLM-5.1线上生产集群中实现规模化部署与应用。

在GLM-5.1 coding场景的实际线上测试中,在保持原有GPU算力、软件栈及上层应用完全不变的前提下,ZCube架构显著优化了基础设施成本与性能。具体表现为:成功节省了33%的交换机与光模块采购成本,同时将GPU的平均推理吞吐量提升了15%,并将首Token延迟(TTFT)的P99分位值降低了40.6%。
这一技术突破意味着,在不增加额外GPU硬件投入的情况下,智谱GLM大模型服务的整体算力效率获得了实质性提升,每秒能够处理更多API请求。对于依赖大模型API的平台而言,此举直接转化为更高的系统并发处理能力,并确保在流量高峰期间为用户提供更稳定、更迅捷的响应体验。
相关攻略
市场共识正从“GPU主导AI”转向CPU与GPU协同。英特尔股价一年内暴涨近五倍,其数据中心业务增长显著,反映出AI竞争从训练转向应用后,CPU在任务调度中的关键作用日益凸显。部署比例从1:8向1:4甚至1:1收紧。同时,英特尔代工业务获苹果、英伟达等大客户订单,承载着美国推动芯片制造本土化的战略期望。
近日,科技行业曝光了一组英特尔即将推出的数据中心GPU新品“Crescent Island”的PCB高清谍照。这款产品是英特尔为AI推理工作负载深度定制的高性能硬件,其PCB设计的提前泄露,为我们揭示了其在架构与能效方面的核心优化方向。 从流出的正反面高清电路图可以明确观察到,该显卡采用了先进的PC
英伟达最新持仓报告显示AI投资趋势正从GPU硬件转向高效交付与价值转化环节,其投资组合涵盖算力运营、光通信及AI制药等领域,致力于构建“AI工厂”生态系统。这表明AI基础设施瓶颈已转向算力部署、网络连接与高价值应用,资本将聚焦尚未被充分定价的瓶颈资产。
近日,英特尔与微软达成重要合作,双方共同宣布,借助全新发布的至强6处理器,微软Azure Local平台的部署规模已实现从数百台到数千台服务器的跨越式增长。尤为关键的是,这一规模扩展无需对现有数据中心架构进行大规模重构,为企业提供了平滑的升级路径。 长期以来,企业部署大模型推理往往需要额外采购GPU
摩根士丹利最新发布的研究报告揭示了一个关键行业趋势:人工智能推理时代已全面到来。报告核心预测指出,到2027年,谷歌、亚马逊、Meta和微软四大科技巨头在数据中心算力基础设施上的集体扩张规模,将攀升至惊人的34吉瓦。 这一数字究竟意味着什么?我们可以通过对比来理解其庞大程度。报告指出,目前全球最大的
热门专题
热门推荐
对于《梦幻西游》的玩家来说,在69级卡级打造一个高效的任务号,门派的选择直接关系到游戏体验的流畅度与性价比。综合评估,方寸山在69级这个阶段,展现出了极强的综合实力,无论是日常刷任务还是挑战高难度玩法,都能提供稳定且出色的表现。 日常任务中的高性价比选择 如果你的核心需求是快速、高效地完成日常任务,
近期,手游《冬末守护者》的关注度不断走高,许多玩家都在询问同一个核心问题:这款游戏究竟何时才能正式上线开放游玩? 通常而言,一款手游从研发完毕到全面公测,往往会经过封闭测试、删档内测、不删档测试等多个关键阶段,最终才迎来面向全体玩家的正式公测。这个周期长短不一,确实难以给出固定答案。不过,无需焦虑,
自1996年启航的《宝可梦》系列,早已成为全球无数训练家心中不朽的冒险传奇。而《宝可梦朱紫》的推出,无疑为这片广阔的帕底亚地区注入了全新的探索活力。在众多实力强劲的宝可梦中,巨钳螳螂以其标志性的钢铁巨钳和卓越的物理攻击能力,赢得了大量玩家的深度青睐。如果你也正在筹划,如何将这只虫与钢属性的强大战士纳
对于《梦幻西游》的平民玩家而言,在化生寺与普陀山之间做出选择,常常是一个需要仔细权衡的难题。这两个辅助门派定位相近,但在实际玩法、团队作用以及资源投入上却存在显著差异。本文将从任务效率、玩家对战(PK)表现以及装备养成成本三大核心维度,为您进行一次全面的对比解析,帮助您找到最适合自己的门派。 核心结
近日,《极限竞速:地平线6》玩家社区中发生了一件引发热议的趣事。一位ID为@Starshinefallng的玩家在社交媒体上分享了自己在游戏中遭遇的“离奇”内容审核事件,让不少玩家和高达粉丝感到困惑。 据该玩家发布的游戏截图显示,他当时正试图为自己的虚拟爱车定制一块个性化车牌,输入的是《机动战士高达





