首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
不加GPU提升15%算力:大模型优化网络架构新趋势

不加GPU提升15%算力:大模型优化网络架构新趋势

热心网友
89
转载
2026-05-26

过去两年,整个行业的算力军备竞赛似乎只有一个标准答案:采购更多GPU,建设更大规模的集群,不断堆高算力峰值。

不加一块GPU,多榨出15%算力:大模型圈开始对网络“动刀”

然而,这条看似唯一的路径,如今正被重新审视。

近日,智谱首次公开了一项已在生产集群中得到验证的架构创新——ZCube组网架构。其中一组数据颇为引人注目:在GPU数量未增、服务器未换、甚至应用代码一行未改的情况下,集群的推理吞吐量直接提升了15%,而TTFT(首Token响应时间)的P99尾延迟则下降了40.6%。关键在于,这些数字并非实验室仿真推演的结果,而是来自真实生产流量的考验。

对于一家服务上百万开发者的大模型API平台而言,这意味着同一套硬件基础设施,每秒能够多承载15%的并发请求,流量洪峰下的排队等待时间将大幅缩短。而P99尾延迟近40%的降幅,直接关系到终端用户感知到的“卡顿感”能减少多少,体验提升立竿见影。

更让行业内部关注的,是成本结构的变化。据披露,ZCube架构所需的交换机和光模块数量,比原有方案减少了约三分之一。集群规模越大,这笔节省的绝对值就越可观。在当前推理需求持续高增长、算力供给整体偏紧的市场环境下,这种“不动硬件、只动组网”的效率挖潜,无异于对存量算力资产进行了一次极低成本的价值重估。

不是只有智谱一家在抠算力

虽然智谱此次公开的技术细节有限,但其核心逻辑已足够清晰:当集群中数千甚至数万张GPU同时处理推理请求时,每一次KV Cache的跨卡传输、每一次数据同步,都需要穿越GPU之间的互联网络。这张“路网”的效率上限,直接决定了GPU本身的真实算力能发挥出几成。ZCube的思路,正是从拓扑设计的源头重新规划这张网络,旨在从根源上消除拥塞,而非等到拥堵发生后再去疏导。

几乎在同一时间,另一件事的发生,为这个技术方向的判断增添了更重的砝码。

OpenAI联合NVIDIA、AMD、Intel、Microsoft、Broadcom五大巨头,正式发布了MRC(多路径可靠连接)网络协议。这是一套面向超大规模AI集群的开放网络协议,目前已经部署在OpenAI所有最大规模的超算集群中,包括位于德克萨斯州Abilene的Oracle超算和微软Fairwater超算,用于训练ChatGPT等前沿模型。

将这两件事放在一起观察,指向的判断是一致的:当GPU集群的规模从万卡级向十万卡级跃进时,网络早已不再是那个被动的“连接件”,而是制约整体系统效率的核心变量。

不过,它们的技术路径却截然不同。MRC侧重于在协议层优化“交通规则”;而ZCube则是在架构层重构“路网”本身,从拓扑设计上消除产生拥塞的结构性根源。一软一硬,可谓殊途同归。

如果把视野拉开,会发现“不依赖堆叠硬件,转而从基础设施和系统架构中挖掘效率”这件事,正在成为行业一个微妙的转向。

从硬件侧看,NVIDIA最新一代Blackwell Ultra架构,通过NVFP4精度格式和注意力层加速,在DeepSeek-R1推理任务上,其吞吐量达到基础版GB200的数倍。Google推出的第七代TPU Ironwood,其单芯片的训练推理性能也比前代Trillium提升了超过4倍。

从芯片创业公司看,一批专门为推理设计的非GPU架构也在加速渗透。主攻超低延迟的Groq,其LPU在Llama 2 70B模型上跑出了每秒300个token的速度,据称比H100集群快10倍。晶圆级芯片公司Cerebras则声称,其推理速度在多项测试中超越了NVIDIA Blackwell。

从模型架构本身看,通义千问的Qwen3-Next通过混合注意力机制和高稀疏MoE设计,将训练成本压缩到此前的十分之一以下,推理上下文吞吐量提升超10倍。DeepSeek推出的稀疏注意力技术,使得新版模型的长文本推理速度比前代快2到3倍,API调用成本几乎砍半。

这些探索呈现出一个共同特征:它们都不再仅仅依赖“购买更多计算卡”这一单一杠杆,而是致力于在现有算力存量和有限的新增投入中,寻找更大的产出倍数。

当“买卡”不再是唯一答案

这场从“堆硬件”向“挖效率”的转向,正在对上游供应链产生实质性影响。

最直接的变量来自网络设备端。ZCube方案实现了交换机与光模块用量减少三分之一,而MRC协议则推动两层交换机组网替代传统的三到四层架构——两者叠加,意味着AI集群的采购逻辑将发生结构性调整:对高端交换机的需求,将从追求“更多层级”转向“更少层级、更大端口密度”;同时,光模块则加速向800G及以上速率集中。

事实上,市场数据已经在验证这个趋势。据LightCounting统计,2025年800G光模块出货量同比翻倍,1.6T光模块开始出货;预计2026年800G出货量将继续翻倍,1.6T产品将从2025年的较小基数跃升至数千万端口量级。

从资本市场的视角看,AI网络基础设施正在从万卡集群的“配套工程”,升级为产业链的核心价值环节。有机构预测,2026年数据中心交换机总销售额将同比增长86%。谷歌、亚马逊、微软和Meta四大云厂商2026年合计资本支出计划高达数千亿美元。叠加MRC协议推动以太网在超算集群中加速替代InfiniBand的长期趋势,800G/1.6T光模块产业链、高密度以太网交换机及相关芯片、连接器环节,正进入一个需求结构重塑的关键窗口期。

北京计算机学会AI专委会秘书长、北京大学特聘研究员张有鱼指出,将时间轴拉长来看,智谱此次公开的ZCube实践,在行业大背景中具有两层含义。

第一层是技术层面的,它用真实生产数据验证了一个事实——在千卡乃至万卡规模的集群中,网络架构本身可以成为一个独立的效率杠杆,且边际改造成本极低。当全行业都在GPU采购上投入巨资时,这种“四两拨千斤”的效率挖潜,显然比再下一笔芯片订单更具性价比。

第二层是商业层面的,对于手握大量GPU存量的平台型公司而言,硬件折旧是固定成本,谁能从既有资产中榨取出更多的Token产出,谁就能在API价格持续下探的市场竞争中拉开成本优势。智谱实现的15%吞吐提升和三分之一的网络硬件节省,放在百万级并发请求的规模下,对应的是一笔相当可观的运营成本优化。

来源:https://www.cls.cn/detail/2378597
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Helm 开源定位解析 专注经营推进层而非协同工具
AI资讯
Helm 开源定位解析 专注经营推进层而非协同工具

Helm开源前聚焦解决企业经营中的具体痛点,如会议承诺跟进、客户流程中断等,强调“先复核,后确认”的设计理念。开源后期待外部贡献者参与真实AI场景共建,但暂不接受自动外发消息、自动审批等功能建议。

热心网友
05.26
2026年主流Coding Agent深度测评与成熟度对比
AI资讯
2026年主流Coding Agent深度测评与成熟度对比

2026年CodingAgent市场格局已定。阿里云在云原生自动化部署领先,处理复杂工程需专业工具。文心快码在企业级落地与工程可控性突出,多智能体协同与白盒流程减少幻觉,获多家头部企业部署。GitHubCopilot通用生成成熟,但对国内定制化需求适应性弱。Cursor适合独立开发者。

热心网友
05.26
AI生成前端代码如何提升开发效率与质量
AI教程
AI生成前端代码如何提升开发效率与质量

一、如何利用AI生成前端代码提升开发效率 在软件开发领域,一个备受关注的话题是如何借助人工智能技术自动生成前端代码,从而显著提升开发效率与代码质量。这不仅是技术层面的升级,更是一场深刻的工作流程变革。随着AI技术在多个行业的深度融合,其在前端开发中的应用已从早期探索步入实际生产阶段,核心价值在于大幅

热心网友
05.26
企业决策效率提升:5种数据AI优化策略方法
AI教程
企业决策效率提升:5种数据AI优化策略方法

一、数据AI与数据驱动的决策:如何利用人工智能优化企业数据分析策略 在数字化转型浪潮中,数据AI与数据驱动的决策正深刻重塑企业的决策模式。面对日益激烈的市场竞争与海量信息,借助数据AI提升决策效率、降低误判风险,已成为企业生存与发展的核心战略。本文将深入解析数据AI在金融、医疗等关键行业的实际应用价

热心网友
05.26
ST豆神子公司布局人工智能业务 2026年注册信息公布
AI资讯
ST豆神子公司布局人工智能业务 2026年注册信息公布

投资者在互动平台向上市公司提问,重点关注其旗下子公司的具体业务布局与经营范围。 公司董事会秘书对此进行了正式回复。根据官方披露的信息,该子公司全称为“豆神智算科技有限公司”,其经核准的工商经营范围明确包含人工智能应用软件研发、基础算力服务与技术解决方案提供等核心业务板块。 需要特别关注的是,这家子公

热心网友
05.26

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

企业如何高效整合多表格数据提升决策效率
AI教程
企业如何高效整合多表格数据提升决策效率

Excel多表数据整合:四种高效方法详解 在日常办公与数据分析中,我们经常需要处理分散在不同表格中的数据。销售业绩、客户资料、财务流水等信息往往各自独立,如何快速、准确地将它们合并为一份完整的视图,是提升工作效率的关键。本文将系统介绍Excel中四种实用的多表数据整合技巧,帮助您轻松应对各类数据合并

热心网友
05.26
养蚕流程图解从孵化到结茧全过程详解
AI资讯
养蚕流程图解从孵化到结茧全过程详解

ignore-error 1 " uploadprocessed= "true "> 1 养蚕全过程概述:从蚕卵到蚕茧的关键步骤 成功养殖家蚕并收获高品质蚕丝,是一个系统化、精细化的管理过程。整个流程环环相扣,涵盖了选种孵化、幼虫饲养、上蔟结茧与采收处理等多个核心阶段。其中,温度与湿度的精准控制、新鲜

热心网友
05.26
空洞骑士丝之歌全红色道具收集攻略与获取方法
游戏攻略
空洞骑士丝之歌全红色道具收集攻略与获取方法

《空洞骑士:丝之歌》中红色护符能显著改变角色能力,影响战斗与探索策略。其获取通常需完成高难度挑战或深度探索,例如击败特定敌人、破解环境谜题、完成隐藏任务或与特殊商人交换。了解这些护符的效果与获取方式,有助于玩家规划成长路线,从容应对游戏中的试炼。

热心网友
05.26
MetaGPT多智能体框架如何用自然语言编程简化开发
AI教程
MetaGPT多智能体框架如何用自然语言编程简化开发

MetaGPT产品介绍 在软件开发领域,效率与门槛一直是两个难以兼顾的痛点。MetaGPT的出现,正是为了解决这个问题。它本质上是一个基于多智能体协作框架的AI平台,目标很明确:让用户用最自然的方式——说话,来驱动复杂的软件构建过程。 那么,它具体是如何运作的?我们可以从几个核心维度来看: 多智能体

热心网友
05.26
游戏产业升级:聚焦产品创新机遇与赋能策略
游戏资讯
游戏产业升级:聚焦产品创新机遇与赋能策略

游戏产业步入高质量发展关键阶段,亟需资源整合与创意孵化平台。2026创新游戏&开发者大会以“创意无限,游启新机”为主题,将于2026年6月11日至12日在杭州举办。大会通过专场分享、项目路演等形式,连接行业从业者与创作者,加速优质创意落地,推动产业协同升级与高质量发展。

热心网友
05.26