首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
网强算力破万亿模型瓶颈:新华三如何以超节点打造AI基础设施新范式

网强算力破万亿模型瓶颈:新华三如何以超节点打造AI基础设施新范式

热心网友
65
转载
2025-12-19

来源:环球网

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

摘 要:面对万亿级大模型训练与推理中日益凸显的通信墙与算力利用率难题,紫光股份旗下新华三集团推出H3C UniPoD S80000超节点产品,基于“算力×联接”技术理念,通过Scale-up架构实现GPU全互联,卡间带宽较传统8卡服务器提升8倍,单卡推理效率提升80%。该方案不仅支持液冷高密部署与多品牌GPU兼容,还针对大模型训练的长稳性需求,进行了软硬件协同调优。目前,该超节点已在多个大型智算项目中落地,并正向1024卡以上超大规模全互联演进,为AI大模型时代提供高性能、高可靠、高能效的算力底座。

关键词:新华三;超节点;AI基础设施;大模型;

案例正文:

2025年,大模型走向“技术摸高”与“工程创新”并行的新阶段,以DeepSeek为代表的高参数量MoE大模型逐渐成为业内主流。随之而来的,是市场对高性能算力需求的爆发式增长。这意味着,谁能够在大模型训推效率上跑赢对手,谁就有可能在瞬息万变的AI时代抢得市场先机。因此,如何搭建更优、更稳、更强劲的AI算力基础设施变得尤为重要,在此背景下,算力更强、通信更快、效率更高的超节点产品,成为当前算力领域最受关注的技术热点。

以网强算,超节点技术带来的大模型训推效率跃升

在经历百模大战后的商用落地阶段,各大模型厂商在实现技术落地之外的首要考量便是每Token成本。虽然目前单台服务器内已经可以基于OAM标准实现最高8卡GPU的直接互联,但更大规模的算力需求下还是要依靠跨节点的Scale-out方式进行集群组网,在动辄百卡、千卡级的大模型训推需求下,巨大的通信开销会造成算力利用率的大幅下降,大量GPU的等待和空转使得传统组网在整体训推效率表现上显得越发吃力。因此,依靠Scale-up技术实现GPU多卡全互联的超节点产品,成为破局智算效率瓶颈的最优解。

在万亿级参数量成为常态的当下,大模型训练阶段数据的传输量和传输频率激增,同时,张量并行、专家并行等训练模式以及超长序列多模态等技术场景也对GPU之间的带宽和时延提出了极高要求。基于Scale-up的节点内互联能够实现每个GPU之间的直接高速通信,相比跨节点的通信提高数倍带宽,从而大幅提升GPU利用效率,减少GPU空闲;同时,超高带宽、超低时延的互联网络,能够有效打破通信墙,大幅缩减以传统多机多卡方式布局训练的通信开销,真正实现以网强算。

另一方面,在大模型推理阶段,为了提升GPU使用效率,PD分离(Prefill-Decode分离)技术被广泛应用。然而,由于大模型逐token生成的特性,在推理Decode阶段,需要频繁访问KV Cache,对显存容量和带宽要求极高‌。而超节点支持‌计算与存储资源独立扩展,为Prefill配置高算力节点,为Decode配置大内存节点,避免资源浪费,同时‌其多卡部署、卡间高速直联的特性,能够大幅度降低推理的时延,确保KV Cache快速同步‌,天然适配PD分离场景。

兼顾性能与稳定,新华三超节点为AI提供强劲可靠的算力效能

基于在ICT领域的深厚积淀,紫光股份旗下新华三集团以“算力×联接”理念为技术依托,于近期推出了H3C UniPoD S80000超节点产品。作为面向万亿级参数模型训推场景的超节点产品,H3C UniPoD S80000以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,实现了更高性能、更高密度、更高效率的三重进化。柜内卡间全互联通信,相比传统8卡服务器组网,卡间互联带宽提升8倍,单卡推理效率提升80%。同时,H3C UniPoD S80000采用液冷高密部署,单柜可支持64卡超节点部署,并兼容下一代高性能AI加速卡。


在确保大模型训推效率的基础上,新华三超节点还深度考量了产品的稳定性和可维护性,在大模型训练进程中,任何一次中断都可能导致训练进度丢失、资源浪费甚至模型性能退化,因此,AI基础设施不仅要考虑训练性能的提升,更要确保训练连续性,避免时间与金钱的双重损耗。

对此,除了通过软硬件的协同调优来保障产品上线后的长稳训练不中断,硬件本身的稳定可靠至关重要。目前,在数百卡以上的超节点规模下,通常需要引入电+光的二层网络架构,新华三也在积极投入节点级的光互联技术研发和测试,在充分利用光技术带来的高速率、低延迟和低能耗优势的同时,尽可能降低光学器件一直以来的高故障率,为客户提供真正具备稳定性、可靠性的商用产品,保障大模型训练的长稳续航。

目前,新华三超节点产品已完成在多个大型项目的集群化部署,支持多款国内外主流GPU的兼容适配,并持续开展与上下游生态伙伴的软硬件协同开发和调优工作,积极布局1024卡及以上更大规模超节点产品的研发和落地,持续提升智算集群规模和效率。

AI技术持续进化,多元算力百花齐放,AI产业的繁荣依托基础设施的稳固与强劲。面向崭新的AI时代,新华三方面表示,将以超节点技术为全新路标,持续深化“算力×联接”技术理念,全面拥抱产业变革,不断构建性能强劲、多元开放、持续进化的算力基础设施,以技术聚合之力,加速百行百业智慧跃迁。

案例点评:

在大模型参数量激增、工程化挑战加剧的背景下,单纯堆砌算力已难以为继,系统级协同创新成为破局关键。新华三超节点以“以网强算”为核心思路,将高速互联从跨节点通信下沉至节点内全互联,有效打破通信瓶颈,显著提升GPU利用效率,体现了从“算力堆叠”向“算力质效”转型的战略前瞻性。尤为可贵的是,其在追求极致性能的同时,高度重视稳定性与可维护性,通过光互联技术预研与长稳训练保障机制,回应了产业对AI基础设施“既快又稳”的双重期待。这一实践不仅为国产智算基础设施树立了技术标杆,也为构建自主可控、高效绿色的大模型生态提供了坚实支撑。

——环球趋势案例征集组委会

来源:https://www.163.com/dy/article/KH5G7UOI0514R9OJ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

国产原生RDMA scaleFabric发布:填补大规模智算互联空白
科技数码
国产原生RDMA scaleFabric发布:填补大规模智算互联空白

3月12日,中科曙光宣布实现国产高端原生RDMA(远程直接内存访问)技术重大突破,正式发布首款全栈自研400G无损高速网络scaleFabric。该产品基于原生RDMA架构,从底层的112G Ser

热心网友
03.13
国产计算系统再突破,填补关键技术空白
科技数码
国产计算系统再突破,填补关键技术空白

来源:环球时报【环球时报报道 记者 马俊】“十五五”规划纲要草案明确提出,要“统筹推进算力设施建设、模型算法发展和高质量数据资源供给,筑牢数智化发展底座”。算力是人工智能(AI)大模型训练和运行的基

热心网友
03.13
十万卡算力集群引爆全球AI竞赛,国产IB迎来新机遇
AI
十万卡算力集群引爆全球AI竞赛,国产IB迎来新机遇

新智元报道编辑:Aeneas【新智元导读】在万卡、十万卡的训练时代,算力不再是唯一的瓶颈,网络已成全新掣肘!当AI训练进入十万卡时代,InfiniBand竟突然翻红,重新被追捧了?大模型竞赛进入万卡

热心网友
03.12
6G与AI如何协同突破?解决比速度更关键的核心难题
科技数码
6G与AI如何协同突破?解决比速度更关键的核心难题

作者:周雅如果要用一句话总结今年MWC2026给人的总体观感,那或许是,AI正在进行一场深度的“二次渗透”。它沿着两条看似独立、实则相互咬合的路径渗透——一端,是越来越贴身的个人AI,渗入手表、眼镜

热心网友
03.12
华为零中断光网络赋能全球部署,可靠性突破99.999%
科技数码
华为零中断光网络赋能全球部署,可靠性突破99.999%

IT之家 3 月 7 日消息,在 MWC26 巴塞罗那期间,华为光传送领域总裁谷云波介绍了 2025 年华为在光网络领域围绕绿色、体验、运维等方面取得的突破性进展:绿色高效网络:为欧洲、亚太、拉美、

热心网友
03.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026办公室文员三月份个人工作总结
办公文书
2026办公室文员三月份个人工作总结

办公室文员三月份个人工作总结 时间过得飞快,转眼间,三月份的工作已告一段落。为了理清思路,更好地迎接后续的挑战,是时候对这个月的工作进行一次系统的梳理和复盘了。 这个月的工作量不算特别大,但事务颇为繁杂。对于一名办公室文员来说,应对这些琐碎而多元的任务,早已是常态。 具体来看,三月份的工作主要涵盖了

热心网友
05.02
5月办公室文秘工作总结范文
办公文书
5月办公室文秘工作总结范文

5月办公室文秘工作总结范文 一名优秀的文秘应加强自身学习,提高业务水平,以踏实的工作态度,适应办公室工作特点,认真做好调研工作。《5月办公室文秘工作总结范文》是本站客服工作总结栏目为您精心准备的,更多精彩内容请收藏本站(ctrl+D即可)! 时间回溯至XX年7月,我从zz医科大学毕业,同年12月进入

热心网友
05.02
2026年办公室文书保密工作总结 4月份
办公文书
2026年办公室文书保密工作总结 4月份

2026年办公室文书保密工作总结 4月份 本站工作总结范文栏目为您提供《2026年办公室文书保密工作总结 4月份》最新范文,仅供大家参考! 一、强烈的责任意识是干好机要工作的前提 办公室机要秘书岗,听起来或许有些刻板,但实际工作内容却相当繁杂。具体来说,岗位职责涵盖了当年文件的全程管理——从登记、流

热心网友
05.02
BNB的牛市:涨势能否持续?
web3.0
BNB的牛市:涨势能否持续?

BNB价格近日突破720美元关口,无疑在投资者圈中投下了一颗石子,激起了层层讨论的涟漪。这波涨势并非空xue来风,其背后是网络技术升级与机构关注度升温的双重引擎在驱动。那么,BNB的未来轨迹究竟会如何展开?我们不妨深入剖析一下。 BNB 的强势上涨:动能是否延续? Binance Coin(BNB)

热心网友
05.02
11月办公室工作总结范文
办公文书
11月办公室工作总结范文

工作总结做得好,能为你的工作画上完美句号 一份出色的工作总结,堪称职场生涯的完美句点;反之,如果总结做得不好,或者未能准确阐述你的工作成果,很可能会掩盖你的真实能力和表现,对未来的发展造成不利影响。因此,为了写出一份高质量的工作总结,不妨多参考一些优秀的范例。下面的内容,或许能为你提供清晰的思路和实

热心网友
05.02