游乐游手机版
首页/科技数码/文章详情

NVIDIA发布Spectrum-XGS以太网:连接多地数据中心,重塑AI网络性能边界

时间:2025-09-05 21:28
面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,

面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,以更强的算力赋能AI技术的发展。

从PERCEPTION AI到AGENTICAI,再到PHYSICAL AI……人工智能技术的飞速演进和发展,在重构企业业务模式,加速企业转型的同时,也给算力带来了巨大的挑战。目前,单GPU算力已无法满足指数级增长的计算需求,当万亿参数模型需要跨数千张GPU协同训练时,网络性能成为决定整体效率的核心瓶颈。

面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,以更强的算力赋能AI技术的发展。

跨数据中心整合的"超级计算机"模式

NVIDIA Spectrum-XGS的核心创新在于突破传统数据中心边界,通过高速以太网将多个地理位置分散的数据中心连接为一个逻辑统一的计算单元。而这一创新的技术架构模式,彻底解决了AI训练中数据分布广,算力需求动态变化的难题。

据了解,NVIDIA Spectrum-XGS提供跨地点扩展与纵向扩展和横向扩展的能力,并称AI计算“三大支柱”,能够将Spectrum-X以太网的极致性能和规模扩展至多个分布式数据中心,将它们组成具有千兆级智能的巨型AI超级工厂。

除此之外,NVIDIA Spectrum-XGS以太网完全集成于Spectrum-X平台,具有使网络能够动态适应数据中心设施间距离的算法。 据了解,凭借先进的自动调节距离拥塞控制、精准延迟管理及端到端遥测技术,NVIDIA Spectrum-XGS以太网将NVIDIA集合通信库性能提升了近一倍,加快了多GPU和多节点通信速度,使分散在不同地点的AI集群性能变得可以估测。这样就可以将多个数据中心组合成一个AI超级工厂运行,全面提升长距离连接性能。

在性能方面,NVIDIA Spectrum-XGS通过优化集体通信库(NCCL),多站点部署下的性能提升达1.9倍,显著缩短万亿参数模型训练的同步周期。

在笔者看来,NVIDIA Spectrum-XGS的优势在于,其通过高速网络将位于不同地域数据中心中的数以万计的GPU进行统一编排,构成一个超大规模的计算单元,为AI提供了强大的算力支持。同时,克服了本地建设超大规模数据中心所需要的电力成本和物理限制。据悉,NVIDIA Spectrum-XGS所采用的分层高速设计不但能够提供更高的带宽,而且还提供更加可靠灵活的扩展能力。

数据显示,AI超级高速公路现已融入机架,GPU到GPU的带宽高达每秒130TB,并通过NVLink实现全连接。

另据介绍,NVIDIA正在通过NVLinkFusion的成熟架构实现性能扩展,其中NVLink的硬件和软件传承提供了领先的扩展性能,而NVLink Fusion提供了唯一可量产的机架级、可扩展的连接结构,并在模块化组合产品方面具有全面性和灵活性。

NVFP4:引领4位训练的新前沿

除了Spectrum-XGS之外,NVIDIA还重磅宣布推出NVFP4,进一步引领4位训练的新前沿。

NVFP4以更高的效率实现了BF16级别的精度,证明4位预训练已准备好用于大规模人工智能。人工智能(AI)工厂可以使用NVFP4来加速训练和推理,从而加快开发并简化部署。

据了解,NVFP4在预训练方面的应用正通过与领先的AI组织持续合作进行积极探索。

开源创新重塑人工智能

在开源方面,NVIDIA以1000多个GitHub项目、450 多个模型和80 多个数据集推动开源发展。

据介绍,NVIDIA Dynamo 使Hopper 上的 [lama 推理速度翻倍,并且在Blackwvell 上显著提升 DeepSeek-R 的令牌吞吐量,在 Blackwell上为DeepSeek-R 实现的吞吐量提升。

除此之外,NVIDIA还积极参与到Linux、PyTorch、Python、Kubernetes、ROS、JAX等社区当中,为社区发展做出了重要的贡献。

最后,在CUDA-X中,400 多个 GPU库为大规模的人工智能、高性能计算、数据和机器人技术提供支持。据了解,NVIDIA的模型和数据集涵盖语言、视觉、多模态和机器人领域,包括Llama、NeMo、Cosmos、GROOT等。

写在最后:

面对高速发展的AI技术对算力提出的新挑战,NVIDIA凭借Spectrum-XGS以太网再次证明,真正的创新不仅在于硬件性能的提升,更在于通过系统性架构设计。Spectrum-XGS的推出,与Blackwell架构GPU、DGX SuperPOD超算系统形成端到端解决方案,不仅提供了更强的算力,而且降低了客户的集成成本。不难发现,当千兆级人工智能超级工厂成为现实,我们正见证一个新计算时代的诞生。


来源:https://www.51cto.com/article/823588.html
上一篇苹果开了 WWDC,股价跌了:Siri 跳票,蒸发364亿刀 下一篇得物 iOS 启动优化之 Building Closure
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5