NVIDIA发布Spectrum-XGS以太网:连接多地数据中心,重塑AI网络性能边界
面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,以更强的算力赋能AI技术的发展。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
从PERCEPTION AI到AGENTICAI,再到PHYSICAL AI……人工智能技术的飞速演进和发展,在重构企业业务模式,加速企业转型的同时,也给算力带来了巨大的挑战。目前,单GPU算力已无法满足指数级增长的计算需求,当万亿参数模型需要跨数千张GPU协同训练时,网络性能成为决定整体效率的核心瓶颈。
面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,以更强的算力赋能AI技术的发展。
跨数据中心整合的"超级计算机"模式
NVIDIA Spectrum-XGS的核心创新在于突破传统数据中心边界,通过高速以太网将多个地理位置分散的数据中心连接为一个逻辑统一的计算单元。而这一创新的技术架构模式,彻底解决了AI训练中数据分布广,算力需求动态变化的难题。
据了解,NVIDIA Spectrum-XGS提供跨地点扩展与纵向扩展和横向扩展的能力,并称AI计算“三大支柱”,能够将Spectrum-X以太网的极致性能和规模扩展至多个分布式数据中心,将它们组成具有千兆级智能的巨型AI超级工厂。
除此之外,NVIDIA Spectrum-XGS以太网完全集成于Spectrum-X平台,具有使网络能够动态适应数据中心设施间距离的算法。 据了解,凭借先进的自动调节距离拥塞控制、精准延迟管理及端到端遥测技术,NVIDIA Spectrum-XGS以太网将NVIDIA集合通信库性能提升了近一倍,加快了多GPU和多节点通信速度,使分散在不同地点的AI集群性能变得可以估测。这样就可以将多个数据中心组合成一个AI超级工厂运行,全面提升长距离连接性能。
在性能方面,NVIDIA Spectrum-XGS通过优化集体通信库(NCCL),多站点部署下的性能提升达1.9倍,显著缩短万亿参数模型训练的同步周期。
在笔者看来,NVIDIA Spectrum-XGS的优势在于,其通过高速网络将位于不同地域数据中心中的数以万计的GPU进行统一编排,构成一个超大规模的计算单元,为AI提供了强大的算力支持。同时,克服了本地建设超大规模数据中心所需要的电力成本和物理限制。据悉,NVIDIA Spectrum-XGS所采用的分层高速设计不但能够提供更高的带宽,而且还提供更加可靠灵活的扩展能力。
数据显示,AI超级高速公路现已融入机架,GPU到GPU的带宽高达每秒130TB,并通过NVLink实现全连接。
另据介绍,NVIDIA正在通过NVLinkFusion的成熟架构实现性能扩展,其中NVLink的硬件和软件传承提供了领先的扩展性能,而NVLink Fusion提供了唯一可量产的机架级、可扩展的连接结构,并在模块化组合产品方面具有全面性和灵活性。
NVFP4:引领4位训练的新前沿
除了Spectrum-XGS之外,NVIDIA还重磅宣布推出NVFP4,进一步引领4位训练的新前沿。
NVFP4以更高的效率实现了BF16级别的精度,证明4位预训练已准备好用于大规模人工智能。人工智能(AI)工厂可以使用NVFP4来加速训练和推理,从而加快开发并简化部署。
据了解,NVFP4在预训练方面的应用正通过与领先的AI组织持续合作进行积极探索。
开源创新重塑人工智能
在开源方面,NVIDIA以1000多个GitHub项目、450 多个模型和80 多个数据集推动开源发展。
据介绍,NVIDIA Dynamo 使Hopper 上的 [lama 推理速度翻倍,并且在Blackwvell 上显著提升 DeepSeek-R 的令牌吞吐量,在 Blackwell上为DeepSeek-R 实现的吞吐量提升。
除此之外,NVIDIA还积极参与到Linux、PyTorch、Python、Kubernetes、ROS、JAX等社区当中,为社区发展做出了重要的贡献。
最后,在CUDA-X中,400 多个 GPU库为大规模的人工智能、高性能计算、数据和机器人技术提供支持。据了解,NVIDIA的模型和数据集涵盖语言、视觉、多模态和机器人领域,包括Llama、NeMo、Cosmos、GROOT等。
写在最后:
面对高速发展的AI技术对算力提出的新挑战,NVIDIA凭借Spectrum-XGS以太网再次证明,真正的创新不仅在于硬件性能的提升,更在于通过系统性架构设计。Spectrum-XGS的推出,与Blackwell架构GPU、DGX SuperPOD超算系统形成端到端解决方案,不仅提供了更强的算力,而且降低了客户的集成成本。不难发现,当千兆级人工智能超级工厂成为现实,我们正见证一个新计算时代的诞生。
相关攻略
面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,
8 月 23 日消息,Hot Chips 大会将于 8 月 24~26 日举行,英伟达宣布推出 NVIDIA Spectrum-XGS Ethernet 技术,即日起作为 NVIDIA Spect
热门专题
热门推荐
OPPO A6k手机重磅发布:天玑6300处理器、高清LCD直屏、7000mAh超大电池,售价仅1999元起 OPPO旗下广受欢迎的A系列再添实力新机。近日,备受期待的OPPO A6k正式上市发售。这款新品搭载了备受好评的天玑6300八核处理器,并配备了一块容量高达7000mAh的耐用长寿电池,成为
速览 在《红色沙漠》的广阔世界中,数量丰富的支线任务与主线剧情共同构筑了沉浸式的冒险体验。其中,“熔化锁链的火焰”任务作为瑟金斯家族剧情线的关键环节,其触发机制与主线进程紧密相连。任务并非随时可用,玩家需将主线故事推进到特定阶段后,任务才会自动添加至任务日志。本篇攻略将为你详解此支线任务的接取条件与
《异种航员2》运动机制深度解析 在《异种航员2》(Xenonauts 2)的策略战斗中,对“时间单位”(TU)的高效运用是取胜的核心。每个士兵的移动、射击乃至战术配合,都依赖于玩家对TU的精确规划。操作上手简单:选中单位后,直接使用鼠标左键点击目的地方格,系统便会清晰显示移动所需消耗的时间单位,帮助
速览 在《异种航员2》(Xenonauts 2)的战局中,掌握“战术规避”与精通“火力输出”同等关键。游戏全新设计的掩体系统,是提升你作战小队生存几率的战略性核心。简言之,战场上绝大多数可见的物体都能转化为你的战术屏障。无论是散落的木箱、残缺的矮墙,还是茂密的灌木丛与坚实的建筑物,巧妙地利用它们,就
速览 在开放世界大作《红色沙漠》中,庞大的支线任务系统为玩家提供了丰富的探索体验。其中,“超凡建造物”任务是阿方索家族势力任务线中的重要一环。要成功接取此任务,玩家必须首先完成其前置任务【枪械名门】。在此之后,任务的下一步关键操作是前往游戏中标注的特定建筑地点进行互动调查——这本质上是一个用于快速移





