游乐游手机版
首页/AI热点日报/热点详情

NVIDIA Mellanox InfiniBand助力百亿亿次AI超级计算架构

类型:热点整理2026-07-02
2020年11月16日,在SC20大会上,NVIDIA正式发布了下一代Mellanox 400G InfiniBand产品。可以这样理解:这是面向AI超级计算领域的一项重大突破——全球唯一能够实现完全网络加速的400G系统,直接瞄准百亿亿次计算场景。对于药物研发、气候建模、基因科学等对算力需求永无止

2020年11月16日,在SC20大会上,NVIDIA正式发布了下一代Mellanox 400G InfiniBand产品。可以这样理解:这是面向AI超级计算领域的一项重大突破——全球唯一能够实现完全网络加速的400G系统,直接瞄准百亿亿次计算场景。对于药物研发、气候建模、基因科学等对算力需求永无止境的领域来说,这次升级无疑是一次关键提速。

NVIDIA Mellanox InfiniBand护航百亿亿次AI超级计算

第七代Mellanox InfiniBand NDR 400Gb/s产品带来的不仅是带宽翻倍——数据吞吐量直接提升一倍,延迟却降至新低。更关键的是,新增的NVIDIA网络计算引擎让整个网络不仅能“传数据”,还能“算数据”,相当于把加速能力直接嵌入网络内部。简而言之,这并非简单升级,而是对网络架构的一次深度重构。

围绕这套方案,生态系统已经全面铺开。包括Atos、戴尔科技、富士通、浪潮、联想、SuperMicro在内的全球领先基础设施制造商,都计划将NDR集成到各自的企业级产品中。存储侧同样积极响应:DDN、IBM Storage等厂商已确认支持。这意味着从端到端,整个供应链都在为百亿亿次时代做好准备。

NVIDIA网络高级副总裁Gilad Shainer的表述非常直白:客户面对日益复杂的AI应用,需要更快、更智能、更具弹性的网络。而Mellanox 400G InfiniBand的海量吞吐与智能加速引擎,正好让HPC、AI和超大规模云基础设施在不增加成本和复杂性的前提下,跑出前所未有的性能表现。

具体到数字,这套方案的性能有多强悍?Mellanox NDR 400G InfiniBand交换机提供了3倍的端口密度,AI加速能力直接提升32倍。框式交换机的聚合双向吞吐量达到1.64 petabits/s,是上一代的5倍。换句话说,过去需要一大堆交换机才能承受的负载,现在几台即可轻松搞定。

生态体系广泛扩展,覆盖更多应用场景

消息发布后,全球几家顶尖科研机构率先表态。微软Azure的HPC和AI产品负责人Nidhi Chappell提到,Azure与NVIDIA的合作由来已久,从HDR InfiniBand上云到如今的NDv4 VM每个GPU分配200 Gb/s带宽、单台VM总互连带宽达1.6 Tb/s,已经证明AI超级计算可以“飞入寻常百姓家”。微软对NVIDIA在InfiniBand上的持续创新给予高度认可,并期待继续携手同行。

美国Los Alamos国家实验室下一代平台首席架构师Steve Poole说得更直接:高性能互连是百亿亿次乃至更快超算的基石,实验室一直走在HPC网络技术的最前沿,接下来将与NVIDIA密切合作,评估与分析400Gb/s技术,以满足自身多样化的应用需求。

德国Jülich超算中心主任Thomas Lippert教授则表示,在百亿亿次计算的新时代,研究人员正试图将数学建模应用于量子化学、分子动力学和民用安全等领域,而他们正在构建欧洲领先的下一代超算,Mellanox InfiniBand将成为其中不可或缺的一环。

市场调研机构Intersect360 Research的首席执行官Addison Snell分析认为,InfiniBand在创新与性能上的领先优势日益扩大,已成为HPC和AI系统中高性能服务器与存储互连的必选产品。随着应用对网络吞吐量需求的持续攀升,像NDR 400Gb/s这样的高性能方案,有望从传统HPC扩展到更多新用例和新市场。

产品规格详解与供货时间表

对于AI应用而言,卸载操作至关重要。第三代NVIDIA Mellanox SHARP技术让InfiniBand网络能够卸载并加速深度学习训练操作,AI加速能力提高32倍。再配合NVIDIA Magnum IO软件栈,开箱即用,科学计算速度直接起飞。

基于Mellanox InfiniBand架构的边缘交换机,双向总吞吐量可达51.2Tb/s,数据处理能力达到每秒665亿个数据包——这已经是里程碑式的数字。而模块化交换机的双向总吞吐量将达到1.64 petabits/s,比上一代高出5倍。

值得一提的是,Mellanox InfiniBand架构严格遵循业界标准,确保前后代产品兼容,从而保护数据中心的前期投资。这套方案预计在2021年第二季度提供样品。对于正在规划下一代超算或AI集群的团队来说,值得重点关注。

来源:https://m.elecfans.com/article/1383521.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。