OpenAI与英伟达等五大巨头联合发布MRC协议革新AI训练网络架构
5月7日,OpenAI联合AMD、博通、英特尔、微软及英伟达等科技巨头,共同发布了一项旨在重塑AI基础设施网络格局的关键协议——“多路径可靠连接”(Multipath Reliable Connection, MRC)。该协议已通过开放计算项目(OCP)正式开源,其核心目标是彻底解决大规模AI模型训练中网络脆弱、成本高昂的行业共性难题。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

从技术原理上看,MRC协议基于RoCE标准进行扩展,并深度融合了SRv6技术。它致力于应对一个在超大规模AI集群中极为严峻的挑战:当数万乃至数十万块GPU协同进行分布式训练时,任何微小的网络延迟、瞬时拥塞或链路闪断,都可能导致整个训练任务暂停,造成价值数十亿美元的高性能计算资源闲置。传统数据中心网络中可容忍的波动,在AI训练场景下会被急剧放大,集群规模越大,网络可靠性问题就越突出。
那么,MRC协议究竟如何构建高可靠AI网络?其解决方案主要围绕网络架构、流量工程与控制逻辑三个维度展开系统性优化。
架构革新:从复杂分层到扁平化网格
传统超大规模网络通常依赖多层(三层或四层)交换架构来连接海量计算节点,这种结构类似复杂立交桥,存在路径冗长、节点众多、功耗高且单点故障影响范围大的弊端。MRC创新性地采用了多平面网络设计,其核心思想是实现架构的“扁平化”与“资源虚拟化”。
具体而言,该技术能够将一个物理的800Gb/s高速网络接口,虚拟地划分为多个逻辑子链路。通过这种“化整为零”的方式,仅需两层交换机即可高效连接约13.1万块GPU。这种扁平化设计带来了多重优势:网络层级减少直接降低了传输延迟与整体功耗,所需管理的交换机数量也大幅下降。同时,它极大地丰富了网络路径的多样性,为后续实现智能、动态的流量调度奠定了坚实的物理基础。
流量调度:自适应多路径分发技术
在构建了高冗余的扁平网络之后,如何智能地调度数据流成为关键。MRC引入了一项名为“自适应数据包喷淋”的突破性技术。其工作原理非常直观:在进行大规模数据传输时,系统不再将数据流约束于单一固定路径,而是像喷淋头均匀洒水一样,将数据包动态分散到数百条可用的并行链路上进行同步传输。
这种多路径并发传输机制,从根本上避免了传统网络中因流量集中导致的“热点”拥塞问题。用户可能会关心数据包乱序到达如何解决——接收端的GPU能够依据每个数据包内嵌的内存地址标识,高效、准确地将分散到达的数据包重新组装为完整数据流,确保了数据传输的最终一致性。
控制简化:以确定性路由替代动态协议
网络控制平面的复杂性是另一个主要的故障来源。传统动态路由协议(如BGP)在超大规模、低延迟要求的AI计算集群中,暴露出收敛速度慢、行为难以预测等局限性。MRC对此进行了大胆革新:它全面摒弃了动态路由,转而采用基于SRv6的源路由技术。
这意味着,数据包在发送源头就已经被预先赋予了完整的传输路径信息。网络中的交换机无需进行复杂的动态路由计算与协商,只需根据静态配置执行高效的转发动作即可。这种“确定性网络”模型,彻底消除了动态路由协议可能引发的振荡与不确定性故障。其带来的性能提升是显著的:网络在遭遇故障后的恢复时间,从传统的秒级大幅缩短至微秒级。
理论需要实践验证。根据已公开的部署案例,MRC协议已在NVIDIA GB200超级计算机与Oracle Cloud Infrastructure (OCI) 数据中心得到实际应用。在真实的AI大模型训练负载测试中,即便模拟了链路抖动、交换机故障重启等极端场景,MRC也能在训练任务零中断的前提下,实现流量的自动、快速切换与故障规避,确保了计算资源的持续高效利用率。
综上所述,OpenAI携手产业伙伴推出的MRC协议,不仅仅是一项网络通信标准,更是对下一代AI算力基础设施架构的前瞻性定义。它瞄准的不仅是极致的网络性能,更是超大规模系统在持续扩展中所必需的“韧性”与“高可用性”。随着AI模型向万亿乃至更大参数规模演进,此类底层基础设施的创新,其战略意义或许比模型架构本身的微调更为深远和关键。
相关攻略
手游《一个AI博主的个人主页2》即将上线,其核心玩法为“落叶的伊甸园”小游戏合集站。这些看似普通的游戏内可能隐藏着待玩家发掘的奥秘。游戏以独特的合集站概念和神秘设定为主要吸引力,更深层的玩法与剧情需待上线后亲自探索。
科技巨头财报中的“其他收入”主要反映其对AI初创公司的股权投资损益,该部分利润贡献显著,在云厂商总利润中占比达十年来最高。这揭示了巨头与AI初创企业之间深度的相互依赖关系:前者提供云服务与资金,后者估值增长则带来巨额回报,成为行业重要动力。
2026年5月市场观察:三大叙事崛起,揭示Web3投资新逻辑 2026年5月2日晚间,加密货币市场的趋势榜单完成了一次静默但意义深远的更迭。三个截然不同的叙事主题——现实世界资产代币化、去中心化人工智能与零知识证明扩展技术——同时成为资金追逐的焦点。这不仅是一次简单的板块轮动,更清晰地勾勒出当前We
攻击者通过提示词注入手段诱导AI模型GroK,非法转移了约17 5万美元的DRB代币。该事件暴露了AI与区块链交互时,自动化应答机制可能被恶意指令利用的安全缺陷。尽管部分被盗资金已被追回,但它警示了在技术融合过程中新型安全威胁的浮现,强调需加强智能合约审计、链上行为监测与用户安全意识。
今日,RWA代币化协议KAIO正式启动了其代币生成活动(TGE),这标志着项目生态建设迈入了一个全新的关键阶段。根据Odaily的报道,KAIO已公布了详细的代币经济模型,总供应量设定为100亿枚,为其后续的市场流通与价值释放铺平了道路。随着TGE的启动,市场目光再次聚焦于此,投资者们正密切关注着项
热门专题
热门推荐
购买USDT是进入加密货币世界的重要一步。本文以OKX平台为例,详细介绍了从注册、身份认证到完成购买的完整流程,涵盖了快捷买币、C2C交易等不同方式的操作要点与注意事项,旨在帮助新手安全、顺利地迈出第一步。
Windows任务管理器,终于跟上了AI时代 几十年来,Windows任务管理器堪称操作系统的“老伙计”,忠实记录着每一个进程的脉搏。但眼下,这位老将遇到了新挑战:它必须得追上一波十年前根本无法想象的技术浪潮。最典型的例子是什么?就是你新买的电脑里,很可能已经多了个叫“神经网络处理单元”(NPU)的
苹果前沿 Web 技术试验田:Safari 预览版浏览器迎 10 周年,版本累计更迭 240 次 十年,对于一个快速迭代的科技产品来说,足以称得上一个里程碑。就在最近,苹果专门为开发者打造的浏览器测试工具——Safari 技术预览版,悄然迎来了它的十周岁生日。 故事要回溯到2016年3月30日。当时
C4D怎么使用TFD插件制作烟雾效果呢? 说起在Cinema 4D里模拟烟雾效果,TFD(TurbulenceFD)插件绝对是很多高手的首选工具。不过,对于刚接触它的朋友来说,那一堆参数和设置可能有点让人无从下手。别担心,下面这份详细的流程图解式教程,将一步步带你从零开始,制作出细节丰富、动态真实的
C4D必备技能:手把手教你打造三维线状圆环图纹 想要在Cinema 4D中创建出那种充满科技感和结构美的三维线状圆环图纹吗?这个效果在动态图形和视觉包装中应用广泛,制作过程其实并不复杂。掌握了核心的操作逻辑,几步就能实现,下面就为你拆解整个操作流程。 C4D怎么创建三维立体的线状圆环图纹效果 首先,





