AI基础设施的下一个决胜点:算力之外,连接为王
随着大模型从训练阶段迈向推理与商业化应用,AI基础设施的竞争格局正在悄然重塑。近日,光互连巨头Marvell首席执行官墨菲与英伟达创始人黄仁勋在一次公开对谈中,共同指向了一个关键趋势:未来AI的核心瓶颈不再是算力或内存,而是“连接”。这一判断正在成为行业共识,并深刻影响着数据中心架构、光通信产业链以及芯片封装技术的演进方向。
黄仁勋的“铜光法则”:场景决定连接方案
在对话中,黄仁勋直言:随着AI生成式Token进入盈利阶段,分布式“智能体”计算正在引爆对高速互联的巨大需求。他指出,连接方案的选择应当遵循一个简洁而实用的策略框架——“能用铜缆的地方就用铜缆,必须用光学器件的地方才用光学器件”。这句话背后蕴含的核心逻辑是:技术先进与否并非唯一标准,关键在于场景匹配度与成本效益。
具体而言,铜缆在短距离、低功耗、低成本场景中仍具有显著优势,例如机柜内部、同一机架内的芯片互联。而光互联则适用于更长距离、更高带宽、更低延迟的跨机柜、跨数据中心连接。黄仁勋强调,AI基础设施的演进不是要全面替代铜缆,而是在正确的节点引入光学方案,以实现系统级最优性能。
铜缆边界正在收窄:机架内外的分水岭
Marvell CEO墨菲则从物理法则角度提供了另一层洞察。他指出,“铜缆边界”正在向机架内部进一步收窄。这意味着,随着数据传输速率突破100G per lane甚至更高,铜缆在机柜间甚至机柜内部分场景中的实际传输距离受到严重限制。因此,光互联及共封装光学(CPO)技术即将迎来爆发节点。
墨菲的判断并非空谈。大会当天,Marvell正式发布了一款专为AI数据中心设计的100T以太网交换机,号称具备行业最低功耗。同时,其基于CPO技术的51.2T交换机已经在板级层面彻底消除了铜质连接——这不仅是技术突破,更是产业风向标。两位CEO的观点相互印证,指向同一个结论:未来的AI,拼的不再只是算力,而是连接。
连接技术演进:铜缆、光缆与CPO的协同
从产业视角看,连接技术正在经历一场“分层革命”。不同层级的互联需求对应不同解决方案,需要系统级优化而非单一技术替代。
- 芯片级互联(Die-to-Die):通常采用先进封装或硅桥技术,依赖铜互连,线距已从微米级迈向纳米级。
- 机架内部(Rack-Level):高速铜缆(如DAC、ACC)目前仍占据主流,但速率提升至112Gbps时,铜缆的有效传输距离已压缩至2-3米以内。
- 跨机柜与数据中心内部:光模块与光纤方案成为标配,且随着CPO技术成熟,光引擎被直接封装在交换机芯片附近,大幅降低功耗与延迟。
- 跨数据中心互联:长距离相干光传输是唯一选择,但需兼顾成本与频谱效率。
这种分层架构意味着,AI基础设施的设计者必须同时掌握铜缆与光互联的边界条件,并根据实际业务场景做出取舍。黄仁勋的“铜光法则”正是这一复杂工程问题的简洁表达。
数据佐证:连接瓶颈如何影响AI效能
据行业研究机构统计,在千卡级GPU集群中,网络通信开销(包括数据搬移与同步)已占整体训练时间的30%-50%。而在推理阶段,随着多智能体协同、实时反馈等场景增多,延迟敏感型应用对互联性能的要求更高。以当前主流的800G光模块为例,其单通道速率已达100G,但数据中心内部光互联的功耗仍占整体基础设施能耗的10%-15%。降低连接功耗、提升带宽密度已成为AI基础设施升级的关键驱动力。
Marvell的100T交换机与CPO样品正是应对这一挑战的典型产物。其中,CPO技术将光引擎与交换芯片共封装,预计可减少30%-40%的功耗,并提升信号完整性,为下一代1.6T乃至3.2T交换平台铺平道路。这一趋势也印证了墨菲所说的“光互联及CPO技术即将迎来爆发节点”。
行业展望:连接能力将成为AI企业的核心壁垒
综合来看,黄仁勋与墨菲的对谈揭示了AI基础设施的深层次变革:算力竞赛的下半场,连接能力将决定胜负。这一认知正在重塑光通信产业链、芯片设计方法论以及数据中心架构规划。对于AI企业而言,是否具备系统级的连接策略(包括铜缆与光缆的合理配比、CPO技术的应用时机、网络拓扑的优化等),将直接决定其模型训练与推理的效率与成本。
可以预见,未来两年内,高速铜缆(DAC/ACC)市场将保持增长但竞争加剧,而光互联及CPO技术将迎来规模化落地的窗口期。Marvell与英伟达的合力发声,将进一步加速产业共识的形成。对于关注AI基础设施的从业者与投资者而言,“连接”这条赛道值得长期跟踪研究。
