最近有个消息在AI圈子里引起了不小的波澜:OpenAI正在考虑公开一款跨芯片软件优化工具。如果这事儿最终落地,英伟达长期以来靠CUDA软件生态建起来的那条护城河,可能真的要被撬动了。

据科技媒体The Information 6月1日报道,OpenAI负责计算与基础设施的高级副总裁Sachin Katti在一次公开讨论中透露,该公司正在开发一套软件抽象层。它的设计目标是:让研究人员和产品团队在运行AI工作负载时,完全不必操心底层芯片是英伟达的、AMD的还是谷歌的。
当被问及这一能力是否会对外开放时,Katti给出了非常明确的回答——"这在考虑范围之内"。他将其描述为"智能体优化能力",并且补充说:"我们希望将这一能力提供给全世界。"
这句话的分量,值得细品。英伟达之所以能占据AI算力的半壁江山,很大程度上依赖CUDA——那套专有的编译器、函数库和优化工具体系。主流AI开发者想在英伟达芯片上顺畅跑软件,基本离不开CUDA。一旦OpenAI真的把跨平台工具公开发布,CUDA的差异化优势就会被进一步削弱,AI算力市场的多元化竞争格局也将加速成型。
多芯片战略提速,OpenAI加速摆脱英伟达依赖
Katti在讨论中直言,AI行业未来将走向"高度异构化"——各家公司会同时使用来自多个供应商的AI芯片。这个判断背后,是OpenAI自身战略的深刻转变。
要知道,OpenAI以前几乎是英伟达的"独家用户",但现在风向变了。它已经先后与亚马逊、Cerebras以及AMD签署了协议,引入后者的AI芯片资源,同时还在自研定制芯片。当然,Katti并未透露OpenAI会不会采用谷歌的定制芯片——像Anthropic和Meta已经做过的那样。
其实不光是OpenAI,Anthropic和Meta同样不愿在这么核心的业务环节上依赖单一供应商。更何况,没有任何一家芯片厂商能单独满足这些巨头日益膨胀的算力需求。
软件抽象层:谷歌Borg模式的AI版本
Katti把OpenAI正在构建的这套软件体系,类比成谷歌著名的Borg计算管理系统——正是后者让谷歌得以跨异构硬件大规模扩展产品。"这就是我们在AI领域正在走的路,"他说。
更具碘伏性的是,Katti暗示AI本身可能成为打破CUDA垄断的关键工具。"我们预计将利用AI生成优化内核,从而真正支持所有这些不同的芯片选项。"换句话说,让AI自己来写底层优化代码,那就不需要手动适配每一家芯片了。
Amp创始人Anjney Midha在同一场讨论中点明了:如果OpenAI这类开发者把内部工具公开,让AI能高效运行于英伟达、谷歌、AMD等多种芯片之上,那对英伟达的冲击将是实质性的。
实际上,CUDA的护城河已经在悄然缩窄。Meta开发的PyTorch框架早已让开发者能更方便地为多种芯片编写AI代码,一批初创公司也在卖工具——把PyTorch代码转译成可直接在芯片上运行的底层代码。
Vera Rubin芯片部署在即,算力瓶颈转向电力与工程
除了软件战略,Katti还披露了OpenAI在英伟达下一代Vera Rubin芯片系统上的部署进展。OpenAI已经拿到了该芯片的早期样品,预计今年年底就会把它投入AI训练使用。
值得注意的是,Katti对英伟达在Blackwell系统推出过程中暴露的问题给出了正面评价——认为英伟达确实从中汲取了经验。Blackwell初代系统在规模化部署时,曾因为网络、固件和布线复杂性让多家云服务商头疼不已,但新版系统已经大幅改善。
至于哪家云服务商会率先承载OpenAI的Vera Rubin集群,Katti没有透露,只说各方之间存在"良性竞争"。目前OpenAI的主要云服务商包括微软、甲骨文和亚马逊。
最后一点值得所有AI基础设施投资者关注:Katti明确表示,当前算力扩张的最大瓶颈已经不是芯片本身,而是电力供应与工程能力。"目前制约我们的更多是电力和工程能力,而非其他。"这个判断,直接关系到资源配置的方向。
