谷歌联手Meta将PyTorch引入TPU,能否冲击CUDA主导地位?

新智元报道
编辑:艾伦
【新智元导读】谷歌正在推进一项代号为「TorchTPU」的战略行动,核心是让全球最主流的 AI 框架 PyTorch 在自家 TPU 芯片上跑得更顺畅。这项行动不仅是技术补课,更是一场商业围剿。作为 PyTorch 的掌控者,Meta 也深度参与其中,两家巨头试图联手松动英伟达的垄断地位。对于谷歌而言,卖芯片不再是终点,降低开发者的迁移门槛,才是真正介入战争的开始。
谷歌正在发起一项代号为「TorchTPU」的新行动,试图以此打破英伟达在 AI 算力市场的长期垄断。

据知情人士透露,这项计划的核心在于让谷歌自研的 AI 芯片(TPU)能够更顺滑地运行 PyTorch,这是目前全球最主流的 AI 软件框架。
这是谷歌激进战略拼图中的关键一块,他们希望将 TPU 打造为英伟达 GPU 的有力替代者。
随着谷歌急需向投资者证明其巨额 AI 投入的回报能力,TPU 的销售已然成为谷歌云营收增长的重要引擎。
但光有硬件是不够的。
知情人士指出,「TorchTPU」旨在消除那道长期阻碍 TPU 普及的无形围墙,也就是让那些早已习惯在 PyTorch 环境下搭建技术架构的客户,能够无痛迁移到谷歌的硬件上。
甚至有消息称,为了加速这一进程,谷歌正考虑将部分软件开源。
相较于过往对 PyTorch 的零星支持,这一次谷歌投入了前所未有的组织关注度和战略资源。
这一转变的背后,是越来越多渴望采用 TPU 的企业发出的呼声。对他们来说,芯片是个好东西,但软件栈却成了瓶颈。
在硅谷,PyTorch 是 AI 模型开发者的通用语言,而它的最大支持者正是 Meta。
在这个行业里,极少有开发者会去为英伟达、AMD 或谷歌的芯片逐行编写底层代码,他们依赖的是像 PyTorch 这样的工具库来自动化处理开发任务。
自 2016 年发布以来,PyTorch 的成长史几乎就是一部与英伟达 CUDA 生态的绑定史。
华尔街分析师普遍认为,CUDA 才是英伟达抵御竞争对手最坚固的盾牌。
多年来,英伟达的工程师们不仅造芯片,更致力于确保 PyTorch 开发的模型在其硬件上跑得又快又好。
相比之下,谷歌此前走了一条截然不同的路。
他们拥有庞大的内部软件军团,使用一套名为 Jax 的代码框架,并通过 XLA 工具来优化 TPU 的运行效率。
谷歌自身的 AI 软件栈和性能优化大多围绕 Jax 构建,这种「圈地自萌」的做法,拉大了谷歌芯片与外部客户实际使用习惯之间的鸿沟。
面对路透社的询问,谷歌云发言人虽未对该项目细节置评,但确认了这一战略方向。
他表示,无论是 TPU 还是 GPU 基础设施,需求都在加速爆发,谷歌的重心是提供足够的灵活性和规模,无论开发者选择在何种硬件上构建应用。
从自用到外售
TPU 的角色演变
曾几何时,谷歌将绝大多数 TPU 产能视为「私藏珍品」,仅供内部使用。
这一局面直到 2024 年才发生改变,谷歌云部门成功争取到了 TPU 的销售主导权。
此后,谷歌云大幅增加了对外分配的 TPU 额度,试图在客户对 AI 兴趣激增的当下,通过扩大产能和销售来抢占市场。
然而,供需之间存在错位。
全球大多数 AI 开发者使用的是 PyTorch,而谷歌芯片最擅长的却是 Jax。
这意味着,想要使用谷歌芯片并获得比肩英伟达的性能,开发者必须进行大量额外的工程适配。
在分秒必争的 AI 竞赛中,这种时间和资金的消耗是企业难以承受的。
如果「TorchTPU」计划成功,它将显著降低企业寻找英伟达 GPU 替代方案时的转换成本。
英伟达之所以难以撼动,不仅在于硬件性能,更在于 CUDA 生态已经深深嵌入 PyTorch,成为训练和运行大模型的默认选项。
知情人士表示,企业客户曾反复向谷歌反馈,TPU 虽好,但接入门槛太高,因为历史上它强迫开发者放弃通用的 PyTorch,转而学习谷歌内部偏好的 Jax。
盟友 Meta
敌人的敌人就是朋友
为了加速开发进程,谷歌找来了一位关键盟友,即 PyTorch 的创造者和守护者 Meta。
据知情人士透露,这两大科技巨头正在商讨协议,让 Meta 获得更多 TPU 的使用权。此前《The Information》也曾报道过这一动向。
在早期合作中,谷歌主要以托管服务的形式向 Meta 提供支持。
Meta 使用谷歌设计的芯片运行谷歌的软件和模型,并由谷歌提供运营维护。
对 Meta 而言,推动软件适配 TPU 具有极高的战略价值,它不仅能降低推理成本,更能通过硬件基础设施的多元化来减少对英伟达的依赖,从而在谈判桌上获得更多筹码。
Meta 方面对此拒绝置评。
今年以来,谷歌已开始将 TPU 直接出售给客户的数据中心,而不再局限于自家的云服务。
组织架构也在随之调整,谷歌老将 Amin Vahdat 本月被任命为 AI 基础设施负责人,直接向 CEO 桑达尔·皮查伊(Sundar Pichai)汇报。

这套基础设施对谷歌至关重要,它不仅要支撑包括 Gemini 聊天机器人和 AI 搜索在内的自家产品,也要服务于像 Anthropic 这样依赖谷歌云 TPU 算力的外部独角兽。
参考资料:
https://www.reuters.com/business/google-works-erode-nvidias-software-advantage-with-metas-help-2025-12-17/
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!
相关攻略
读完这本关于德米斯·哈萨比斯的最新传记,一个更立体、更出人意料的谷歌AI掌门人形象跃然纸上。这位公认的天才,远不止是聚光灯下那位冷静的科学家。 比如,他曾试图“智取”深度学习教*父杰弗里·辛顿。在辛顿那场著名的初创公司拍卖夜,DeepMind也参与了竞标,出价1000万美元。发现竞争过于激烈后,哈萨
谷歌在2026年I O大会上披露了AI业务的快速增长。其基础设施每月处理的Token量已超3200万亿,同比增长7倍。Gemini应用月活用户突破9亿,用户请求量日同比增长也超7倍。此外,图像生成模型累计产出图片超500亿张,显示AI正深入日常应用与内容创作领域。
谷歌DeepMind今天扔下了一颗重磅冲击波:正式开源发布Gemma 4系列模型。根据官方说法,这是谷歌迄今为止最智能的开放模型,专为高级推理和智能体工作流而生。最引人注目的是,它号称实现了“单位参数下前所未有的智能水平”——换句话说,就是用更小的模型体量,干出更聪明的活儿。 先看几个硬核数据:其3
2026年谷歌I O大会聚焦人工智能进展。数据显示,谷歌平台每月处理Token量超3200万亿,同比激增7倍。Gemini应用月活用户突破9亿,实现翻倍增长,每日用户请求量也增长超7倍。此外,NanoBanana模型累计生成图片总量已超500亿张。
谷歌发布WearOS7,重点优化续航与智能交互。续航最高提升10%,缓解充电焦虑。新系统引入GeminiIntelligence智能能力,可理解指令并串联多步骤完成任务,使手表成为主动的智能伙伴。它还能减少掏手机频率,协调跨设备自动化流程。同时推出的AppFunctionsAPI支持开发者整合智能能力,创造更自然交互体验。
热门专题
热门推荐
苹果MacStudio库存见底,预示新款即将发布。外观预计延续经典紧凑设计,接口布局不变。核心升级为M5Max和M5Ultra芯片,性能大幅提升,但内存供应可能受限。固态硬盘速度有望翻倍。作为苹果专业桌面新旗舰,其起售价可能小幅上调,WWDC大会可能是发布窗口。
对于使用尼康Z卡口APS-C画幅(DX格式)相机(如Z fc、Z30、Z50)的摄影爱好者而言,在套机镜头之外选择一支定焦镜头,是提升创作自由度和画面质量的关键一步。尼克尔 Z DX 24mm f 1 7正是这样一款专为轻量化与大光圈设计的定焦镜头,目前京东售价1899元,为追求便携与画质平衡的用户
自动驾驶技术的分级标准正面临行业内部的深度反思与重构。在2026北京车展上,小马智行联合创始人兼CEO彭军发表的观点,将行业关注的焦点从技术参数转向了更为根本的责任归属议题。 彭军明确指出,当前广泛采用的L1至L5自动驾驶分级体系已显得“极其无厘头”。他认为,这些层级划分并非衡量自动驾驶商业化前景的
4月28日,《商业内幕》发布的一篇深度报道,揭示了特斯拉自动驾驶承诺背后日益凸显的信任危机。多年来,“未来将实现完全自动驾驶”是特斯拉吸引消费者的核心卖点,但对于众多早期支持者而言,这一愿景正变得愈发渺茫。 图1:马斯克确认HW3车型无法升级至无监督版FSD 问题的根源在于硬件代际差异。在近期举行的
当AI智能体不仅能说会道,还能帮你订餐、写报告,甚至用周杰伦的风格唱首歌时,汽车行业的竞争焦点,已经悄然从硬件参数转向了软件生态。这届北京车展,就是最好的证明。 “你能让它用周杰伦那种吐字不清的风格,唱首歌吗?”在火山引擎的展台,一位体验者向工作人员提出了这个有趣的要求。指令下达后,座舱里的“豆包”





