谷歌联手Meta将PyTorch引入TPU，能否冲击CUDA主导地位？

时间：2025-12-18 14:49

新智元报道编辑：艾伦【新智元导读】谷歌正在推进一项代号为「TorchTPU」的战略行动，核心是让全球最主流的 AI 框架 PyTorch 在自家 TPU 芯片上跑得更顺畅。这项行动不仅是技术补课，更

新智元报道

编辑：艾伦

【新智元导读】谷歌正在推进一项代号为「TorchTPU」的战略行动，核心是让全球最主流的 AI 框架 PyTorch 在自家 TPU 芯片上跑得更顺畅。这项行动不仅是技术补课，更是一场商业围剿。作为 PyTorch 的掌控者，Meta 也深度参与其中，两家巨头试图联手松动英伟达的垄断地位。对于谷歌而言，卖芯片不再是终点，降低开发者的迁移门槛，才是真正介入战争的开始。

谷歌正在发起一项代号为「TorchTPU」的新行动，试图以此打破英伟达在 AI 算力市场的长期垄断。

据知情人士透露，这项计划的核心在于让谷歌自研的 AI 芯片（TPU）能够更顺滑地运行 PyTorch，这是目前全球最主流的 AI 软件框架。

这是谷歌激进战略拼图中的关键一块，他们希望将 TPU 打造为英伟达 GPU 的有力替代者。

随着谷歌急需向投资者证明其巨额 AI 投入的回报能力，TPU 的销售已然成为谷歌云营收增长的重要引擎。

但光有硬件是不够的。

知情人士指出，「TorchTPU」旨在消除那道长期阻碍 TPU 普及的无形围墙，也就是让那些早已习惯在 PyTorch 环境下搭建技术架构的客户，能够无痛迁移到谷歌的硬件上。

甚至有消息称，为了加速这一进程，谷歌正考虑将部分软件开源。

相较于过往对 PyTorch 的零星支持，这一次谷歌投入了前所未有的组织关注度和战略资源。

这一转变的背后，是越来越多渴望采用 TPU 的企业发出的呼声。对他们来说，芯片是个好东西，但软件栈却成了瓶颈。

在硅谷，PyTorch 是 AI 模型开发者的通用语言，而它的最大支持者正是 Meta。

在这个行业里，极少有开发者会去为英伟达、AMD 或谷歌的芯片逐行编写底层代码，他们依赖的是像 PyTorch 这样的工具库来自动化处理开发任务。

自 2016 年发布以来，PyTorch 的成长史几乎就是一部与英伟达 CUDA 生态的绑定史。

华尔街分析师普遍认为，CUDA 才是英伟达抵御竞争对手最坚固的盾牌。

多年来，英伟达的工程师们不仅造芯片，更致力于确保 PyTorch 开发的模型在其硬件上跑得又快又好。

相比之下，谷歌此前走了一条截然不同的路。

他们拥有庞大的内部软件军团，使用一套名为 Jax 的代码框架，并通过 XLA 工具来优化 TPU 的运行效率。

谷歌自身的 AI 软件栈和性能优化大多围绕 Jax 构建，这种「圈地自萌」的做法，拉大了谷歌芯片与外部客户实际使用习惯之间的鸿沟。

面对路透社的询问，谷歌云发言人虽未对该项目细节置评，但确认了这一战略方向。

他表示，无论是 TPU 还是 GPU 基础设施，需求都在加速爆发，谷歌的重心是提供足够的灵活性和规模，无论开发者选择在何种硬件上构建应用。

从自用到外售

TPU 的角色演变

曾几何时，谷歌将绝大多数 TPU 产能视为「私藏珍品」，仅供内部使用。

这一局面直到 2024 年才发生改变，谷歌云部门成功争取到了 TPU 的销售主导权。

此后，谷歌云大幅增加了对外分配的 TPU 额度，试图在客户对 AI 兴趣激增的当下，通过扩大产能和销售来抢占市场。

然而，供需之间存在错位。

全球大多数 AI 开发者使用的是 PyTorch，而谷歌芯片最擅长的却是 Jax。

这意味着，想要使用谷歌芯片并获得比肩英伟达的性能，开发者必须进行大量额外的工程适配。

在分秒必争的 AI 竞赛中，这种时间和资金的消耗是企业难以承受的。

如果「TorchTPU」计划成功，它将显著降低企业寻找英伟达 GPU 替代方案时的转换成本。

英伟达之所以难以撼动，不仅在于硬件性能，更在于 CUDA 生态已经深深嵌入 PyTorch，成为训练和运行大模型的默认选项。

知情人士表示，企业客户曾反复向谷歌反馈，TPU 虽好，但接入门槛太高，因为历史上它强迫开发者放弃通用的 PyTorch，转而学习谷歌内部偏好的 Jax。

盟友 Meta

敌人的敌人就是朋友

为了加速开发进程，谷歌找来了一位关键盟友，即 PyTorch 的创造者和守护者 Meta。

据知情人士透露，这两大科技巨头正在商讨协议，让 Meta 获得更多 TPU 的使用权。此前《The Information》也曾报道过这一动向。

在早期合作中，谷歌主要以托管服务的形式向 Meta 提供支持。

Meta 使用谷歌设计的芯片运行谷歌的软件和模型，并由谷歌提供运营维护。

对 Meta 而言，推动软件适配 TPU 具有极高的战略价值，它不仅能降低推理成本，更能通过硬件基础设施的多元化来减少对英伟达的依赖，从而在谈判桌上获得更多筹码。

Meta 方面对此拒绝置评。

今年以来，谷歌已开始将 TPU 直接出售给客户的数据中心，而不再局限于自家的云服务。

组织架构也在随之调整，谷歌老将 Amin Vahdat 本月被任命为 AI 基础设施负责人，直接向 CEO 桑达尔·皮查伊（Sundar Pichai）汇报。

这套基础设施对谷歌至关重要，它不仅要支撑包括 Gemini 聊天机器人和 AI 搜索在内的自家产品，也要服务于像 Anthropic 这样依赖谷歌云 TPU 算力的外部独角兽。

参考资料：

https://www.reuters.com/business/google-works-erode-nvidias-software-advantage-with-metas-help-2025-12-17/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

来源：https://www.163.com/dy/article/KH2M7Q2R0511ABV6.html

谷歌芯片英伟达 meta cuda 知名企业 pytorch

上一篇华为100W全能充电器熊猫与花主题款评测：249元值不值？ 下一篇2026款华为MatePad 11.5平板官网上线，顶配12GB+256GB

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争，正步入一个全新的发展阶段。近日，宇树科技正式发布了其WVLA2 0具身大模型，并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号：当前这场竞赛的核心壁垒，或许已不再是谁拥有更大的模型参数，而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间，将精灵G2机器人直接部署到真实的平板量产质检产线，并全程公开直播后，交出的最具说服力的答案。让我们关注这场直播的硬核数据：连续64小时不间断作业，产线累计完成17625件产品检测，机器人累计执行64828次操作，任务成功率精确达到

科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后，仅过了一周时间，这款全新纯电SUV便驶入中国专业赛道场景——这一次，地点换成了永久性专业赛道。回顾2026年北京车展，保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后，志愿填报这场“第二次大考”随即全面开启。对众多家庭而言，这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多，每一步都如履薄冰。教育部近日发布预警，严厉批评那些漫天要价的“志愿规划师”，直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜，网上信息真假混杂，不同机构给出的

科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来，伴随新能源汽车产业的爆发式增长，早期投入使用的动力电池正迎来集中退役高峰，锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂，正从地下矿藏逐渐转向我们身边的“城市矿山”，从“一次性使用”的线性消耗模式，迈向“循环再生”的可持