首页 游戏 软件 资讯 排行榜 专题
首页
AI
硅谷巨头集体“叛逃”GPU,英伟达1500亿自救计划曝光

硅谷巨头集体“叛逃”GPU,英伟达1500亿自救计划曝光

热心网友
46
转载
2026-03-06


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:好困 桃子

【新智元导读】去GPU化的浪潮,已经拦不住了!OpenAI嫌英伟达太慢,Anthropic砸1486亿投奔TPU,老黄被迫200亿天价收购「叛徒」自救。如今,算力军备赛正式进入能效为王的新时代:谁先卡住「每焦耳每微秒」的极限,谁或许就是下一个十年的霸主。

再过两周,黄仁勋将站上GTC 2026的舞台。

他提前放了话:「我们准备了几款世界上前所未见的全新芯片。」

底气来自一份炸裂的成绩单——

英伟达2026财年年收入2159亿美元,净利润翻倍,数据中心业务三年翻了13倍。

在财报电话会上,CFO直接甩出一个数字:客户已经部署了9吉瓦的Blackwell基础设施!


但诡异的一幕出现了。

财报发布当晚,英伟达盘后一度涨超4%。随后股价悄然转跌,次日直接低开低走,收跌5.46%,一夜蒸发数千亿美元市值。

华尔街不是看不懂数字,是看懂了趋势。

前有Anthropic甩出210亿美元订单,全面采购基于谷歌TPU的算力系统;后有Meta跟谷歌签下数十亿美元芯片大单,大规模租用TPU训练模型。

为了给编程带来接近实时的响应体验,OpenAI更是历史上首次将主力级产品GPT-5.3-Codex-Spark,部署在了更低延迟与更低能耗的非GPU芯片Cerebras上。

英伟达最大的几个客户,正在集体分散筹码。


全球AI芯片中GPU架构和非GPU架构比例(数据来源:高盛全球投资研究部)

根据摩根大通的产能报告,谷歌计划在2027年部署600至700万颗TPU,大部分供给Anthropic、OpenAI、Meta和苹果等外部客户。

高盛投资研究部的模型显示,全球AI服务器中非GPU芯片出货占比,将从2024年的36%升至2027年的45%。

类似的,IDC也预测,到2028年,中国非GPU服务器市场规模占比将逼近50%。

GPU的致命短板

一个更深层的转折正在发生:AI的竞争焦点,正从单纯的算力规模,转向对能效比与延迟的极致追求。

过去拼谁卡多、谁集群大。

现在拼的是,同样花一块钱,谁能吐出更多Token。

「每美元产生的Token数」正在取代峰值算力,成为衡量芯片商业价值的核心指标。

究其原因在于,GPU的架构决定了,每次计算时数据都要在外部显存和计算单元之间来回搬运。

路径长、次数多,能耗就高、延迟就大。堆更多卡解决不了这个问题。

路透社爆料,OpenAI已多次表达对英伟达芯片的「不满」——响应速度没达预期,在代码生成产品Codex上感受尤为明显。

压力迫使英伟达这条「巨龙」寻求改变。

图灵奖得主David Patterson教授在最新研究中指出,大模型每次token生成都绕不开数据搬运,而搬运能耗远高于计算本身。

未来的核心命题是「让数据离计算更近」。

为此,他给出了三个AI芯片的演进方向:近内存处理、3D堆叠、低延迟互连。

实际上,这些都指向同一件事——用架构创新降低数据搬运的能耗和延迟。

换句话说就是,谁能用更低的能耗、更低的延迟跑通下一代模型,谁就能在未来十年的算力牌桌上占得先机。

谷歌TPU杀向商用市场

一直以来,谷歌TPU专供自家大模型训练和推理,外人用不到。

去年开始,谷歌把TPU推向了商用。

订单随即涌入。

博通CEO透露,Anthropic下了210亿美元的大单;Meta签下数十亿美元TPU租赁协议;潜在客户还包括苹果和已与SpaceX合并的xAI。

原因不难理解。大模型进入规模化落地阶段,算力需求爆发、成本压力加剧,单一依赖GPU的瓶颈越来越明显。而谷歌TPU的性能,已经具备与顶级GPU分庭抗礼的实力。

2025年推出的第七代TPU,是谷歌迄今为止性能最高、可扩展性最强的AI芯片——

单芯片峰值算力4614 TFLOPS(FP8精度),最大集群9216颗芯片、总算力达42.5 EFLOPS。

划重点:TPU v7在同等算力输出下功耗仅为英伟达B200的40%至50%。

不仅如此,谷歌自研的光电路交换机(OCS)技术,还让万卡级集群实现近乎线性的加速比。相比之下,传统GPU集群规模越大,通信损耗越严重;而TPU集群基本不吃这个亏。


Google TPU v5e、v5p、v6、v7芯片关键性能对比

谷歌TPU崛起还有更为直接的例证:在TPU上训练的Gemini 3,在多个权威基准测试中位居榜首,为业界顶尖模型之一。

回到成本账上。

TPU凭借AI专用架构带来的2-4倍能效优势,将大模型推理的综合成本相比GPU拉低50%以上。而这正是Anthropic、Meta们用订单投票的根本逻辑。

当下,大多数大模型企业已经在用TPU+GPU的组合来缓解成本压力。

去年11月,半导体研究机构SemiAnalysis对比大模型公司的采购成本后发现:与OpenAI相比,同时使用TPU与GPU的Anthropic,在与英伟达谈判时拥有更强的议价权。

手里有TPU,就多了一张跟老黄讨价还价的牌。未来头部AI公司大概率都会走「多芯片并行」路线。


OpenAI与Anthropic购买算力的成本对比

性能跨越式提升,顶尖大模型规模化验证,头部公司主动布局——TPU已从算力产业的补充路线,升级为主流路线。

英伟达一家独大的格局,正在被改写。


十年磨一剑

「TPU之父」要造下一代AI芯片

2025年底,英伟达斥资200亿美元,拿下AI芯片创企Groq的核心技术和团队。

这是英伟达史上最大的一笔交易,溢价近三倍。

Groq创始人Jonathan Ross,被称为「TPU之父」,谷歌TPU的核心设计者之一。离开谷歌后,他创立Groq的目标很明确:做一颗超越谷歌TPU的芯片。

两者的差异在架构。

谷歌TPU走的是「固定架构+集群扩展」路线。

其中,芯片内部搭载固定计算单元,依托二维数据流运算;芯片间通过3D Torus拓扑实现高效互联。架构稳定,但灵活性有限。


谷歌TPU架构

Groq的TSP(Tensor Streaming Processor)则是一种「软件定义硬件」的数据流处理器。

其核心理念是,通过构建可重构的软硬件系统,在保持可编程性的同时,达到接近ASIC的极致性能。

具体来说,芯片内部做了功能切片化微架构设计,配合软件层的灵活配置,可根据不同任务实时调整计算逻辑和数据流路径。

同时,依托大容量片上SRAM及静态调度机制,显著提升了数据访存效率并降低搬运能耗。

美国DARPA「电子复兴计划」(ERI)高度看好「软件定义硬件」方向,将其列为国家级战略核心。这也是Groq被称为「高阶TPU」的原因。

数据显示,在相同推理任务中,Groq芯片首token延迟比谷歌TPU v7降低20%至50%,每token成本降低10%至30%。

这场芯片革命,才刚开始加速

Groq被收编,但「高阶TPU」的进化没停。

国内清微智能、海外Cerebras等公司正在高效数据流动态配置和先进集成方式上持续突破。

1. 通过3D Chiplet技术构建三维立体数据流架构。

具体来说,「计算核心+3D DRAM芯粒」的组合在垂直与水平两个维度上形成了高效的数据流计算模式,突破了传统二维架构的效率局限。

三维架构可以依据计算任务的需求和数据特性,在两个维度上灵活调度数据流,最大化缩短传输路径,降低搬运过程中的延迟与能耗,从而进一步提升整体计算效率。

2. 依托算力网格技术构建灵活数据流计算范式。

传统固定组网存在扩展性和语义适配瓶颈。而算力网格技术则可以通过灵活组网,实现Scale up与Scale out的协同。

根据AI任务特性,系统能实时下发数据流的动态配置信息,在多种互联拓扑结构间灵活切换、精准调度。最终降低互联延迟,充分释放数据流架构的算力。

3. 通过前沿的晶圆级芯片技术,将数据流架构的优势发挥到极致。

这项技术将数据流架构从芯片尺度扩展到整片晶圆。

在整张晶圆上高密度集成大量计算核心,计算核心间的互联距离被极大缩短。带来的结果是,互联带宽实现数量级提升,通信延迟大幅降低。

数据流架构的算力规模与计算效能由此被推到极致。这也是为什么晶圆级芯片被视为数据流计算架构的理想物理载体。

以Cerebras为例。

数据显示,Cerebras CS 3系统推理性能比英伟达旗舰DGX B200快21倍,成本与功耗均降低三分之一,在算力、成本、能效上展现出显著的综合优势。

在实测中,OpenAI的Codex-Spark跑出了每秒超1000 token的生成速度,让代码编写第一次有了实时交互的体验。


Cerebras CS-3 vs英伟达GPU:大模型推理速度对比

GPU独霸的时代,回不去了

谷歌TPU走出围墙,OpenAI拥抱晶圆级芯片,英伟达天价收编Groq。

这些信号均指向同一个方向:TPU已变成巨头们真金白银押注的主战场。

算力世界的单极时代,正在被多元架构终结。

决定下一代AI天花板的,不是算力堆砌的军备竞赛,而是能耗、延迟、确定性共同构成的新指标。

对国产芯片来说,这场变局既是机遇也是挑战。 跟随者只能分残羹,走出自己的底层创新之路,才有资格参与下一轮全球算力洗牌。

参考资料:

全球算力格局震荡,“高阶TPU”崛起!

https://www.theinformation.com/articles/google-strikes-multibillion-dollar-ai-chip-deal-meta-sharpening-nvidia-rivalry

https://groq.com/newsroom/groq-and-nvidia-enter-non-exclusive-inference-technology-licensing-agreement-to-accelerate-ai-inference-at-global-scale

https://openai.com/index/introducing-gpt-5-3-codex-spark/

https://cloud.google.com/blog/products/compute/ironwood-tpus-and-new-axion-based-vms-for-your-ai-workloads

来源:https://www.163.com/dy/article/KNC24QER0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

扎克伯格为Meta设立“硬指标”:最高80%工程师需在工作中使用AI
科技数码
扎克伯格为Meta设立“硬指标”:最高80%工程师需在工作中使用AI

Meta的“AI原生”转型:指标驱动的深度变革 近期,一份曝光的内部文件揭示了一个明确的趋势:马克·扎克伯格正全力推动Meta向一家彻底的“AI原生”公司转型。这不仅仅是一句口号,而是通过设定具体、可量化的指标,将AI深度融入每一位员工、尤其是工程师的日常工作流程中。 从部门到公司:具体的AI渗透目

热心网友
04.17
年化收入300亿美元 Anthropic首超OpenAI
科技数码
年化收入300亿美元 Anthropic首超OpenAI

风头正盛的AI新锐巨头Anthropic年化收入激增 AI领域的竞争格局,似乎又迎来了一个关键转折点。当地时间4月6日,Anthropic公布了一组引人注目的数字:由于旗下大模型Claude需求持续加速,公司的年化收入已经冲破了300亿美元大关。要知道,就在去年年底,这个数字还停留在90亿美元。更值

热心网友
04.17
谷歌I/O 2026日程公布,AI与安卓17成核心议题
科技数码
谷歌I/O 2026日程公布,AI与安卓17成核心议题

谷歌2026年I O开发者大会日程正式公布,AI与核心平台更新成首日焦点 谷歌开发者博客在4月14日发布了最新公告,正式揭晓了2026年I O开发者大会的详细直播日程。这次大会的重头戏——主旨演讲,已经定档于太平洋时间5月19日。从首日议程来看,Google AI、Android和Chrome等核心

热心网友
04.16
安卓开发者天塌了?谷歌新政一夜变苹果!开发者炸锅:明年起做 APK 先举身份证!网友:近年来科技界最糟糕的事
业界动态
安卓开发者天塌了?谷歌新政一夜变苹果!开发者炸锅:明年起做 APK 先举身份证!网友:近年来科技界最糟糕的事

开发者不得不接入 Play Integrity、SafetyNet 等安全 API,应用与谷歌服务的绑定日益加深。对谷歌而言,这不仅降低了恶意应用风险,还能进一步锁定用户和开发者,强化数据控制,并间接推动 Play 商店交易和广告收益。 一夜之间,安卓要向苹果看齐了? 未来想发布一个APK,开发者可

热心网友
04.15
OpenAI内部信曝光:断言死敌Anthropic深陷算力瓶颈,差距将持续拉大
业界动态
OpenAI内部信曝光:断言死敌Anthropic深陷算力瓶颈,差距将持续拉大

OpenAI内部备忘录曝光:直指竞争对手Anthropic算力规模“不在一个量级” AI领域的竞争,火药味越来越浓了。就在本周,OpenAI向投资者发送的一份内部备忘录被曝光,内容直指其主要竞争对手Anthropic。OpenAI在文件中毫不客气地指出,双方的“规模体量完全不在一个量级”,并称Ant

热心网友
04.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

析稿 提供高质量AI写作服务,助力学生高效完成各类学术论文,降低查重率
AI
析稿 提供高质量AI写作服务,助力学生高效完成各类学术论文,降低查重率

析稿产品介绍 在学术写作这个领域,效率和质量常常难以兼得。今天要聊的这款工具——析稿,正是试图破解这一难题的智能方案。 析稿网站介绍 简单来说,析稿是一个聚焦于学术写作与作业辅导的AI驱动平台。它的核心目标很明确:帮助用户,尤其是学生和研究者,在保证原创性的前提下,大幅提升写作效率,同时把查重率稳稳

热心网友
04.18
ARCRaiders收割机事件是什么-ARCRaiders收割机事件介绍
游戏攻略
ARCRaiders收割机事件是什么-ARCRaiders收割机事件介绍

在Arc Raiders中,收割机事件是一场不容错过的硬核挑战 首先需要明确的是:收割机事件并非随时都能遭遇的常规战斗,它更像是一场精心设计的“精英遭遇战”,拥有独特的触发机制与前置条件。通常,当游戏进程推进到特定阶段,在部分高危区域你可能会察觉到异常征兆——或许是远处传来的低沉机械轰鸣,或者是地面

热心网友
04.18
GPTOCR
AI
GPTOCR

GPTOCR是什么 说到从PDF或图片里“捞”数据,很多人可能都经历过格式混乱、需要反复调整的麻烦。现在,有一款工具试图用更聪明的方式解决这个问题,它就是GPTOCR。简单来说,这是一个利用生成式AI模型力量的工具,专门负责把PDF和图像文件里的文字内容,不仅提取出来,还能自动整理成格式完好的JSO

热心网友
04.18
消防安全标语大全精选
职业与学业
消防安全标语大全精选

消防安全标语大全:让安全警句,成为生命的护身符 标语,不仅是墙上的装饰,更是无声的警示与关怀。一句精炼有力的消防安全口号,能在关键时刻传递核心价值,潜移默化地塑造安全行为习惯。在消防领域,一条好标语就是一次及时的提醒、一份深切的关怀,甚至是一道守护生命的坚实屏障。本文系统梳理了涵盖校园、家庭、公共场

热心网友
04.18
《王者荣耀世界》寻路攻略
游戏攻略
《王者荣耀世界》寻路攻略

《王者荣耀世界》寻路攻略 在《王者荣耀世界》中执行任务时,无论是主线还是支线,游戏系统都会清晰地标注出目标坐标。玩家只需打开大地图,即可直接查看任务点的具体位置。一个高效的技巧是:先在地图上锁定目标,并快速记住其大致方位。然而,仅凭方向感在实际跑图中往往不够,玩家很容易在复杂地形中偏离预定路线。 此

热心网友
04.18