首页 游戏 软件 资讯 排行榜 专题
首页
AI
马斯克力荐谷歌TPU v8训练效率提升数倍推理成本大降

马斯克力荐谷歌TPU v8训练效率提升数倍推理成本大降

热心网友
92
转载
2026-05-18

随着人工智能对计算能力的需求持续爆发式增长,专用AI芯片的战略价值正被全球科技界重新评估。谷歌最新发布的第八代TPU(张量处理单元),为这一趋势提供了极具说服力的例证。

专为智能体(Agent)时代打造的这代TPU,其战略意图非常清晰:在“训练与推理分离”的技术路径上,谷歌比英伟达走得更远,直接推出了两款物理架构完全不同的专用芯片。

面向大模型训练的TPU 8t,整体计算性能据称是上一代Ironwood的近三倍,能将千亿参数大模型的训练周期从数月大幅压缩至数周。而专攻AI推理任务的TPU 8i,核心目标则是在成本不变的前提下,将在线服务吞吐能力提升近一倍。

图片

能效比是谷歌的另一大发力点。采用第四代液冷散热技术后,第八代TPU的每瓦性能比前代提升了近两倍。当计算性能和能源效率这两个关键瓶颈被同步突破,智能体的大规模、低成本商业化落地才真正具备了坚实的硬件基础。这也难怪新品发布后,行业观察家给出了“真正能带来变革的硬件升级”的高度评价。

图片

资本市场的反应最为直接。发布会后,谷歌母公司Alphabet的股价盘中最高涨幅达到2.2%,显示出投资者对谷歌AI芯片技术路线的初步认可。

预计这两款高性能AI芯片将在今年晚些时候正式上市供货。

Gemini参与设计,两款芯片技术细节曝光

一个值得关注的细节是,第八代TPU的开发有谷歌大模型Gemini的参与。尽管官方未透露具体环节,但博客中确实出现了“共同设计”的表述。这款凝聚了“人机协同智慧”的AI芯片,最终朝着训练和推理两个方向极致演进,诞生了架构迥异的8t与8i。

首先看专攻模型训练的TPU 8t。与上一代相比,它在集群规模、算力利用率和系统稳定性上进行了全面升级。其超级芯片组可扩展至9600个芯片,配备2PB共享高带宽内存,芯片间互联带宽翻倍,总算力高达121 ExaFlops,支持大模型在统一的内存池中直接运行。存储访问速度提升10倍,结合TPU Direct数据直连技术,旨在最大化训练时的算力利用率。通过Virgo网络、JAX框架和Pathways软件栈,实现了近乎线性的扩展能力,单一逻辑集群可延伸至百万芯片规模。在稳定性方面,通过实时遥测、自动故障链路绕过和光路交换等先进机制,即使在超大规模集群下,有效训练吞吐目标仍可维持在97%的高位。

图片

而推理芯片TPU 8i的设计哲学则截然不同,核心追求是“极致低延迟”。为此,谷歌几乎重做了整个推理软件栈。内存方面,通过集成288GB高带宽内存和384MB片上SRAM,将容量提升至上一代的3倍,旨在让模型的活跃参数尽可能驻留片上缓存,显著减少访存延迟。系统层面,引入自研的Axion CPU架构,并将每台服务器的CPU主机数量翻倍,再通过NUMA(非统一内存访问)进行隔离优化,提升系统协同效率。为适配当前主流的MoE(混合专家)模型,互连带宽提升至19.2 Tb/s,并采用新的Boardfly架构将网络路径长度缩短一半以上,优化多专家协同效率。此外,新增的片上集体加速引擎,将部分需跨芯片完成的全局操作移至芯片内部,据称可将此类关键操作的延迟最高降低至原来的五分之一。

这一系列硬件与软件协同改进的最终结果是,TPU 8i的每美元推理性能提升约80%,在同等成本下,AI服务能力接近翻番。

图片

谷歌选择“训推分离”技术路径的逻辑非常清晰:智能体时代对模型训练(追求高吞吐、大规模)和在线推理(追求低延迟、高并发)的要求本质不同。行业实践表明,单一芯片架构难以同时最优地满足这两类差异化需求。既然如此,分而治之便成了自然的技术选择。从第八代TPU的实际表现来看,这种分离策略已显现出显著的性能效益。当然,谷歌敢于走这条深度定制化路径,离不开其对从芯片、互联到系统软件的全栈掌控能力。

全栈协同优化的威力

一个容易被忽略但至关重要的变化是,从这一代开始,TPU的搭档不再是英特尔或AMD的通用x86 CPU,而是谷歌自研的、为AI优化的Axion CPU。这意味着,谷歌可以按照AI工作负载的特性,深度定制CPU与TPU之间的协作方式,从而极致地压榨每一瓦电力所能换取的AI算力。

面对AI发展的核心约束——能源与功耗,谷歌的优化已不再局限于芯片本身,而是扩展到整个计算链路。从CPU、TPU、高速网络到数据中心基础设施,全部围绕能效进行重构。例如,将网络连接直接集成进计算芯片,减少节点间不必要的数据搬运能耗;实施统一的电源管理策略,根据实时负载动态分配电力,优先保障关键计算环节。

图片

数据中心也从被动的承载角色变为主动参与协同设计,供电系统、任务调度、散热方案均被重新打磨。再结合第四代液冷技术,有效解决了高功率密度下的散热难题,让AI算力得以在更高能效区间稳定运行。

这些全栈优化叠加的效果非常显著:TPU 8t和8i的每瓦性能相比上一代提升近2倍。若将视角拉升至整个数据中心层面,单位电力提供的总算力在五年内已提升6倍。

更重要的是,谷歌正将这套全栈软硬件协同能力开放给广大开发者。无需复杂的底层环境适配,8t和8i原生支持PyTorch、JAX、vLLM等主流AI框架,并提供裸机访问模式,让开发者能直接触及硬件真实性能。配合MaxText、Tunix等开源工具链,从模型训练、微调到部署上线的全路径被进一步打通。这也让谷歌喊出“打造面向智能体时代的基础设施”这一口号时,显得更有技术底气。

AI芯片市场格局的微妙变化

随着谷歌新一代TPU发布,业界不免将其与当前的AI算力霸主英伟达进行对比。此前,英伟达CEO黄仁勋在一次播客中被问及:“世界上排名前三的AI模型中有两个——Claude和Gemini,都是在TPU上训练的。这对英伟达未来意味着什么?”他的回答简短而意味深长:“TPU没有威胁。”

图片

在黄仁勋看来,专为AI设计的TPU只是在特定赛道取得了突破,而英伟达构建的是覆盖“全部”场景的加速计算生态系统。从CUDA软件生态,到支撑AI、高性能计算(HPC)、数据处理等全生命周期应用的能力,英伟达的护城河在于其广泛的适用性和庞大的开发者与客户基础。AI加速,只是其中当前最炙手可热的一部分。

然而,一个不容忽视的趋势是,随着AI应用持续吞噬全球算力,专用AI芯片的战略价值与市场潜力正在被重新评估。至少,像埃隆·马斯克这样的行业关键人物,已经用行动(如投资或自研AI芯片)表明了态度。这场围绕未来AI算力基础设施主导权的竞争,显然才刚刚进入一个更加激烈和多元化的新阶段。

图片

来源:https://www.51cto.com/article/841515.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

马斯克薪酬与火星殖民计划挂钩 SpaceX多行星愿景详解
AI
马斯克薪酬与火星殖民计划挂钩 SpaceX多行星愿景详解

SpaceX在上市前披露激进治理方案,计划发行10倍投票权B类股确保马斯克绝对控制权,并批准总额可达万亿美元的薪酬方案,其考核直接与火星建立百万人口殖民地的目标挂钩。马斯克回应称,此举旨在确保公司专注于多行星生活愿景,而非短期财报。他承认目标实现异常艰难,但若成功,公司价值将远超地球当前经济总量。S

热心网友
05.17
马斯克550亿美元芯片工厂计划正式启动
AI
马斯克550亿美元芯片工厂计划正式启动

当全球最大的AI算力消费者决定亲自下场建芯片厂,这件事的意义,早已超越了单纯的商业竞争。 上世纪80年代,日本半导体产业如日中天,一度吃下全球芯片市场过半的份额。美国人当时坐不住了——倒不是因为买不到芯片,而是他们猛然意识到,一个国家如果无法掌控自己的“硅”,就等于把战略命脉交到了别人手里。于是,《

热心网友
05.16
马斯克600亿美元收购Cursor背后IPO战略布局解析
AI
马斯克600亿美元收购Cursor背后IPO战略布局解析

SpaceX拟以600亿美元收购AI编程工具Cursor母公司,并附带百亿美元合作保底条款。此举旨在整合其开发者生态与工程团队,为IPO注入AI应用层估值,通过算力置换构建从底层算力到应用的全栈AI生态,以支撑万亿市值目标。市场质疑高溢价收购或仅为IPO包装。

热心网友
05.16
马斯克曾因AI安全怒斥OpenAI科学家 内部会议细节首次曝光
AI
马斯克曾因AI安全怒斥OpenAI科学家 内部会议细节首次曝光

OpenAI首席未来学家约书亚·阿奇亚姆在法庭证词中披露,2018年2月公司内部会议上,埃隆·马斯克因AI安全问题与他发生激烈争执,当场骂他是“蠢驴”。冲突源于马斯克计划快速推进AGI开发,而阿奇亚姆等人认为该方案存在安全风险。马斯克当时解释离职原因包括人才竞争冲突和对OpenAI发展方向缺乏信心。

热心网友
05.16
马斯克中文发帖透露儿子正学习普通话
科技数码
马斯克中文发帖透露儿子正学习普通话

5月14日,马斯克在社交媒体用中文透露儿子正学习普通话。同日,他携身穿新中式上衣的幼子现身人民大会堂外,引发国内外网友关注。此次随美总统访华的包括马斯克、库克等十余位商界领袖,阵容瞩目。会谈后马斯克表示进展顺利,暗示积极信号。

热心网友
05.16

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

斯柯达晶锐Fabia Motorsport特别版车型正式发布
业界动态
斯柯达晶锐Fabia Motorsport特别版车型正式发布

为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘

热心网友
05.18
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元
web3.0
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元

Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,

热心网友
05.18
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾
业界动态
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾

劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲

热心网友
05.18
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台
游戏资讯
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台

新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。

热心网友
05.18
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录
业界动态
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录

当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID

热心网友
05.18