首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
谷歌TPU追赶英伟达:成本降70%,性价比已持平

谷歌TPU追赶英伟达:成本降70%,性价比已持平

热心网友
89
转载
2026-01-21

在AI资本开支保持高位运行、但商业化压力日益凸显的当下,市场关注的焦点正经历一场静默却深刻的转变:大型模型还能否延续“无视成本地奔跑下去”的势头?

据知情交易渠道透露,高盛最新发布的AI芯片研究报告,并未延续市场熟悉的“算力、制程、参数规模”对比框架,而是从更贴近商业现实的角度切入——聚焦推理阶段的单位成本。通过构建一条“推理成本曲线”,高盛试图回答一个对AI产业至关重要的问题:当模型进入高频调用阶段后,不同芯片方案在折旧、能耗和系统利用率等多重约束下,每处理一百万个token究竟需要付出多少真实代价。

研究结论指向了加速演进的行业变局:Google/Broadcom的TPU正在迅速缩小与英伟达GPU在推理成本上的差距。从TPU v6升级至TPU v7,单位token的推理成本下降约70%,使其在绝对成本层面已与英伟达GB200 NVL72基本持平,部分测算情形下甚至略具优势。

这并不意味着英伟达的领先地位被动摇,但它清晰地表明,AI芯片竞争的核心评价体系,正从“谁算得更快”,转向“谁算得更便宜、更可持续”。当训练逐渐成为前期投入,而推理成为长期现金流来源,成本曲线的斜率,正在取代峰值算力,成为决定产业格局的关键变量。

一、从算力领先到成本效率,AI芯片的竞争标尺正在切换

在AI发展的早期阶段,训练算力几乎决定了一切。谁能更快训练出更大的模型,谁就拥有技术话语权。然而,随着大模型逐步进入部署与商业化阶段,推理负载开始远超训练本身,成本问题被迅速放大。

高盛指出,在这一阶段,芯片的性价比不再仅由单卡性能决定,而是由系统层面的效率共同塑造,包括算力密度、互联效率、内存带宽以及能源消耗等多重因素。基于这一逻辑构建的推理成本曲线显示,Google/Broadcom TPU在原始计算性能和系统效率上的进步,已经足以在成本维度上与英伟达正面竞争。

相比之下,AMD和亚马逊Trainium在实际成本下降幅度上仍较为有限。从现阶段测算结果看,两者的单位推理成本仍明显高于英伟达和Google方案,对主流市场的冲击相对有限。

二、TPU成本跃迁的背后,是系统工程能力而非单点突破

TPU v7实现大幅降本,并非来自单一技术突破,而是系统工程能力的集中释放。高盛认为,随着计算芯片自身逐步逼近物理极限,未来推理成本能否继续下降,将越来越依赖“计算相邻技术”的进步。

这些技术包括:更高带宽、更低延迟的网络互联;高带宽内存(HBM)和存储方案的持续集成;先进封装技术(如台积电CoWoS);以及机架级解决方案在密度与能效上的提升。TPU在这些方面的协同优化,使其在推理场景中展现出明显的经济性优势。

这一趋势也与谷歌自身的算力部署高度一致。TPU在Google内部工作负载中的使用比例持续上升,已广泛用于Gemini模型的训练与推理。同时,具备成熟软件能力的外部客户也在加速采用TPU方案,其中最引人注目的案例是Anthropic向Broadcom下达的价值约210亿美元订单,相关产品预计将在2026年中开始交付。

不过,高盛同时强调,英伟达仍然掌握“上市时间”优势。在TPU v7刚刚追平GB200 NVL72之际,英伟达已推进至GB300 NVL72,并计划在2026年下半年交付未来架构产品。持续的产品迭代节奏,仍是其维持客户黏性的关键筹码。

三、投资含义再平衡:ASIC崛起,但英伟达的护城河尚未被击穿

从投资视角看,高盛并未因TPU的快速追赶而下调对英伟达的判断。该机构仍维持对英伟达及Broadcom的买入评级,认为二者最直接绑定AI资本开支中最具可持续性的部分,并将长期受益于网络、封装和系统级技术升级。

在ASIC阵营中,Broadcom的受益逻辑尤为清晰。高盛已将对其2026财年每股收益预期上调至约10.87美元,较市场一致预期高出约6%,并认为市场仍低估了其在AI网络与定制计算领域的长期盈利能力。

AMD和亚马逊Trainium当前仍处于追赶阶段,但高盛也指出,AMD的机架级方案存在后发优势的可能性。预计在2026年末,基于其MI455X的机架方案有望在部分训练与推理场景中实现约70%的推理成本下降,值得持续跟踪。

更重要的是,这份研报给出的并非“赢家通吃”的结论,而是一幅逐渐清晰的产业分工图景:GPU继续主导训练与通用算力市场,而定制化ASIC在规模化、可预测的推理负载中不断渗透。在这一过程中,英伟达的CUDA生态与系统级研发投入仍构成坚实护城河,但其估值逻辑也将持续接受“推理成本下行”的现实检验。

当AI真正进入“每一个token都要算回报”的阶段,算力竞争终究要回到经济学本身。TPU成本大幅下降,并非一次简单的技术追赶,而是一次对AI商业模式可行性的关键压力测试。而这,或许正是GPU与ASIC之争背后,市场最应认真对待的信号。

来源:https://www.163.com/dy/article/KJQ2R7UB05198NMR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

PS6芯片流片成功 搭载PSSR 3光追性能大幅提升
游戏资讯
PS6芯片流片成功 搭载PSSR 3光追性能大幅提升

时间来到2026年中,关于索尼下一代游戏主机PlayStation 6的轮廓,正从各种行业传闻中变得日益清晰。 根据TCMF2及多家权威行业分析报告显示,PS6的核心定制芯片(APU)已于今年1月完成了首次流片。这枚芯片堪称未来主机的“性能心脏”。回顾索尼PlayStation系列主机的硬件开发历史

热心网友
05.17
北京君正自研CPU与NPU芯片已实现规模化应用
科技数码
北京君正自研CPU与NPU芯片已实现规模化应用

北京君正近日在投资者互动平台披露,其计算芯片产品已成功集成自主研发的CPU核心与NPU模块,该技术方案目前已在市场实现规模化落地应用。 这一信息明确了北京君正的核心技术战略:坚持关键IP的自研道路。在计算芯片领域,掌握自主的CPU与NPU架构,意味着企业在产品定义、性能调优与供应链安全方面获得了更高

热心网友
05.17
芯片股集体大涨再创历史新高
科技数码
芯片股集体大涨再创历史新高

科技股的热度,丝毫没有降温的迹象。 北京时间11日晚间,美股市场再次上演了熟悉的一幕:芯片股集体发力,费城半导体指数盘中一度飙升超过2%。英伟达、美光科技、高通、英特尔、AMD这些耳熟能详的名字,股价齐齐创下历史新高。与此同时,光通信板块也表现强劲,Lumentum涨幅超过10%,康宁涨超7%。市场

热心网友
05.17
理想汽车自研M100芯片发布 算力全球领先
科技数码
理想汽车自研M100芯片发布 算力全球领先

5月12日,理想汽车创始人兼CEO李想通过其个人社交平台正式官宣,发布了公司自主研发的AI芯片——马赫M100。这一动作标志着理想汽车在智能驾驶核心硬件领域迈出了关键一步。 李想在分享中指出,当前主流的车载芯片设计大多仍基于传统的冯·诺依曼架构。然而,随着人工智能时代的全面到来,海量的非结构化数据处

热心网友
05.16
云天励飞研发推理芯片采用3D堆叠存储技术
科技数码
云天励飞研发推理芯片采用3D堆叠存储技术

近日,云天励飞在最新披露的投资者交流纪要中,系统阐述了其面向下一代人工智能的推理芯片研发蓝图。该芯片的核心创新围绕其自主研发的GPNPU架构展开,旨在从底层系统性破解当前大模型在推理部署中普遍面临的效率瓶颈与高昂成本难题。其技术战略主要聚焦于四大关键维度。 一、GPGPU级通用编程能力:破解“易用性

热心网友
05.16

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Keychron Z11 Ultra 8K分体式Alice键盘5月13日上市
科技数码
Keychron Z11 Ultra 8K分体式Alice键盘5月13日上市

Keychron(渴创)即将发布全新旗舰级机械键盘Z11 Ultra 8K。官方宣布,这款备受期待的“铝坨坨”键盘将于5月13日在全平台正式上市。其核心设计亮点在于采用了创新的平面式分体结构,并基于无Fn区的紧凑型Alice人体工学配列。这种设计旨在显著提升长时间打字或编程的舒适度,通过更符合自然手

热心网友
05.17
Token与Session和Cookie的区别及在Web3中的应用解析
web3.0
Token与Session和Cookie的区别及在Web3中的应用解析

针对cookie、session和token的区别问题,提供了多个更口语化且符合搜索习惯的标题优化版本,包括直接提问式、场景式、详解清单式和简单直白式,旨在更直观地突出核心比较信息并控制标题长度。

热心网友
05.17
Arm客户两年内对AGI芯片需求突破20亿美元
科技数码
Arm客户两年内对AGI芯片需求突破20亿美元

Arm近期的发展势头持续强劲,在最新公布的2026财年第四季度财报会议中,公司披露了一项关键进展:客户对其首款自研处理器——Arm AGI CPU——在2027至2028财年期间的总需求预估已超过20亿美元。相比今年3月产品发布时的初期预期,这一数字增长超过一倍,反映出市场对Arm自研芯片的高度期待

热心网友
05.17
Cerebras AI芯片IPO获超20倍认购 拟上调发行价近30%
科技数码
Cerebras AI芯片IPO获超20倍认购 拟上调发行价近30%

资本市场对AI硬件的热情,似乎找到了一个新的焦点。路透社昨日援引知情人士消息称,AI芯片新锐Cerebras Systems即将进行的首次公开募股(IPO),获得了投资者的热烈追捧,超额认购倍数已突破20倍。根据资本信息平台Dealogic的数据,这桩IPO有望成为2026年以来全球规模最大的一笔。

热心网友
05.17
Token分类全解析:从功能型到治理型如何定义与区分
web3.0
Token分类全解析:从功能型到治理型如何定义与区分

加密货币代币主要分为实用型、证券型、支付型、治理型和资产型五大类。其分类依据核心功能与属性,如是否代表资产、提供使用权或参与治理等。区分标准需结合具体设计、经济模型及法律框架综合判断。

热心网友
05.17