GPT-5.5翻倍Gemini涨3倍涨价潮还能持续多久

时间：2026-05-29 14:29

前沿大模型的涨价游戏，还能玩多久？今年1月至今，GPU租赁价格暴涨超过两倍。 Counterpoint在2月发布的《内存价格追踪报告》又补了一刀：2026年第一季度内存价格环比飙升80%-90%，创下历史罕见的涨幅。上游的成本压力，自然而然就传递到了下游。Epoch AI在最新发布的《梯度更新》

前沿大模型的涨价游戏，还能玩多久？

今年1月至今，GPU租赁价格暴涨超过两倍。

Counterpoint在2月发布的《内存价格追踪报告》又补了一刀：2026年第一季度内存价格环比飙升80%-90%，创下历史罕见的涨幅。

上游的成本压力，自然而然就传递到了下游。Epoch AI在最新发布的《梯度更新》报告里，干了一件事：把全球所有Blackwell芯片能处理的Token数量算出来，再和实际需求做对比。结论只有一个字——不够。

Token洪流吞没一切

先看供给侧。

Epoch AI的模型以Kimi K2.6为基准——一个万亿参数、320亿活跃参数的MoE架构。

在8000:1000的输入输出比下，全球所有Blackwell集群的理论极限是每秒大约200亿输出Token。

听起来很吓人？换算一下就明白了：这相当于全球每个人每月能用上700万Token。

但这只是理想情况。一旦上下文窗口拉到128k，吞吐量会直接暴跌50倍，降到每秒约5亿Token。

再转到需求侧。

Google刚刚披露，自家平台每秒处理约12亿Token（输入+输出）。按8k:1k请求比例换算，每秒输出Token大约1.3亿。Exponential View估算，Google的Token需求大概占全球总量的25%。

这意味着什么？当前全球Token需求，如果用Blackwell的全力来跑，全部用来喂给昂贵的万亿参数模型，勉强能应付得来。

但需求在以什么速度增长？每年10倍。

自2024年以来，Google处理的Token量每年翻10倍，其他供应商也差不多是这个节奏。

供给侧呢？全球AI算力年增3.4倍，芯片内存带宽年增4.1倍。

供给3.4倍 vs 需求10倍。这把剪刀差，每年都在无情地撕扯。

Meta员工一天烧100万Token

算力紧缺不是抽象的数字游戏，看看企业内部正在发生什么。

据The Information报道，Meta的8.5万名员工每月消耗60万亿Token。

换算下来，每位员工每天烧掉大约100万输出Token。

Apple更生猛。部分工程团队被允许每天在Token上花费300美元——按Kimi K2.6的价格算，够一个人一天生成2500万输出Token。

这还只是两家公司。全球大约有1400万软件工程师每天都在用AI。如果他们的使用强度达到Meta或Apple员工的级别，全球Token吞吐需求将飙升至每秒2亿到40亿Token。40亿。而Blackwell在长上下文场景下的极限是5亿——差了整整一个数量级。

Claude Code让开发者慢了19%

更尴尬的事情也在发生。

METR的最新研究显示，Claude Code在实测中让资深开发者的完成速度慢了19%。VS Code相关插件的安装增速自年初以来明显趋平。

编码工具增长放缓，背后可能是两个原因叠加：算力资源本身在吃紧，很多企业已经烧完了全年的AI预算。

与之形成鲜明对比的是，前沿模型还在涨价。ChatGPT Pro订阅价格上调，Claude的API价格水涨船高，Gemini的涨幅最凶——部分场景下价格暴涨3倍。GPT-5.5的定价更是直接翻倍。

用得更多，花得更贵，效果却未必更好。企业的算盘很快就打清楚了。

逃向DeepSeek

一条逃跑路线已经成型。DeepSeek V3的训练成本仅为前沿模型的1/10到1/20，API价格低至同类的1/16。

性能呢？直逼GPT-5。

Hacker News上最近有个帖子火了：一套11个月ROI模型，手把手教企业算清楚——从GPT-5.5切到DeepSeek，每年能省多少钱。

评论区的共识很简单：前沿模型的定价权正在崩塌。当一个开源模型能用1/16的价格跑出90%的效果时，涨价不再是信心的体现，而是客户流失的翻跟斗。

Tokenmaxxing——企业疯狂堆Token用量来榨取AI价值——本来是前沿模型的增长叙事。但现在，The Information的报道显示，这种策略正在反噬AI公司自身的利润边际。用户越多，亏得越多。涨价止血，用户就跑。经典的死亡螺旋。

算力悬崖前的决赛格局

把视角拉远一点。前沿实验室——OpenAI、Anthropic、Google DeepMind——仅占全球AI算力的20%-30%。剩下的70%-80%在企业自用、云服务商、推理服务商手里。这意味着，即便是最顶尖的实验室，也无法靠自建算力解决供需缺口。它们和所有人一样，在争抢同一批芯片。

算力每年增3.4倍，需求每年增10倍。这个剪刀差不会自动消失。更小的模型确实在替代部分需求——蒸馏层的崛起证明了这一点；但能力提升又在不断制造新需求。AI行业正站在一个悬崖边上。不是技术的悬崖，模型还在变强；是经济的悬崖，算不过来账了。

当GPU租金翻倍、API价格暴涨、开源替代品性能逼近、编码工具的ROI被质疑，一个核心问题浮出水面：前沿模型的护城河，到底是智能，还是算力？如果答案是算力，那么谁控制芯片，谁就控制AI的未来。如果答案是智能，那么DeepSeek用1/16的价格逼近同等效果，已经在动摇这个答案。

来源：https://36kr.com/p/3828666972492680

Gemini

上一篇戴尔科技端到端创新助力企业重构AI时代竞争力 下一篇30-40万级家用混动SUV大六座安全智能全盘点

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-01

诺基亚TA-1619入网：1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息，一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可，不过证件照目前还没公布。从入网信息来看，这是一款TD-LTE数字移动电话机，支持TD-LTE网络，属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持，终端款式为直板。核心配置方面，电池额定容

业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片，采用直接变频架构，覆盖10MHz至7250MHz频段，支持最大450MHz带宽及JESD204B高速接口，性能对标国际，满足5G基站与卫星通信等高端需求，突破海外技术壁垒。

业界动态 · 2026-07-01

月起私人充电桩可卖电每度净赚5毛

近期有一则重大利好消息，值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起，湖北武汉的新能源车主，可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言，就是借助峰谷电价差，实现低买高卖，每度电净收益约5毛钱。过去，车网互动（V2G）基本只局限于特定的公共充电站，受试点规模限制，

业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息：谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息，Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发，实际上它的技术代号是Gemini 3 1 Flash Lite Image，属于Gemini 3 1家族。最大的卖点就两个：快，便

业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行，来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴，以主板、显示器等专业硬件保障比赛稳定流畅，并通过赛事反哺研发的闭环模式支持电竞发展。