游乐游手机版
首页/业界动态/文章详情

GPT-5.5翻倍Gemini涨3倍 涨价潮还能持续多久

时间:2026-05-29 14:29
前沿大模型的涨价游戏,还能玩多久? 今年1月至今,GPU租赁价格暴涨超过两倍。 Counterpoint在2月发布的《内存价格追踪报告》又补了一刀:2026年第一季度内存价格环比飙升80%-90%,创下历史罕见的涨幅。 上游的成本压力,自然而然就传递到了下游。Epoch AI在最新发布的《梯度更新》

前沿大模型的涨价游戏,还能玩多久?

今年1月至今,GPU租赁价格暴涨超过两倍。

Counterpoint在2月发布的《内存价格追踪报告》又补了一刀:2026年第一季度内存价格环比飙升80%-90%,创下历史罕见的涨幅。

上游的成本压力,自然而然就传递到了下游。Epoch AI在最新发布的《梯度更新》报告里,干了一件事:把全球所有Blackwell芯片能处理的Token数量算出来,再和实际需求做对比。结论只有一个字——不够。

Token洪流吞没一切

先看供给侧。

Epoch AI的模型以Kimi K2.6为基准——一个万亿参数、320亿活跃参数的MoE架构。

在8000:1000的输入输出比下,全球所有Blackwell集群的理论极限是每秒大约200亿输出Token。

听起来很吓人?换算一下就明白了:这相当于全球每个人每月能用上700万Token。

但这只是理想情况。一旦上下文窗口拉到128k,吞吐量会直接暴跌50倍,降到每秒约5亿Token。

再转到需求侧。

Google刚刚披露,自家平台每秒处理约12亿Token(输入+输出)。按8k:1k请求比例换算,每秒输出Token大约1.3亿。Exponential View估算,Google的Token需求大概占全球总量的25%。

这意味着什么?当前全球Token需求,如果用Blackwell的全力来跑,全部用来喂给昂贵的万亿参数模型,勉强能应付得来。

但需求在以什么速度增长?每年10倍。

自2024年以来,Google处理的Token量每年翻10倍,其他供应商也差不多是这个节奏。

供给侧呢?全球AI算力年增3.4倍,芯片内存带宽年增4.1倍。

供给3.4倍 vs 需求10倍。这把剪刀差,每年都在无情地撕扯。

Meta员工一天烧100万Token

算力紧缺不是抽象的数字游戏,看看企业内部正在发生什么。

据The Information报道,Meta的8.5万名员工每月消耗60万亿Token。

换算下来,每位员工每天烧掉大约100万输出Token。

Apple更生猛。部分工程团队被允许每天在Token上花费300美元——按Kimi K2.6的价格算,够一个人一天生成2500万输出Token。

这还只是两家公司。全球大约有1400万软件工程师每天都在用AI。如果他们的使用强度达到Meta或Apple员工的级别,全球Token吞吐需求将飙升至每秒2亿到40亿Token。40亿。而Blackwell在长上下文场景下的极限是5亿——差了整整一个数量级。

Claude Code让开发者慢了19%

更尴尬的事情也在发生。

METR的最新研究显示,Claude Code在实测中让资深开发者的完成速度慢了19%。VS Code相关插件的安装增速自年初以来明显趋平。

编码工具增长放缓,背后可能是两个原因叠加:算力资源本身在吃紧,很多企业已经烧完了全年的AI预算。

与之形成鲜明对比的是,前沿模型还在涨价。ChatGPT Pro订阅价格上调,Claude的API价格水涨船高,Gemini的涨幅最凶——部分场景下价格暴涨3倍。GPT-5.5的定价更是直接翻倍。

用得更多,花得更贵,效果却未必更好。企业的算盘很快就打清楚了。

逃向DeepSeek

一条逃跑路线已经成型。DeepSeek V3的训练成本仅为前沿模型的1/10到1/20,API价格低至同类的1/16。

性能呢?直逼GPT-5。

Hacker News上最近有个帖子火了:一套11个月ROI模型,手把手教企业算清楚——从GPT-5.5切到DeepSeek,每年能省多少钱。

评论区的共识很简单:前沿模型的定价权正在崩塌。当一个开源模型能用1/16的价格跑出90%的效果时,涨价不再是信心的体现,而是客户流失的翻跟斗。

Tokenmaxxing——企业疯狂堆Token用量来榨取AI价值——本来是前沿模型的增长叙事。但现在,The Information的报道显示,这种策略正在反噬AI公司自身的利润边际。用户越多,亏得越多。涨价止血,用户就跑。经典的死亡螺旋。

算力悬崖前的决赛格局

把视角拉远一点。前沿实验室——OpenAI、Anthropic、Google DeepMind——仅占全球AI算力的20%-30%。剩下的70%-80%在企业自用、云服务商、推理服务商手里。这意味着,即便是最顶尖的实验室,也无法靠自建算力解决供需缺口。它们和所有人一样,在争抢同一批芯片。

算力每年增3.4倍,需求每年增10倍。这个剪刀差不会自动消失。更小的模型确实在替代部分需求——蒸馏层的崛起证明了这一点;但能力提升又在不断制造新需求。AI行业正站在一个悬崖边上。不是技术的悬崖,模型还在变强;是经济的悬崖,算不过来账了。

当GPU租金翻倍、API价格暴涨、开源替代品性能逼近、编码工具的ROI被质疑,一个核心问题浮出水面:前沿模型的护城河,到底是智能,还是算力?如果答案是算力,那么谁控制芯片,谁就控制AI的未来。如果答案是智能,那么DeepSeek用1/16的价格逼近同等效果,已经在动摇这个答案。

来源:https://36kr.com/p/3828666972492680
上一篇戴尔科技端到端创新助力企业重构AI时代竞争力 下一篇30-40万级家用混动SUV大六座安全智能全盘点
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起
业界动态 · 2026-05-29

九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起

九号发布N1机甲风电动车系列,三款起售价3499元。N170极速47km h,轻量化车架;N185极速55km h,可选模拟声浪;旗舰N190极速60km h,标配模拟声浪及双通道ABS,7月上市。

九号2026新品发布会最强阵容连发4款新车重新定义好车标准
业界动态 · 2026-05-29

九号2026新品发布会最强阵容连发4款新车重新定义好车标准

九号公司发布2026年新品,推出N1、M1、M3及Fz5四款新车,覆盖电摩与电自领域。N1主打短轴距声光电酷玩体验,M1配备双通道ABS与100公里真续航,M3下放AXC车架技术,Fz5首搭载双向转把功能。同时推出3年原厂换新质保等用户权益。

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军
业界动态 · 2026-05-29

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军

5月29日,世界超级摩托车锦标赛(WSBK)阿拉贡站传来一则引人瞩目的消息——中国摩托车制造商“张雪机车”旗下的法国车手瓦伦丁·德比斯,在WorldSSP组别的超级杆位赛中成功夺得第二名。 先简要科普一下赛事背景:世界超级摩托车锦标赛(WSBK)是由国际摩托车联合会于1988年创立的顶级公路摩托车赛

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文
业界动态 · 2026-05-29

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文

英雄联盟海克斯大乱斗将在26 12版本移除羁绊系统,上线技能符文体系。该符文能重构技能释放逻辑,实现布里茨钩五人、拉克丝定全队等效果。部分原有羁绊效果转为独立专属符文,更新预计2026年6月中旬登陆国服。

领克10/10+正式上市限时价16.99-23.59万号称弯道之王
业界动态 · 2026-05-29

领克10/10+正式上市限时价16.99-23.59万号称弯道之王

```html 5月29日晚间,领克终于将其备受关注的中大型运动纯电轿车正式推向市场——领克10与领克10+同步上市,官方直接打出“弯道之王”的旗号。我们先不深究它是否真能“弯道超车”,单从价格来看,就已经颇具冲击力。 先奉上一张价格速览表,让大家心里有个底: 领克 10 701 长续航 Max:指