最近的AI行业出现了一个颇为有趣的现象:一边高调宣发模型能力多强、工具多好用,另一边又因为算力吃不住,纷纷涨价或变相收紧服务。钉钉CEO最近有句话挺扎眼的——“只要被我看到这个文档是人写的,我肯定批评”。听起来很激进对吧?
但你再看阿里云Qwen这边的操作:先是Lite版下架不给续费,然后是Lite订阅直接停掉,接着200块/月的Pro订阅抢都抢不到,随后又传出Pro订阅也要下架的消息。最近推出的Token Plan,基本等于宣告Qwen要全面转向按量计费了。细看一下,尊享版1398的用量对标的是过去的Code Plan Pro,可价格呢?提价意图已经写在了脸上。
类似的戏码近期轮番上演。GitHub Copilot在4月20号调整了订阅政策:Copilot Pro直接移除了Opus系列(4.5、4.6、4.7),用户再也选不了;Copilot Pro+(月费约40美元)目前只保留了Opus 4.7;同时Student、Pro、Pro+的新订阅全部暂停。官方说辞是“提升服务可靠性和简化模型供应”,但真实原因大家都懂——agentic workflows带来的算力消耗翻着倍往上蹿,不收紧高端模型的访问根本扛不住。
更有意思的是,哪怕你已经付了钱,服务说变就变,而且看起来还真合法。GitHub的协议里白纸黑字写着类似条款,国内各大平台也如出一辙。高峰期限速、给你返回429简直是家常便饭。回想一下,这些订阅模式本质上跟健身房的年卡差不多,都算对赌协议。只不过谁也没想到技术普及的速度这么快,各家发现自己根本扛不住这Token消耗,怎么看都是血亏,于是不约而同地开始大幅收索。
如果你走的是API路线,道理一样。标准的SaaS协议三件套基本都包含:服务内容可以修改、功能可以调整;不承诺某个功能永久存在;第三方依赖可变。拿Qwen的Code Plan举例,你买的是“服务授权”,用量由平台控制,而不是你拥有了多少使用权。这就是为什么订阅了也能中途变卦的根源。
智谱GLM海外版Z.AI的Coding Plan最近也调整了协议,严格限制非代码场景的使用——说白了就是不让你在OpenClaw里用,非Coding场景会被严格限速,违规三次直接永久封禁。Claude Pro虽然还是每月20美元,但可用性已经明显下滑。在一些用户的实测里,Opus 4.7一次性做对的比率只有74.5%,而4.6能做到83.8%;每次修改需要的平均重试次数几乎翻了一倍。明面上没涨价,实际上却“降智”了,你的消耗自然水涨船高。
Google这边,需求爆炸之下优先保稳定,免费和低成本通道大幅缩水,免费层的配额削减了50%到80%,RPM、TPM、RPD全面收紧。Windsurf也涨了价:Pro从15美元涨到20美元,Teams从30美元每人每月涨到40美元。就在这种涨价和稳定性双重夹击之下,一度被吐槽的“Trae优速通”反而卖得不错,每月999块的权益居然有市场。只能说,大家的接受阈值正在悄然变化。
不只是订阅,算力产品同样在涨。阿里AI算力产品今年上调了5%到34%,DataWorks API免费额度大幅缩减,转为按量付费;百度智能云涨了5%到30%;腾讯云也上调了混元大模型API价格,后续AI算力产品再次跟进。回过头来看,当时被骂贵的小米MIMO,现在反倒显得有点性价比了?环境变化是真快。
当然,选AI服务不能只看价格,API的有效性和速度同样关键。有人做了不同平台Code Plan的速度测试,平台间的差距还是挺明显的。虽然光快也没用就是了。
总体来看,AI企业对订阅和服务的控制力相当到位。之前铺天盖地宣传的“AI裁员替代潮”,核心逻辑是用Token替代部分人力的成本来开源节流。但过去觉得“便宜”的印象,很大程度上是订阅制带来的错觉。如今价格一路上涨,稳定性也在承受考验,很多东西值得重新审视——毕竟一个员工的薪资是稳定的,还能背锅;而AI呢,动不动就要调整预期、申请加薪,高峰时还理直气壮地“429休息”,你连骂它两句都得算Token消耗……
最后想到一件事:前段时间OpenAI的奥特曼深情感谢老一辈程序员,感谢古法编程的开发者让OpenAI走到今天。结果评论区风向急转直下——大家显然不买账。
AI的浪潮当然还会继续向前。短期来看,底层算力和基础设施集体涨价、使用限制收紧的趋势已经很明显,高消耗场景比如Agent、Coding最终会被迫转向按量计费或更高阶的付费方案。这已经是正在发生的事实。至于长期,Token的价格或许还是会降下来?但眼下,大家也只能被这波大势裹挟着往前走罢了。
你现在用的是什么套餐?
