上周,谷歌悄无声息地给Gemini换了一套新的限额机制,结果直接炸了锅。
大批订阅用户刚聊没几轮,屏幕就跳出提示:“您已达到当前用量限额,请等待刷新。”Linux论坛、Reddit、知乎上的讨论瞬间炸成了一片。之前Gemini的限额逻辑很简单:按条数算,按天刷新。免费用户每天5条,Pro用户每天100条。不管你是问“今天天气怎么样”,还是扔一句“帮我开发一个网页游戏”,统统算一条。多花钱就能多用,逻辑直白,谁也不吃亏。
但,现在不是了。
改成了**算力消耗制**。
从5月20号起,Gemini正式切换到基于算力消耗的计费逻辑。你发一句“帮我翻译这段话”,和你说一句“帮我用Python写一个爬虫”,消耗的额度完全不同。系统会综合你的prompt复杂度、对话长度、调用了什么功能,然后动态扣除相应额度。文字对话扣得少,写代码、生成视频扣得多。但问题在于——你到底消耗了多少额度?谷歌没说。官方原话是“限制触发速度取决于模型类型及功能负载”。也就是说,用户连用了多少token、某个代码请求吃掉多少算力,都无从知晓。Gemini也开始学另外两家玩起了“不告诉你确切数字”的戏码。
不仅如此,**限额的刷新机制也变了**。双重限额同时上线:第一层是5小时滚动窗口,用完额度得等5小时才刷新;第二层是每周总量上限,一旦这周的总消耗到顶了,只能等下周重置。两把锁一起关上,卡得不只是免费用户,付费的订阅用户首当其冲——上线第一天,不少Pro用户就撞上了限额。
知乎上那条“如何评价Gemini于2026年5月17日实行的新限额形式?”的话题,一天之内暴涨了几十万热度。有网友吐槽说自己是Pro用户,5小时limit大概只够跑3个低质量视频+2个低质量图片+5个简单问题的Pro extend,用完之后就被直接降级到低配的Flash-lite模型。还有人说,5小时limit要支撑20-30个非复杂问题;如果混进图片,数量会立刻降到20个左右。
但限额还不是最让用户破防的操作。
打开Gemini官网的套餐页面,能看到8美金/月的Plus用户,用量是免费用户的2倍;20美金/月的Pro用户是免费用户的4倍。等等?之前Pro用户可是免费版的33倍,Ultra更是免费版的166倍,最起码能让你畅通无阻地使用。现在花8美元只拿到2倍量,花20美元只拿到4倍,付费用户直接变小丑了——还不如多注册两个免费账号。
上线之后,舆论急速失控。不止Gemini,谷歌家的AI编程产品Antigra vity那边,一样被骂得狗血淋头。新的算力消耗制实施后,Pro用户发现5条对话就能烧掉50%的5小时额度,连续聊上10分钟也会撞上限额。大批用户吵着要退订。因为同样的花费,服务质量明显降级了。更麻烦的是,Flash和Pro模型的额度被合并进了同一个池子,限额感知变得更强。
可能有人不太了解Antigra vity。它是谷歌家的AI编程产品,有IDE和CLI两种形态。一个很大的卖点是:你订阅了谷歌的Pro或Ultra套餐之后,不仅能直接用Gemini,还能无缝切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型,不用额外付费,不用管API,直接就能用上Claude家的模型。很多人就是冲着20美金用上Claude Opus来的。但问题是,所有模型共享同一个额度池。实际上,Antigra vity的限额收紧比Gemini早得多,从去年12月就开始了。到2026年3月,已经有用户发现高级模型的刷新周期悄悄从5小时变成了按周——之前还能5小时一刷,现在得等一周。
紧接着,谷歌两天内连着加了两轮3倍额度来平息怒火。但网友对Gemini到底降了多少额度做了详细总结,结论一致:还是比以前少得多。
如果你以为只有谷歌一家在抠,那就大错特错了。
往旁边看一眼,OpenAI和Anthropic也在干类似的事。今年4月,Codex从按消息收费改成了按token计费加积分制,Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用,逻辑跟谷歌几乎一模一样。Claude那边,也把Agent SDK、GitHub Actions这些产品从订阅额度里拆出来了,单独走月度积分。三家几乎步调一致:从“交月费随便用”走到“交月费只是起步价,用多少算多少”。超过一半以上的头部大模型公司都已经在用按量计费或混合定价,AI订阅早就变成了云账单的逻辑。
为什么?因为算力是真的不够用。
谷歌自己造TPU,按理说应该不缺资源,而且它还是竞争对手的算力供应商——跟Anthropic签了400亿美元的TPU供应合同。可即便如此,谷歌自己的DeepMind研究团队还是得排队等算力,核心研究员因为受不了这种资源挤压而出走。这波“叛变”的不是谷歌,是整个AI订阅模式的蜜月期——结束了。
**参考文献** [1] Google Antigra vity Plans: `https://antigra vity.google/docs/plans` [2] OpenAI Help, using Codex with your ChatGPT plan: `https://help.openai.com/en/articles/20001106` [3] Anthropic, Higher limits for Claude Code with SpaceX Colossus: `https://www.anthropic.com/news/higher-limits-spacex` [4] Claude Support, use the Claude Agent SDK with your Claude plan: `https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan` [6] linux.do, Ultra 3 小时后 5h 额度剩 20%: `https://linux.do/t/topic/1760337` [7] linux.do, 3x 补丁被质疑“先缩水再补”: `https://linux.do/t/topic/2219076/11` [8] linux.do, 周限触发后刷新变 4 天: `https://linux.do/t/topic/1538942/5` [9] linux.do, rate limits / quota / token 池换算讨论: `https://linux.do/t/topic/2219076`