Gemini付费用户遭背叛，权益受损成笑话

时间：2026-06-06 16:27

Gemini也叛变了，付费用户变小丑上周，谷歌悄无声息地给Gemini换了一套新的限额机制，结果直接炸了锅。大批订阅用户刚聊没几轮，屏幕就跳出提示：“您已达到当前用量限额，请等待刷新。”Linux论坛、Reddit、知乎上的讨论瞬间炸成了一片。之前Gemini的限额逻辑很简单：按条数算，按天

# Gemini也叛变了，付费用户变小丑

上周，谷歌悄无声息地给Gemini换了一套新的限额机制，结果直接炸了锅。

大批订阅用户刚聊没几轮，屏幕就跳出提示：“您已达到当前用量限额，请等待刷新。”Linux论坛、Reddit、知乎上的讨论瞬间炸成了一片。之前Gemini的限额逻辑很简单：按条数算，按天刷新。免费用户每天5条，Pro用户每天100条。不管你是问“今天天气怎么样”，还是扔一句“帮我开发一个网页游戏”，统统算一条。多花钱就能多用，逻辑直白，谁也不吃亏。

但，现在不是了。

改成了**算力消耗制**。

从5月20号起，Gemini正式切换到基于算力消耗的计费逻辑。你发一句“帮我翻译这段话”，和你说一句“帮我用Python写一个爬虫”，消耗的额度完全不同。系统会综合你的prompt复杂度、对话长度、调用了什么功能，然后动态扣除相应额度。文字对话扣得少，写代码、生成视频扣得多。但问题在于——你到底消耗了多少额度？谷歌没说。官方原话是“限制触发速度取决于模型类型及功能负载”。也就是说，用户连用了多少token、某个代码请求吃掉多少算力，都无从知晓。Gemini也开始学另外两家玩起了“不告诉你确切数字”的戏码。

不仅如此，**限额的刷新机制也变了**。双重限额同时上线：第一层是5小时滚动窗口，用完额度得等5小时才刷新；第二层是每周总量上限，一旦这周的总消耗到顶了，只能等下周重置。两把锁一起关上，卡得不只是免费用户，付费的订阅用户首当其冲——上线第一天，不少Pro用户就撞上了限额。

知乎上那条“如何评价Gemini于2026年5月17日实行的新限额形式？”的话题，一天之内暴涨了几十万热度。有网友吐槽说自己是Pro用户，5小时limit大概只够跑3个低质量视频+2个低质量图片+5个简单问题的Pro extend，用完之后就被直接降级到低配的Flash-lite模型。还有人说，5小时limit要支撑20-30个非复杂问题；如果混进图片，数量会立刻降到20个左右。

但限额还不是最让用户破防的操作。

打开Gemini官网的套餐页面，能看到8美金/月的Plus用户，用量是免费用户的2倍；20美金/月的Pro用户是免费用户的4倍。等等？之前Pro用户可是免费版的33倍，Ultra更是免费版的166倍，最起码能让你畅通无阻地使用。现在花8美元只拿到2倍量，花20美元只拿到4倍，付费用户直接变小丑了——还不如多注册两个免费账号。

上线之后，舆论急速失控。不止Gemini，谷歌家的AI编程产品Antigra vity那边，一样被骂得狗血淋头。新的算力消耗制实施后，Pro用户发现5条对话就能烧掉50%的5小时额度，连续聊上10分钟也会撞上限额。大批用户吵着要退订。因为同样的花费，服务质量明显降级了。更麻烦的是，Flash和Pro模型的额度被合并进了同一个池子，限额感知变得更强。

可能有人不太了解Antigra vity。它是谷歌家的AI编程产品，有IDE和CLI两种形态。一个很大的卖点是：你订阅了谷歌的Pro或Ultra套餐之后，不仅能直接用Gemini，还能无缝切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型，不用额外付费，不用管API，直接就能用上Claude家的模型。很多人就是冲着20美金用上Claude Opus来的。但问题是，所有模型共享同一个额度池。实际上，Antigra vity的限额收紧比Gemini早得多，从去年12月就开始了。到2026年3月，已经有用户发现高级模型的刷新周期悄悄从5小时变成了按周——之前还能5小时一刷，现在得等一周。

紧接着，谷歌两天内连着加了两轮3倍额度来平息怒火。但网友对Gemini到底降了多少额度做了详细总结，结论一致：还是比以前少得多。

如果你以为只有谷歌一家在抠，那就大错特错了。

往旁边看一眼，OpenAI和Anthropic也在干类似的事。今年4月，Codex从按消息收费改成了按token计费加积分制，Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用，逻辑跟谷歌几乎一模一样。Claude那边，也把Agent SDK、GitHub Actions这些产品从订阅额度里拆出来了，单独走月度积分。三家几乎步调一致：从“交月费随便用”走到“交月费只是起步价，用多少算多少”。超过一半以上的头部大模型公司都已经在用按量计费或混合定价，AI订阅早就变成了云账单的逻辑。

为什么？因为算力是真的不够用。

谷歌自己造TPU，按理说应该不缺资源，而且它还是竞争对手的算力供应商——跟Anthropic签了400亿美元的TPU供应合同。可即便如此，谷歌自己的DeepMind研究团队还是得排队等算力，核心研究员因为受不了这种资源挤压而出走。这波“叛变”的不是谷歌，是整个AI订阅模式的蜜月期——结束了。

**参考文献** [1] Google Antigra vity Plans: `https://antigra vity.google/docs/plans` [2] OpenAI Help, using Codex with your ChatGPT plan: `https://help.openai.com/en/articles/20001106` [3] Anthropic, Higher limits for Claude Code with SpaceX Colossus: `https://www.anthropic.com/news/higher-limits-spacex` [4] Claude Support, use the Claude Agent SDK with your Claude plan: `https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan` [6] linux.do, Ultra 3 小时后 5h 额度剩 20%: `https://linux.do/t/topic/1760337` [7] linux.do, 3x 补丁被质疑“先缩水再补”: `https://linux.do/t/topic/2219076/11` [8] linux.do, 周限触发后刷新变 4 天: `https://linux.do/t/topic/1538942/5` [9] linux.do, rate limits / quota / token 池换算讨论: `https://linux.do/t/topic/2219076`

来源：https://cloud.tencent.com.cn/developer/article/2682850

Gemini