Google每分钟100万tokens免费送开发者？12万人围观后的真相_AI热点日报

6月28日，一条推文在开发者圈子里引发了热烈讨论： "Google casually giving developers 1M tokens per minute for free " 「Google 随随便便就给开发者免费送了每分钟100万tokens。」无需绑定信用卡，也无需订阅付费计划，只需打

6月28日，一条推文在开发者圈子里引发了热烈讨论：

"Google casually giving developers 1M tokens per minute for free"

「Google 随随便便就给开发者免费送了每分钟100万tokens。」

无需绑定信用卡，也无需订阅付费计划，只需打开Google AI Studio，短短几秒钟就能生成一个API Key，即刻上手使用。

这条帖子来自X平台用户@k2sbhai，并附上了一张AI Studio的Rate Limits（速率限制）截图。截至目前，该帖子已获得12.3万次浏览量、1440个点赞和2564次收藏。评论区里，有人疯狂标记好友准备去“薅羊毛”，也有人直接甩出两个字：Fake news。

那么，真相究竟是什么？

Google「白送」开发者每分钟 100 万 tokens？12 万人围观后，真相让人五味杂陈

▲ @k2sbhai 的原帖，展示了AI Studio的速率限制截图，浏览量已超12.3万

帖子究竟说了什么？

@k2sbhai 的帖子将核心卖点拆解为三个部分：

0美元你能得到什么——

Gemini 2.5 Flash 和 Pro 均可使用，每分钟享有100万tokens
原生支持文本、图像、音频、视频等多种模态输入
几秒钟即可生成API Key，开箱即用

为什么这很重要——

不再需要与其它平台严苛的免费额度限制周旋
无需为简单实验预先充值
直接使用官方服务，绕过第三方中间商

Pro tip（专业建议）——

利用 Flash 模型处理高吞吐量的批量任务，用 Pro 模型处理需要深度推理的复杂问题。通过两个模型的配合使用，可以最大化地利用免费额度。

听起来确实极具诱惑。然而，评论区的画风却完全是另一番景象。

质疑声浪：「我的 Dashboard 为什么和你的不一样？」

帖子发布几小时后，越来越多的反驳声音开始涌现。

用户 @magithar 直接贴出了自己的速率限制页面截图——上面的数字与帖子中的内容完全无法对应。

用户 @voy_aj 留言道：

"only include 20 request per day"

「每天仅有20次请求。」

@1petitbiscuit 的表述则更加具体：

TPM 250K + 20 RPD

这意味着每分钟25万tokens，每天最多20次请求。这与帖子宣称的“100万tokens随意使用”相差甚远。

还有巴西用户反映，在当地根本无法获取到任何额度。

甚至连平台自身的AI助手Grok也在同一帖子下回复，给出了一个相当中肯的评价：

"Solid for testing, not casual unlimited"

“用于测试足够了，但别指望能随意无限使用。”

Grok进一步指出：部分Flash模型确实能显示接近1M TPM（每分钟tokens数），但2.5 Flash通常的限额在250K TPM / 10 RPM左右。Pro模型的限制则更严格，每天可能仅有几十次请求。

所以，截图本身并非伪造。但显示的配额数值，会因账户类型、模型版本、所在地区，甚至项目不同而天差地别。

真实的免费配额到底是多少？

开发者社区里有人整理了各模型免费层（Free Tier）的实测数据汇总表。以下数据源自PE Collective 2026年的统计（具体请以个人AI Studio页面显示为准）：

Google「白送」开发者每分钟 100 万 tokens？12 万人围观后，真相让人五味杂陈

看出关键信息了吗？

能够达到1M TPM（每分钟tokens）的，是Gemini 2.0 Flash——这是上一代的轻量级模型。而2.5 Flash的TPM仅为25万，2.5 Pro更是只有15万。

真正限制日常使用的核心指标，藏在表格的最后一列：RPD，即每日请求数（Requests Per Day）。

例如，2.5 Pro 每天只能调用50次。即便每次请求仅消耗1000个token，一旦50次额度用完，就必须等到太平洋时间午夜重置。这样一来，你再高的TPM（每分钟tokens）也仅仅是纸面上的漂亮数字。

Google「白送」开发者每分钟 100 万 tokens？12 万人围观后，真相让人五味杂陈

▲ PE Collective 整理的 Gemini 免费层限额表，请注意 RPD（每日请求数）列的显著差异

Google 官方如何解释？

查阅Google的官方文档，关于速率限制（Rate Limits）的页面写得非常明确：

配额由三个关键维度共同控制——

RPM（Requests Per Minute）：每分钟的请求次数
TPM（Tokens Per Minute）：每分钟消耗的 token 总量
RPD（Requests Per Day）：每日请求的硬性上限

这三个维度，任意一个达到上限，API都会返回429错误（请求过多）。而且，限额是按照项目（Project）而非API Key来计算的，RPD（每日请求数）会在太平洋时间午夜自动重置。

文档中不断强调的核心信息是：配额会因为模型、账户状态、使用历史等因素动态变化，必须亲自登录AI Studio查看个人的实时配额。

这就完美解释了为什么十个人会看到十个不同的数字。Google从未在文档里承诺过一个固定的免费数值——它只是提供了一个控制面板，让你自己去查看。

Google「白送」开发者每分钟 100 万 tokens？12 万人围观后，真相让人五味杂陈

▲ Google Gemini API 官方文档，清晰阐述了三大配额维度

免费背后的代价：你的数据

翻到定价页面，在免费层（Free tier）的描述下方，有一行很容易被忽略的注释：

Content used to improve our products*

这行字意味着，免费用户的输入和输出内容，可能会被Google用于改进其模型。

而在付费层（Paid tier）的同一位置，标注的则是：Content not used to improve our products*（内容不会被用于改进产品）。

这正是Google免费策略中的隐藏条款。当你用Flash运行每一次请求、输入每一个prompt、生成每一段内容时，这些数据都可能成为Google训练数据的一部分。尽管官方声称可以勾选退出（opt out），但对于处理敏感数据的开发者来说，这是一个不容忽视的权衡。

Google「白送」开发者每分钟 100 万 tokens？12 万人围观后，真相让人五味杂陈

▲ Gemini API 定价页面，免费层明确标注数据可能被用于产品改进

Google 究竟在下什么棋？

向开发者慷慨发放高额API配额，Google的目的可以用三个字概括：抢生态。

先看看竞争对手的情况：

OpenAI：免费层的限制非常严格，大多数使用场景都需要绑定信用卡。
Anthropic：至今仍未面向个人开发者提供免费的API服务。
Groq / Together：虽然推理速度快，但免费配额较为有限。

Google的打法与二十年前推广Gmail时如出一辙——用远超竞争对手的免费容量吸引用户，等用户养成使用习惯后，再自然地引导他们升级到付费层。

具体来说，这套策略分三步走：

第一步，零门槛获客。无需信用卡，无需设置结算账户，只要有Google账号就能登录。一个独立开发者在周末有了灵感，三分钟内就能获取key并开始写代码。

第二步，养成依赖。为Flash模型提供充足的TPM（每分钟tokens）配额，让开发者的原型代码、agent框架、RAG管道全部运行在Gemini之上。当代码写完了，prompt调优好了，迁移到其它模型意味着大量的返工成本。

第三步，付费转化。当开发者的项目从原型走向生产环境，每天50次请求（RPD）显然不够用了。这时，付费层（Paid tier）就在旁边静静等候——提供更高的限额、上下文缓存（context caching）、Batch API五折优惠，还有一个关键卖点：你的数据不会被用于模型训练。

这套先占领再扩张（land and expand）的玩法，Google已经在Cloud、Workspace、Maps API等多个产品上反复验证过。

开发者现在该如何操作？

抛开帖子中夸大其词的成分，Google AI Studio提供的免费层（Free tier）确实值得申请。操作步骤非常简单：

打开官网aistudio.google.com
使用Google账号登录，并勾选同意相关条款
在左侧导航栏找到API Keys入口，生成你的专属key
选择合适的模型，开始调用API

Google「白送」开发者每分钟 100 万 tokens？12 万人围观后，真相让人五味杂陈

▲ Google AI Studio 首次进入时的界面，继续操作前需同意服务条款

几条实用的操作建议：

高频批量任务选用Flash。Flash系列的TPM和RPD（每日请求数）都远高于Pro，非常适合处理数据清洗、批量生成内容、简单的agent调度等任务。2.0 Flash提供的1M TPM + 1500 RPD组合，对于个人项目来说已经相当阔绰。

复杂推理任务选用Pro，但需精打细算。2.5 Pro每天仅有50次请求配额，建议将其留给真正需要长链推理或复杂分析的核心场景。一般的对话和内容生成任务，交给Flash模型处理就足够了。

警惕长上下文带来的配额消耗。Gemini支持高达1M token的上下文窗口，一次长上下文的请求就可能消耗掉数十万token的配额。如果你正在构建RAG（检索增强生成）应用或进行文档分析，控制单次输入的长度至关重要。

定期监控你的实际配额。请务必登录AI Studio的速率限制页面查看个人的实时限额，不要轻信任何第三方的截图。因为配额是动态调整的，今天看到的数字明天可能就会发生变化。

尽早准备备选方案（Plan B）。Google在页面底部也提示了——免费层的内容随时可能发生变更。当你的项目开始严重依赖免费API时，提前准备好付费迁移方案或备用的模型服务。

免费午餐确实存在，但并非想象中丰盛

让我们回到那条被12万人围观的推文。

@k2sbhai 说错了吗？也不完全错。AI Studio确实可以免费申请API Key，部分模型也的确拥有很高的TPM（每分钟tokens）额度，整个流程确实无需花费一分钱。

然而，“Flash和Pro都拥有1M TPM”的说法经不起推敲。真实情况是：2.0 Flash可以达到1M TPM，2.5 Flash通常为25万，而2.5 Pro只有15万。更重要的是，RPD（每日请求数）这一硬性限制，使得Pro模型在一天之内就会触及上限。

Google正在将AI API的实验门槛降至历史最低点。对于个人开发者而言，跑一个agent原型、做一次视频理解实验、搭建一条RAG管道，现在真的可以零成本启动。这在一年前还几乎难以想象。

只是别忘了——Google送出的每一个免费token，都在为它的生态布局买单。当免费配额未来某一天收紧时，你在Gemini上写下的每一行prompt、每一个function call、每一套agent架构，都将成为它巩固市场的护城河。

现在就去领取你的Key。趁它还是免费的。