近日科技圈最受关注的事件之一,便是谷歌在 AI Studio 平台上悄然调整了 Gemini API 的免费层配额——每分钟 100 万 token,无需额外申请,不绑定信用卡,也没有强制月费门槛。消息传出后,众多开发者纷纷第一时间进行实际测试。

每分钟百万 token 意味着什么?简单来说,足以支持数百个用户同时并发调用。对于个人开发者或小型团队而言,无论是构建产品原型还是运行自动化工具,基本无需再为算力费用担忧。此前,同等规模的算力每月成本高达数千美元。谷歌此举相当于完全敞开了大门。
根据官方公开规则,免费额度覆盖 Gemini 2.5 全系列模型:包括主打低延迟、高并发的 Flash 版本,以及适用于复杂推理、长文档分析的 Pro 版本。同时支持原生多模态输入,可同时处理文本、图片、音频及长视频内容。API 密钥注册后数秒即可生成,流程极为顺畅。
已有开发者分享了最大化利用免费额度的方案:将任务拆解,高并发的普通请求使用 Flash 模型,而长文档分析、代码编写、复杂逻辑推理等任务则交给 Pro 模型,从而避免算力浪费。这一思路非常实用,因为两种模型定位不同,合理搭配才能充分发挥免费额度的价值。
开通流程极为简便,全程不超过一分钟:
直接访问谷歌开发者AI官网 https://ai.google.dev
使用普通谷歌账号直接登录
在Playground界面中根据需求选择对应模型
生成API密钥后即可直接调用
此次调整公布后,开发者群体的反应呈现两极分化。
部分开发者已开始利用免费额度开展项目。有开发者提到,自己正在开发一款解决本地痛点的安卓应用,此前因算力成本受限,如今免费额度完全够用。另有开发者实测后表示,Gemini 2.5 的上下文窗口远大于同类产品,使用体验优于 Claude。不少网友调侃,巨头竞争的红利期,先拿资源再说——话糙理不糙。
当然,质疑与提醒的声音同样不少。有人直接表示信息不实(实际上官网规则已更新),也有人指出免费层的用户数据可能被谷歌用于模型训练。还有开发者提醒,这种大幅度的免费政策本质上是窗口期,谷歌有权根据服务器压力随时调整规则。用于原型开发、验证想法完全可行,但如果要投入生产环境,务必提前准备付费用量方案,并备好其他模型的备用通路。毕竟“客户演示当天掉链子,比算力成本贵多了”。也有网友认为 Gemini 2.5 版本较老,与现有新模型相比缺乏竞争力,免费额度再高也无济于事。还有人直言免费服务性能没有保障,无法胜任正经工作。不过话说回来,有羊毛就得薅,搭配一个优秀的多层智能网关兜底,上述问题便不再是问题。
从行业角度来看,随着国产开源低价模型日益增多,作为闭源第三的 Gemini 处境确实不容乐观。谷歌此次放出如此大的免费额度,或许是为了拉动 token 增长而采取的不得已之举。但对开发者而言,这一波红利窗口期,能抓住就不要错过。
