近日,谷歌AI开发平台Antigravity的用户社区中,一项反馈引起了广泛关注:许多开发者在处理基础编程任务时,发现模型消耗的Token(额度)偏高,认为其成本效益有待提升。这一用户体验问题迅速得到了谷歌官方的重视。
针对此反馈,谷歌近日快速响应,为Antigravity平台新增了一个模型选项——Gemini 3.5 Flash (Low)。该版本的核心定位即为“高效节能”。其技术路径并非通过缩减系统提示或上下文长度来实现,而是创新性地调整了模型内部的“推理投入强度”。在面对相对简单的软件工程问题时,模型能够智能降低计算复杂度,从而大幅减少Token用量。

那么,其实际效能如何?根据谷歌发布的测试数据,在处理同类任务时,此Low版本消耗的Token数量较标准的Medium版本平均降低了约45%。尤为重要的是,在实现显著节能的同时,其在多数软件工程任务上的性能表现,通常超越了早期的Gemini 1.5 Flash模型。这为开发者带来了明确的优势:以更低的资源成本,获取相当乃至更优的代码生成与问题解决效果。
除了上线新模型,谷歌还同步实施了一项利好政策:重置了所有免费及付费Gemini计划的API调用配额。这意味着,无论是进行体验的免费用户,还是依赖API进行深度开发的付费用户,本周都将获得全新的额度,足以支持当前的项目开发需求。这套“优化工具+补充资源”的组合策略,精准地回应了开发者社区近期的核心关切。
Antigravity平台负责人、Google DeepMind总监Varun Mohan也对此进行了说明。他确认,团队正是在收到用户关于“简单任务资源消耗过高”的集中反馈后,加速研发并推出了此优化版本。由此可见,在AI开发工具日益普及的当下,如何让强大的模型能力实现更高的“经济适用性”,已成为平台优化与开发者体验提升的关键方向。
