谷歌Gemini 3 Flash重磅发布：新模型速度更快、定价更低

美东时间12月17日，谷歌官宣推出Gemini 3家族的新成员Gemini 3 Flash。这款主打快速高效的新模型发布当天即取代Gemini 2 5 Flash成为Gemini App的默认模型，

美东时间12月17日，谷歌正式推出Gemini 3家族的新成员Gemini 3 Flash。这款主打快速高效的全新模型一经发布，就立即替代了Gemini 2.5 Flash，成为Gemini App的默认模型，同时也被设定为谷歌搜索AI模式的默认驱动系统。

据介绍，Gemini 3 Flash在多项基准测试中都展现出不输甚至超越更大模型的实力。在SWE-bench Verified基准测试中，其解题准确率达到了78%，仅次于GPT-5.2的80%，不仅超越了Gemini 2.5系列，甚至优于同门的Gemini 3 Pro（Pro的准确率为76.2%）。

此外，3 Flash集成了前沿的智能技术，速度更快，价格却远低于同类竞品。它基于3 Pro强大的多模态、编码和智能体功能，在价格不到3 Pro四分之一的情况下，提供了更强大的性能和更高的速率上限。新款3 Flash在多项基准测试中的表现都超越了2.5 Pro，响应速度也显著提升。模型还配备了业界领先的视觉与空间推理功能，并新增了代码执行能力，可用于缩放、计数和编辑视觉输入。

在Gemini API和Vertex AI中，Gemini 3 Flash的定价为每百万个输入令牌0.50美元，每百万个输出令牌3美元（音频输入仍为每百万个输入令牌1美元）。它标配上下文缓存功能，在令牌重复使用超过特定阈值时，可节省90%以上的成本。同样，3 Flash目前也适用于Batch API，能节省约50%的成本，并大幅提高异步处理的速率上限。对于同步和近实时用例，付费API客户还可以使用面向生产级别的速率限制。

谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi表示，谷歌将Flash定位为“老黄牛”式的模型。该模型保持了接近Gemini 3 Pro的推理能力，同时运行速度达到Gemini 2.5 Pro的三倍，成本却只有Gemini 3 Pro的四分之一。

在博士级推理和知识基准GPQA Diamond上，Gemini 3 Flash的得分高达90.4%。虽然略低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%，但其他竞争对手的得分均未达到90%。