美东时间12月17日,谷歌正式推出Gemini 3家族的新成员Gemini 3 Flash。这款主打快速高效的全新模型一经发布,就立即替代了Gemini 2.5 Flash,成为Gemini App的默认模型,同时也被设定为谷歌搜索AI模式的默认驱动系统。
据介绍,Gemini 3 Flash在多项基准测试中都展现出不输甚至超越更大模型的实力。在SWE-bench Verified基准测试中,其解题准确率达到了78%,仅次于GPT-5.2的80%,不仅超越了Gemini 2.5系列,甚至优于同门的Gemini 3 Pro(Pro的准确率为76.2%)。

此外,3 Flash集成了前沿的智能技术,速度更快,价格却远低于同类竞品。它基于3 Pro强大的多模态、编码和智能体功能,在价格不到3 Pro四分之一的情况下,提供了更强大的性能和更高的速率上限。新款3 Flash在多项基准测试中的表现都超越了2.5 Pro,响应速度也显著提升。模型还配备了业界领先的视觉与空间推理功能,并新增了代码执行能力,可用于缩放、计数和编辑视觉输入。
在Gemini API和Vertex AI中,Gemini 3 Flash的定价为每百万个输入令牌0.50美元,每百万个输出令牌3美元(音频输入仍为每百万个输入令牌1美元)。它标配上下文缓存功能,在令牌重复使用超过特定阈值时,可节省90%以上的成本。同样,3 Flash目前也适用于Batch API,能节省约50%的成本,并大幅提高异步处理的速率上限。对于同步和近实时用例,付费API客户还可以使用面向生产级别的速率限制。
谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi表示,谷歌将Flash定位为“老黄牛”式的模型。该模型保持了接近Gemini 3 Pro的推理能力,同时运行速度达到Gemini 2.5 Pro的三倍,成本却只有Gemini 3 Pro的四分之一。
在博士级推理和知识基准GPQA Diamond上,Gemini 3 Flash的得分高达90.4%。虽然略低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他竞争对手的得分均未达到90%。

在保持高水平智能的同时,3 Flash实现了极高的效率,突破了性能与效能的帕累托极限。其性能超越了2.5 Pro,速度提升了3倍(基于人工智能分析基准测试),而成本却远低于后者。即使在最低的智能水平下,3 Flash的表现也常常优于前代版本在较高智能水平下的成绩。
