谷歌Gemini 3 Flash成本仅1/4，速度性能超越Pro版

首页

热心网友

转载

2025-12-19

智东西
编译陈骏达
编辑李水青

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

智东西12月18日报道，昨晚，谷歌发布了Gemini 3 Flash，旨在用更低的成本提供前沿的智能水平。

具体来看，它输出每百万token的价格仅为Claude Sonnet 4.5的20%、GPT-5.2的21%，却能在基准测试上达到甚至超越这些旗舰级模型的水平。

即便是和Gemini 3 Pro相比，Gemini 3 Flash也极具性价比。Flash的价格仅为Pro的25%，却在MMMU-Pro、SWE-bench Verified这些核心基准测试上，超过了Pro版本的模型。

此前发布的Gemini 3系列模型在复杂推理、多模态和视觉理解、智能体及Vibe Coding任务方面都展现出优势，Gemini 3 Flash保留了这一基础，将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合。

谷歌首席科学家Jeff Dean称，Gemini 3 Flash不仅比2.5 Pro质量更高，速度也快3倍，而且价格仅为后者的几分之一。以下是并排演示：

（视频）

Gemini 3 Flash目前已经全面开放，开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity使用。而普通用户能通过Gemini应用程序和谷歌搜索中的AI模式使用。

一、专为迭代式开发打造，还帮你用“嘴编程”

Gemini 3 Flash究竟能做什么？谷歌称，这是一款专为迭代式开发打造的模型，能够以低延迟提供接近Gemini 3 Pro级别的编程性能。

谷歌分享了多个案例。比如，Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理，提供近乎实时的AI辅助。

它还可以近乎实时地构建和A/B测试新的加载动画设计，简化了从设计到代码的流程。

使用多模态推理，Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像，并生成字幕，最终将静态图像转化为交互式体验。

凭借在推理、工具使用和多模态能力方面的出色表现，Gemini 3 Flash 特别适合希望进行更复杂视频分析、数据提取和视觉问答的开发者。

Gemini 3 Flash的多模态推理能力可用于帮助用户看、听和理解任何类型的信息。

用户可以要求Gemini理解视频和图像，并在几秒钟内将该内容转化为有帮助且可操作的计划。

Gemini应用程序中的Gemini 3 Flash可以分析短视频内容并给你一个计划，比如如何改进你的高尔夫挥杆。

由于Gemini 3 Flash针对速度进行了优化，它可以在你仍在绘图时就“看到”并猜出你画的是什么。

你可以上传一段录音，Gemini 3 Flash将识别你的知识盲点，创建一个自定义测验，并对答案给出详细解释。

或者，也可以尝试“用嘴编程”，仅用语音输入从零开始构建有趣、有用的应用程序。Gemini 3 Flash可以在几分钟内将非结构化的想法转化为一个功能正常的应用程序。

二、多领域性能超越Pro级模型，可自动调节思考量

Gemini 3 Flash在基准测试上表现如何？它在GPQA Diamond（90.4%）和Humanity’s Last Exam（不使用工具时为33.7%）等博士级推理和知识基准测试中，可与更大的前沿模型相媲美，并且在多项基准测试中显著优于Gemini 2.5 Pro。

在评估编码智能体能力的基准测试SWE-bench Verified中，Gemini 3 Flash取得78%的成绩，不仅超越了2.5系列，也超过了Gemini 3 Pro。

它还在MMMU Pro上达到了81.2%的分数，与Gemini 3 Pro相当，实现了最先进的性能。

在下图中展示的基准测试中，Gemini 3 Flash在几乎所有基准测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

除了前沿级别的推理和多模态能力外，Gemini 3 Flash的构建旨在实现高效率，推动了质量与成本、速度之间的帕累托边界。下方散点图显示了多个语言模型的LMArena Elo得分与每百万tokens价格的关系，其中一条线标出了穿过Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托边界。

在思考预算拉满时，Gemini 3 Flash能够调节其思考量。对于更复杂的用例，它可能会思考更长时间。但根据典型流量测量，在以更高的性能准确完成日常任务的前提下，它平均比2.5 Pro少使用30%的tokens。

结语：Gemini 3模型版图补全，有望深度嵌入日常应用

Gemini 3系列模型自发布以来就广受好评，不过其高昂的成本让不少用户望而却步。Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局，回应了开发者在真实生产环境里的诉求。

从迭代式开发、Vibe Coding，到多模态应用、实时交互和智能体系统，Gemini 3 Flash所展现的更高性价比，有望帮助智能更广泛地嵌入日常应用和商业系统之中。

来源:https://www.163.com/dy/article/KH5L52LH051180F7.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：揭秘阿里千问：全员吃豆包实为AI生成，团队如何策划？下一篇：OpenAI再融资千亿冲击6万亿估值，亚马逊参投700亿美元

相关攻略

业界动态

谷歌iOS离线听写应用上线内置自研Gemma大模型

2026年4月，谷歌在iOS生态里悄悄放了个“大招”：一款主打离线优先的AI听写应用悄然上架美区App Store。这款产品内置了谷歌自研的轻量化大模型Gemma，最大的亮点是，即便完全断网，也能实现高精度的语音转文字。明眼人都能看出，它的矛头直指当前消费级听写工具市场的领头羊——Wispr Flo

热心网友

05.12