谷歌Gemini 3 Flash成本仅1/4,速度性能超越Pro版

智东西
编译 陈骏达
编辑 李水青
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
智东西12月18日报道,昨晚,谷歌发布了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。
具体来看,它输出每百万token的价格仅为Claude Sonnet 4.5的20%、GPT-5.2的21%,却能在基准测试上达到甚至超越这些旗舰级模型的水平。
即便是和Gemini 3 Pro相比,Gemini 3 Flash也极具性价比。Flash的价格仅为Pro的25%,却在MMMU-Pro、SWE-bench Verified这些核心基准测试上,超过了Pro版本的模型。

此前发布的Gemini 3系列模型在复杂推理、多模态和视觉理解、智能体及Vibe Coding任务方面都展现出优势,Gemini 3 Flash保留了这一基础,将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合。
谷歌首席科学家Jeff Dean称,Gemini 3 Flash不仅比2.5 Pro质量更高,速度也快3倍,而且价格仅为后者的几分之一。以下是并排演示:
(视频)
Gemini 3 Flash目前已经全面开放,开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity使用。而普通用户能通过Gemini应用程序和谷歌搜索中的AI模式使用。
一、专为迭代式开发打造,还帮你用“嘴编程”
Gemini 3 Flash究竟能做什么?谷歌称,这是一款专为迭代式开发打造的模型,能够以低延迟提供接近Gemini 3 Pro级别的编程性能。
谷歌分享了多个案例。比如,Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理,提供近乎实时的AI辅助。
它还可以近乎实时地构建和A/B测试新的加载动画设计,简化了从设计到代码的流程。
使用多模态推理,Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像,并生成字幕,最终将静态图像转化为交互式体验。
凭借在推理、工具使用和多模态能力方面的出色表现,Gemini 3 Flash 特别适合希望进行更复杂视频分析、数据提取和视觉问答的开发者。
Gemini 3 Flash的多模态推理能力可用于帮助用户看、听和理解任何类型的信息。
用户可以要求Gemini理解视频和图像,并在几秒钟内将该内容转化为有帮助且可操作的计划。
Gemini应用程序中的Gemini 3 Flash可以分析短视频内容并给你一个计划,比如如何改进你的高尔夫挥杆。
由于Gemini 3 Flash针对速度进行了优化,它可以在你仍在绘图时就“看到”并猜出你画的是什么。
你可以上传一段录音,Gemini 3 Flash将识别你的知识盲点,创建一个自定义测验,并对答案给出详细解释。
或者,也可以尝试“用嘴编程”,仅用语音输入从零开始构建有趣、有用的应用程序。Gemini 3 Flash可以在几分钟内将非结构化的想法转化为一个功能正常的应用程序。
二、多领域性能超越Pro级模型,可自动调节思考量
Gemini 3 Flash在基准测试上表现如何?它在GPQA Diamond(90.4%)和Humanity’s Last Exam(不使用工具时为33.7%)等博士级推理和知识基准测试中,可与更大的前沿模型相媲美,并且在多项基准测试中显著优于Gemini 2.5 Pro。
在评估编码智能体能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得78%的成绩,不仅超越了2.5系列,也超过了Gemini 3 Pro。
它还在MMMU Pro上达到了81.2%的分数,与Gemini 3 Pro相当,实现了最先进的性能。
在下图中展示的基准测试中,Gemini 3 Flash在几乎所有基准测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

除了前沿级别的推理和多模态能力外,Gemini 3 Flash的构建旨在实现高效率,推动了质量与成本、速度之间的帕累托边界。下方散点图显示了多个语言模型的LMArena Elo得分与每百万tokens价格的关系,其中一条线标出了穿过Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托边界。

在思考预算拉满时,Gemini 3 Flash能够调节其思考量。对于更复杂的用例,它可能会思考更长时间。但根据典型流量测量,在以更高的性能准确完成日常任务的前提下,它平均比2.5 Pro少使用30%的tokens。
结语:Gemini 3模型版图补全,有望深度嵌入日常应用
Gemini 3系列模型自发布以来就广受好评,不过其高昂的成本让不少用户望而却步。Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局,回应了开发者在真实生产环境里的诉求。
从迭代式开发、Vibe Coding,到多模态应用、实时交互和智能体系统,Gemini 3 Flash所展现的更高性价比,有望帮助智能更广泛地嵌入日常应用和商业系统之中。
相关攻略
2026年4月,谷歌在iOS生态里悄悄放了个“大招”:一款主打离线优先的AI听写应用悄然上架美区App Store。这款产品内置了谷歌自研的轻量化大模型Gemma,最大的亮点是,即便完全断网,也能实现高精度的语音转文字。明眼人都能看出,它的矛头直指当前消费级听写工具市场的领头羊——Wispr Flo
币安是全球领先的数字资产交易平台。为确保安全,应直接访问其官方域名binance com,并确认网址无误。通过官网下载官方App,安卓或iOS设备需按指引完成安装。注册账户后,为提升安全性,务必在App的安全设置中绑定谷歌验证器。绑定后,进行关键操作时需输入动态验证码,从而为资产提供额外保护。
谷歌正式入驻广州国际金融中心,计划于第三季度启动跨境数智赋能服务创新项目。该项目旨在通过数字技术与智能方案,为本地企业跨境业务提供创新支持,助力产业数字化与贸易智能化升级。此举将为粤港澳大湾区企业接入全球前沿技术和服务提供新机遇。
谷歌发布无屏智能手环FitbitAir,需付费购买硬件。其核心高级功能需额外订阅月费会员,引发争议。订阅模式可能削弱硬件创新动力,并将用户健康数据的解析服务持续收费。相比之下,国内厂商多采用基础功能免费、增值服务付费的模式,对消费者更为友好。
腾讯开源“袖珍”AI翻译引擎:1 25比特极致压缩,手机离线跑出百GB模型水准 最近,腾讯在开源社区扔下了一颗“技术冲击波”——正式发布了紧凑型AI翻译模型Hy-MT1 5-1 8B-1 25bit。这个模型最吸引人的地方在于,它宣称能在保持高性能的同时,完全在智能手机上离线运行。这意味着什么?或许
热门专题
热门推荐
峡谷区域唯一唱片需集齐三个碎片合成。首个碎片位于地图西北角木箱木桶旁,外观如跳动火焰。集齐碎片可解锁新内容并提升游戏体验,探索时留意细节可能发现更多隐藏惊喜。
《遥遥西土》中,西土唱片需集齐三个碎片合成。首个碎片位于地图东南角的管子洞内,获取过程简单,无复杂谜题或战斗。整体流程清晰,玩家按指引收集全部碎片即可合成唱片,轻松完成收集任务。
《鸣潮》联动《赛博朋克:边缘行者》,推出五星角色露西与丽贝卡,可通过限定卡池与活动免费获取。联动包含专属剧情、夜之城风格场景及高难度BOSS战,并植入动画经典音乐。参与预热活动和完成剧情任务可获得限定奖励,全方位打造沉浸式赛博朋克体验。
鼻噶流”玩法围绕“混沌爪牙”基因展开,开局以小体型角色灵活发育,注重走位与策略而非堆叠体型与伤害。该玩法在较高难度下提供了与传统平推思路不同的趣味体验,适合追求新鲜操作感的玩家尝试。
《异环》S级气态弧盘“好狗狗走四方”可提升充能与全队攻击,适合早雾等辅助。完成主线任务“成交?成交!”后解锁番外副本“月光当铺”,首次击败BOSS墨菲克斯即可免费获取。战斗时建议中距离拉扯,优先清理小狼,搭配破韧与输出角色更易通关。





