首页 游戏 软件 资讯 排行榜 专题
首页
AI
谷歌Gemini 3 Flash成本仅1/4,速度性能超越Pro版

谷歌Gemini 3 Flash成本仅1/4,速度性能超越Pro版

热心网友
19
转载
2025-12-19


智东西
编译 陈骏达
编辑 李水青

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智东西12月18日报道,昨晚,谷歌发布了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。

具体来看,它输出每百万token的价格仅为Claude Sonnet 4.5的20%、GPT-5.2的21%,却能在基准测试上达到甚至超越这些旗舰级模型的水平。

即便是和Gemini 3 Pro相比,Gemini 3 Flash也极具性价比。Flash的价格仅为Pro的25%,却在MMMU-Pro、SWE-bench Verified这些核心基准测试上,超过了Pro版本的模型。


此前发布的Gemini 3系列模型在复杂推理、多模态和视觉理解、智能体及Vibe Coding任务方面都展现出优势,Gemini 3 Flash保留了这一基础,将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合。

谷歌首席科学家Jeff Dean称,Gemini 3 Flash不仅比2.5 Pro质量更高,速度也快3倍,而且价格仅为后者的几分之一。以下是并排演示:

(视频)

Gemini 3 Flash目前已经全面开放,开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity使用。而普通用户能通过Gemini应用程序和谷歌搜索中的AI模式使用。

一、专为迭代式开发打造,还帮你用“嘴编程”

Gemini 3 Flash究竟能做什么?谷歌称,这是一款专为迭代式开发打造的模型,能够以低延迟提供接近Gemini 3 Pro级别的编程性能。

谷歌分享了多个案例。比如,Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理,提供近乎实时的AI辅助。

它还可以近乎实时地构建和A/B测试新的加载动画设计,简化了从设计到代码的流程。

使用多模态推理,Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像,并生成字幕,最终将静态图像转化为交互式体验。

凭借在推理、工具使用和多模态能力方面的出色表现,Gemini 3 Flash 特别适合希望进行更复杂视频分析、数据提取和视觉问答的开发者。

Gemini 3 Flash的多模态推理能力可用于帮助用户看、听和理解任何类型的信息。

用户可以要求Gemini理解视频和图像,并在几秒钟内将该内容转化为有帮助且可操作的计划。

Gemini应用程序中的Gemini 3 Flash可以分析短视频内容并给你一个计划,比如如何改进你的高尔夫挥杆。

由于Gemini 3 Flash针对速度进行了优化,它可以在你仍在绘图时就“看到”并猜出你画的是什么。

你可以上传一段录音,Gemini 3 Flash将识别你的知识盲点,创建一个自定义测验,并对答案给出详细解释。

或者,也可以尝试“用嘴编程”,仅用语音输入从零开始构建有趣、有用的应用程序。Gemini 3 Flash可以在几分钟内将非结构化的想法转化为一个功能正常的应用程序。

二、多领域性能超越Pro级模型,可自动调节思考量

Gemini 3 Flash在基准测试上表现如何?它在GPQA Diamond(90.4%)和Humanity’s Last Exam(不使用工具时为33.7%)等博士级推理和知识基准测试中,可与更大的前沿模型相媲美,并且在多项基准测试中显著优于Gemini 2.5 Pro。

在评估编码智能体能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得78%的成绩,不仅超越了2.5系列,也超过了Gemini 3 Pro。

它还在MMMU Pro上达到了81.2%的分数,与Gemini 3 Pro相当,实现了最先进的性能。

在下图中展示的基准测试中,Gemini 3 Flash在几乎所有基准测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。


除了前沿级别的推理和多模态能力外,Gemini 3 Flash的构建旨在实现高效率,推动了质量与成本、速度之间的帕累托边界。下方散点图显示了多个语言模型的LMArena Elo得分与每百万tokens价格的关系,其中一条线标出了穿过Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托边界。


在思考预算拉满时,Gemini 3 Flash能够调节其思考量。对于更复杂的用例,它可能会思考更长时间。但根据典型流量测量,在以更高的性能准确完成日常任务的前提下,它平均比2.5 Pro少使用30%的tokens。

结语:Gemini 3模型版图补全,有望深度嵌入日常应用

Gemini 3系列模型自发布以来就广受好评,不过其高昂的成本让不少用户望而却步。Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局,回应了开发者在真实生产环境里的诉求。

从迭代式开发、Vibe Coding,到多模态应用、实时交互和智能体系统,Gemini 3 Flash所展现的更高性价比,有望帮助智能更广泛地嵌入日常应用和商业系统之中。

来源:https://www.163.com/dy/article/KH5L52LH051180F7.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌龙虾“史密斯工”揭秘:黑客帝国降临现实始末
科技数码
谷歌龙虾“史密斯工”揭秘:黑客帝国降临现实始末

过去两个月,OpenClaw火得一塌糊涂。它让AI开始像一个真正能替人跑流程、调工具、接任务的数字执行者。现如今,谷歌也准备分一杯羹,外媒爆料称,谷歌正在开发一款叫做Smith的agent,不仅比O

热心网友
03.28
谷歌称存储供应链未过剩:AI需求强劲,结构性短缺持续
科技数码
谷歌称存储供应链未过剩:AI需求强劲,结构性短缺持续

谷歌近期推出TurboQuant压缩算法,称将大模型关键缓存占用减少至少6倍,这一消息一度让存储行业陷入恐慌。但在MemoryS 2026峰会上,来自三星电子、长江存储、铠侠、闪迪等多家存储厂商,以

热心网友
03.28
iPhone 18与iOS 18前瞻:Siri革新与9月发布消息汇总
网络安全
iPhone 18与iOS 18前瞻:Siri革新与9月发布消息汇总

如果你还在等iPhone18系列来个外观大改,可能要失望了,但如果你在意的是体验大改,那这次可能真的有惊喜。一方面,近期有消息称iPhone18系列的黑边、边框没有变化,只有灵动岛缩小;核心升级集中

热心网友
03.28
安卓17 Beta3隐藏更新超多,正式版即将到来!
网络安全
安卓17 Beta3隐藏更新超多,正式版即将到来!

喜欢折腾的用户都知道,谷歌当年在安卓12里把快捷设置面板的Wi-Fi开关改了,点一下不直接开关,而是弹出一个网络列表,你得再点一下开关才能关掉Wi-Fi。这个两步走的设计被骂了五年,而随着时间的推移

热心网友
03.28
谷歌新规:安卓换机继承侧载权限,无需重复授权
科技数码
谷歌新规:安卓换机继承侧载权限,无需重复授权

IT之家 3 月 28 日消息,据外媒 9to5Google 报道,谷歌上周终于公布了备受关注的安卓“高级流程”,用于允许用户继续从未经验证的开发者处侧载 APK,并计划在今年晚些时候向所有安卓机型

热心网友
03.28

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

个人纳税记录查询:电子税务局操作与下载全指南
电脑教程
个人纳税记录查询:电子税务局操作与下载全指南

可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存

热心网友
03.28
智现未来联合晶合集荣获SEMICON China良率提升奖
科技数码
智现未来联合晶合集荣获SEMICON China良率提升奖

3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A

热心网友
03.28
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业
科技数码
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业

南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天

热心网友
03.28
神州写真:中国机器人租赁升温,二次开发成关键新赛道
科技数码
神州写真:中国机器人租赁升温,二次开发成关键新赛道

来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年

热心网友
03.28
京东翻新打印机避雷指南:警惕以旧充新三大陷阱
科技数码
京东翻新打印机避雷指南:警惕以旧充新三大陷阱

大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确

热心网友
03.28