首页 游戏 软件 资讯 排行榜 专题
首页
AI
谷歌Gemini 3 Flash成本仅1/4,速度性能超越Pro版

谷歌Gemini 3 Flash成本仅1/4,速度性能超越Pro版

热心网友
14
转载
2025-12-19


智东西
编译 陈骏达
编辑 李水青

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智东西12月18日报道,昨晚,谷歌发布了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。

具体来看,它输出每百万token的价格仅为Claude Sonnet 4.5的20%、GPT-5.2的21%,却能在基准测试上达到甚至超越这些旗舰级模型的水平。

即便是和Gemini 3 Pro相比,Gemini 3 Flash也极具性价比。Flash的价格仅为Pro的25%,却在MMMU-Pro、SWE-bench Verified这些核心基准测试上,超过了Pro版本的模型。


此前发布的Gemini 3系列模型在复杂推理、多模态和视觉理解、智能体及Vibe Coding任务方面都展现出优势,Gemini 3 Flash保留了这一基础,将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合。

谷歌首席科学家Jeff Dean称,Gemini 3 Flash不仅比2.5 Pro质量更高,速度也快3倍,而且价格仅为后者的几分之一。以下是并排演示:

(视频)

Gemini 3 Flash目前已经全面开放,开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity使用。而普通用户能通过Gemini应用程序和谷歌搜索中的AI模式使用。

一、专为迭代式开发打造,还帮你用“嘴编程”

Gemini 3 Flash究竟能做什么?谷歌称,这是一款专为迭代式开发打造的模型,能够以低延迟提供接近Gemini 3 Pro级别的编程性能。

谷歌分享了多个案例。比如,Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理,提供近乎实时的AI辅助。

它还可以近乎实时地构建和A/B测试新的加载动画设计,简化了从设计到代码的流程。

使用多模态推理,Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像,并生成字幕,最终将静态图像转化为交互式体验。

凭借在推理、工具使用和多模态能力方面的出色表现,Gemini 3 Flash 特别适合希望进行更复杂视频分析、数据提取和视觉问答的开发者。

Gemini 3 Flash的多模态推理能力可用于帮助用户看、听和理解任何类型的信息。

用户可以要求Gemini理解视频和图像,并在几秒钟内将该内容转化为有帮助且可操作的计划。

Gemini应用程序中的Gemini 3 Flash可以分析短视频内容并给你一个计划,比如如何改进你的高尔夫挥杆。

由于Gemini 3 Flash针对速度进行了优化,它可以在你仍在绘图时就“看到”并猜出你画的是什么。

你可以上传一段录音,Gemini 3 Flash将识别你的知识盲点,创建一个自定义测验,并对答案给出详细解释。

或者,也可以尝试“用嘴编程”,仅用语音输入从零开始构建有趣、有用的应用程序。Gemini 3 Flash可以在几分钟内将非结构化的想法转化为一个功能正常的应用程序。

二、多领域性能超越Pro级模型,可自动调节思考量

Gemini 3 Flash在基准测试上表现如何?它在GPQA Diamond(90.4%)和Humanity’s Last Exam(不使用工具时为33.7%)等博士级推理和知识基准测试中,可与更大的前沿模型相媲美,并且在多项基准测试中显著优于Gemini 2.5 Pro。

在评估编码智能体能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得78%的成绩,不仅超越了2.5系列,也超过了Gemini 3 Pro。

它还在MMMU Pro上达到了81.2%的分数,与Gemini 3 Pro相当,实现了最先进的性能。

在下图中展示的基准测试中,Gemini 3 Flash在几乎所有基准测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。


除了前沿级别的推理和多模态能力外,Gemini 3 Flash的构建旨在实现高效率,推动了质量与成本、速度之间的帕累托边界。下方散点图显示了多个语言模型的LMArena Elo得分与每百万tokens价格的关系,其中一条线标出了穿过Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托边界。


在思考预算拉满时,Gemini 3 Flash能够调节其思考量。对于更复杂的用例,它可能会思考更长时间。但根据典型流量测量,在以更高的性能准确完成日常任务的前提下,它平均比2.5 Pro少使用30%的tokens。

结语:Gemini 3模型版图补全,有望深度嵌入日常应用

Gemini 3系列模型自发布以来就广受好评,不过其高昂的成本让不少用户望而却步。Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局,回应了开发者在真实生产环境里的诉求。

从迭代式开发、Vibe Coding,到多模态应用、实时交互和智能体系统,Gemini 3 Flash所展现的更高性价比,有望帮助智能更广泛地嵌入日常应用和商业系统之中。

来源:https://www.163.com/dy/article/KH5L52LH051180F7.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

扎克伯格为Meta设立“硬指标”:最高80%工程师需在工作中使用AI
科技数码
扎克伯格为Meta设立“硬指标”:最高80%工程师需在工作中使用AI

Meta的“AI原生”转型:指标驱动的深度变革 近期,一份曝光的内部文件揭示了一个明确的趋势:马克·扎克伯格正全力推动Meta向一家彻底的“AI原生”公司转型。这不仅仅是一句口号,而是通过设定具体、可量化的指标,将AI深度融入每一位员工、尤其是工程师的日常工作流程中。 从部门到公司:具体的AI渗透目

热心网友
04.17
年化收入300亿美元 Anthropic首超OpenAI
科技数码
年化收入300亿美元 Anthropic首超OpenAI

风头正盛的AI新锐巨头Anthropic年化收入激增 AI领域的竞争格局,似乎又迎来了一个关键转折点。当地时间4月6日,Anthropic公布了一组引人注目的数字:由于旗下大模型Claude需求持续加速,公司的年化收入已经冲破了300亿美元大关。要知道,就在去年年底,这个数字还停留在90亿美元。更值

热心网友
04.17
谷歌I/O 2026日程公布,AI与安卓17成核心议题
科技数码
谷歌I/O 2026日程公布,AI与安卓17成核心议题

谷歌2026年I O开发者大会日程正式公布,AI与核心平台更新成首日焦点 谷歌开发者博客在4月14日发布了最新公告,正式揭晓了2026年I O开发者大会的详细直播日程。这次大会的重头戏——主旨演讲,已经定档于太平洋时间5月19日。从首日议程来看,Google AI、Android和Chrome等核心

热心网友
04.16
安卓开发者天塌了?谷歌新政一夜变苹果!开发者炸锅:明年起做 APK 先举身份证!网友:近年来科技界最糟糕的事
业界动态
安卓开发者天塌了?谷歌新政一夜变苹果!开发者炸锅:明年起做 APK 先举身份证!网友:近年来科技界最糟糕的事

开发者不得不接入 Play Integrity、SafetyNet 等安全 API,应用与谷歌服务的绑定日益加深。对谷歌而言,这不仅降低了恶意应用风险,还能进一步锁定用户和开发者,强化数据控制,并间接推动 Play 商店交易和广告收益。 一夜之间,安卓要向苹果看齐了? 未来想发布一个APK,开发者可

热心网友
04.15
OpenAI内部信曝光:断言死敌Anthropic深陷算力瓶颈,差距将持续拉大
业界动态
OpenAI内部信曝光:断言死敌Anthropic深陷算力瓶颈,差距将持续拉大

OpenAI内部备忘录曝光:直指竞争对手Anthropic算力规模“不在一个量级” AI领域的竞争,火药味越来越浓了。就在本周,OpenAI向投资者发送的一份内部备忘录被曝光,内容直指其主要竞争对手Anthropic。OpenAI在文件中毫不客气地指出,双方的“规模体量完全不在一个量级”,并称Ant

热心网友
04.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

DreamFace
AI
DreamFace

DreamFace是什么 当你还在为制作一段生动视频发愁时,市面上已经出现了能“点石成金”的工具。DreamFace,由New Port LLC开发,就是这样一个专注于照片动画和AI头像生成的AI视频解决方案。它的目标很明确:为社交媒体用户、教育工作者、商务人士等群体,提供一种近乎零门槛的视频制作方

热心网友
04.18
Zop Media
AI
Zop Media

Zop Media Car Dealer Software是什么 在汽车零售这个数字化浪潮席卷的行业里,高效的在线管理工具早已不是“锦上添花”,而是“制胜必需品”。众多选择中,Zop Media公司推出的“Zop Media Car Dealer Software”占据了一席之地。顾名思义,这是一款

热心网友
04.18
Dora AI
AI
Dora AI

Dora是什么 如果说几年前,创建一个视觉效果酷炫、带有3D动画的网站还是专业开发者的“专利”,那今天,这个门槛正在被轻松跨越。Dora的出现,恰恰扮演了这个“破壁者”的角色。它是一款专注于无代码创建3D动画网站的AI工具,由Dora团队匠心打造。无论是设计师、创业者,还是仅仅想快速搭建一个专业站点

热心网友
04.18
vos模式怎么玩 是什么?基础说明与使用场景
游戏攻略
vos模式怎么玩 是什么?基础说明与使用场景

VOS模式:一种经典的音乐游戏玩法在音乐游戏的广阔世界里,VOS模式是一个承载着许多玩家早期记忆的经典玩法。它并非指代某一款特定的游戏,而是一种游戏方式的统称。其名称来源于一款名为《Virtual Orchestra Studio》的软件,这款软件允许玩家使用电脑键盘来模拟演奏多种乐器,从而跟随音乐

热心网友
04.18
VS2019打不开或没反应该怎么解决-打不开或没反应该的解决方法
电脑教程
VS2019打不开或没反应该怎么解决-打不开或没反应该的解决方法

VS2019打不开或没反应?资深工程师教你高效排查与修复 Visual Studio 2019 是微软推出的强大集成开发环境,广泛应用于各类软件开发。然而,部分用户在启动时可能会遭遇程序无响应或完全无法打开的问题,严重影响工作效率。本文由资深技术工程师整理,提供一套系统性的故障排除方案,帮助您快速定

热心网友
04.18