首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
谷歌凌晨发炸弹级AI Pro,白菜价对标OpenAI

谷歌凌晨发炸弹级AI Pro,白菜价对标OpenAI

热心网友
26
转载
2026-03-10

推理强、速度快、还省钱,谷歌这次真的“杀疯了”。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

就在旗舰模型Gemini 3 Pro发布仅一个月、死对头GPT-5.2发布仅仅5天后,今天凌晨,谷歌祭出大杀器Gemini 3 Flash。

大家惊讶地发现,这款新模型不讲武德:不仅在GPQA(博士级推理) 上拿到了90.4% 的高分,更以Pro级的推理智能,跑出了Flash级的逆天延迟。

谷歌CEO桑达尔·皮查伊(Sundar Pichai)高呼:“我们又回来了!” 他直言,新模型突破了性能和效率的帕累托极限——性能超越2.5 Pro,速度提升3倍,价格却低得多。


这种“加量不加价”的暴力美学,试图彻底改写大模型市场的性价比规则。正如DeepMind创始人哈萨比斯所言:“这是目前市面上性价比最高的模型,没有之一。”

一、帕累托边界的极限跨越:它是怎么做到的?

(图片由AI生成)

Gemini 3 Flash的核心逻辑简单粗暴:保留Gemini 3 Pro级别的推理底色,同时注入Flash系列的极致响应速度。

Google DeepMind负责人杰夫·迪恩(Jeff Dean)指出,Gemini 3 Flash标志着以往仅在超大型模型中具备的推理能力,如今能以Flash级的延迟运行。


这种“小而强”的进化并非牺牲了智能,而是通过调节“思考程度”实现了质量与成本的平衡。对于日常任务,它比2.5 Pro平均节省30%的Token使用量,但在准确率上反而更胜一筹。

DeepMind研究科学家阿里·伊斯拉米(Ali Eslami)也感慨道:“距Pro版发布仅29天,Flash版同样智能,价格却便宜4倍,速度快得多!”

二、硬核测评:屠榜级表现,Pro级灵魂

在AI圈,不跑分的测评都是耍流氓。Gemini 3 Flash在多个权威基准测试中展现了“屠榜”姿态:

· 博士级推理(GPQA Diamond):准确率达到90.4%,足以匹敌顶尖的前沿大模型。

· 多模态理解(MMMU Pro):获得81.2% 的优异成绩,与“大哥”Gemini 3 Pro持平。

· 编码智能体(SWE-bench Verified):取得了78% 的惊人分数,不仅横扫2.5全系列,甚至超越了刚刚发布不久的Gemini 3 Pro。

(图片由AI生成)

独立测评机构Artificial Analysis的预发布测试更是为这些数据注入了“现实感”:Gemini 3 Flash的原始吞吐量达到每秒218个输出Token,显著快于OpenAI GPT-5.1 high(125 Token/秒)。

(图片由AI生成)

更令人振奋的是,该机构将其冠以AA-Omniscience知识基准测试的新领导者,其知识准确率达到了目前所有测试模型的巅峰。

尽管这种智能带来了一定的“推理税”(处理复杂索引时Token量比2.5 Flash多一倍),但谷歌通过极激进的定价策略(输入Token 0.50美元/100万,输出Token 3美元/100万)完美对冲了这一成本。


三、给复杂应用,装上一颗“闪电大脑”

凭借在推理、工具调用及多模态维度的全线爆发,Gemini 3 Flash堪称复杂视频分析、海量数据提取与视觉问答(VQA)领域的全能型选手。

它不仅重塑了开发者对轻量化模型的认知,更让那些既追求极致响应、又渴望深度推理的智能应用,从此告别了在速度与智商之间的两难抉择。

举例来说,

· 在手部追踪的弹球益智游戏中,Gemini 3 Flash展现了惊人的多模态推理速度,能够毫秒级识别操作意图并提供近乎实时的AI战术辅助。

· 告别漫长等待:Gemini 3 Flash能够近乎实时地构建并自动化执行加载动画的A/B测试,极大地压缩了从创意设计到生产环境代码部署的转化链路 。

· 逻辑推理能力的下放:仅凭一段简单的自然语言提示,Gemini 3 Flash即可瞬间编写出三种风格迥异的设计变体代码,为开发者提供了极高的迭代效率 。

· 依托深厚的多模态底座,Gemini 3 Flash通过图像分析自动生成带有上下文感知的UI覆盖层字幕,一键将枯燥的静态图像转化为可感知的交互式数字化体验 。

四、降本增效的终极杀招:思考层级与上下文缓存

为了让企业更放心地投入预算,谷歌在Gemini 3 Flash中引入了精细的“思考层级”参数。 开发者可以在“低”(简单任务降延迟)和“高”(复杂任务升深度)之间自由切换,实现“可变速度”的应用程序。

(图片由AI生成)

此外,上下文缓存(Context Caching)技术让处理海量静态数据集(如法律库或大型代码库)时,重复查询的成本可直接降低90%。

Gemini 3 Flash的发布,标志着前沿智能正在进入“Flash化”时代。 通过将Pro级推理下放到Flash级定价区间,谷歌不仅为速度较慢的竞争对手设下了伏击(trap),更向全球开发者展示了:前沿AI能力正变得前所未有的廉价与高效。

目前,Gemini 3 Flash已作为搜索AI模式和Gemini App的默认模型向全球数百万用户推出。

五、早期用户体验:这不只是升级,这是重塑

对于开发者和企业而言,Gemini 3 Flash的到来意味着原本因“高延迟、高成本”而被封印的场景,现在可以规模化落地了。

1. 法律与金融:复杂索引的专家

AI法律平台Harvey应用研究负责人尼科·格鲁彭(Niko Grupen)表示,在内部“BigLaw Bench”基准测试中,其推理能力较前代提升了7% 。这对于从海量合同中提取定义条款、交叉引用等高吞吐量法律任务具有重要影响。


Bridgewater Associates首席科学家贾斯吉特·塞孔(Jasjeet Sekhon)也对此表示赞赏:“我们需要处理海量非结构化数据且不牺牲深度。Gemini 3 Flash首次以工作流所需的速度,提供了专业级的推理。它在长上下文表现上尤为出色。”

2. 软件开发:智能体编程的新纪元

JetBrains AI开发工具生态系统负责人丹尼斯·希里亚耶夫(Denis Shiryaev)评价道:“在我们的Junie智能编码评估中,Gemini 3 Flash的质量已接近Pro级,但延迟和成本显著降低。它让复杂的多步骤智能体在生产环境中变得快速且可预测。”

Warp创始人扎克·劳埃德(Zach Lloyd)透露,其“建议代码变更”功能在升级后,修复准确率提升了8% 。

Replit总裁米歇尔·卡塔斯塔(Michele Catasta)指出,Gemini 3 Flash首次将速度、经济性与足够强大的能力相结合,足以驱动一个编码智能体的核心循环 。

Cursor开发者体验副总裁李·罗宾逊(Lee Robinson)反馈,Flash在调查问题、定位Bug根本原因时既快速又准确 。

3. 多模态与游戏:毫秒级的响应

Astrocade联合创始人阿里·萨德吉安(Ali Sadeghian)表示,该模型的速度使他们能通过单次提示生成完整的游戏关卡计划 。

Latitude首席执行官尼克·沃特森(Nick Waltson)的评价是:Gemini 3 Flash以低成本达到了过去只有顶级收费模型才能实现的高质量输出。

六、社交媒体炸锅:开发者们的“真香”时刻

模型好不好,社交媒体上的开发者最有发言权。Gemini 3 Flash发布后的反馈几乎是一边倒的惊叹:

网友@omarsar0被Gemini 3 Flash彻底“拿捏”了。 他感叹,这可不是什么小打小闹的升级,而是一个“要啥有啥”的六边形战士:推理强、速度快、还省钱。


@AliShazil_认为,Flash版本带来的“速度-成本-质量”新平衡,其意义远超性能榜单上的跑分结果,将真正改变实际应用场景。

Hyperbolic联合创始人Yuchen Jin从更宏观的角度评价称,这种“更小、更快、更强”的趋势并非个例,它标志着技术迭代的节奏正在急剧加快。他还认为强大的设备端AI已触手可及,目标直指苹果!

有网友惊叹谷歌在LLM领域的设计依然是王者。它保留了Gemini 3的所有设计理念,但速度快得多!

当然,硬币也有另一面。

有网友指出Gemini 3 Flash在AA-Omniscience基准测试中的幻觉率引发了关注,LisanBench的数据也暗示其平均有效性仍有提升空间。

但正如Warp创始人劳埃德所言,对于需要“低延迟和成本效率”的功能,Gemini 3 Flash依然是无可争议的最佳选择。

结语:是圣诞礼物,也是行业战书

对于全球开发者而言,Gemini 3 Flash无疑是2025年末收到的一份厚重的圣诞礼物。它打破了“智能与成本”的悖论,让AI应用的落地变得前所未有的简单。

(图片由AI生成)

这对于用户是福音,但对于那些技术壁垒不高、成本控制不力的竞争对手来说,却是灭顶之灾。

随着价格战的枪声打响,2026年注定将是AI行业的“大洗牌”之年。当潮水退去,究竟是谷歌重回王座,还是会有新的黑马杀出重围?答案,就在下一个版本的迭代里。

来源:https://www.163.com/tech/article/KH2ALRUJ00097U7T.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI预测市场崛起:黑马模型胜率如何超越人类
AI
AI预测市场崛起:黑马模型胜率如何超越人类

新智元报道编辑:Aeneas【新智元导读】大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1 0。

热心网友
03.30
沃顿商学院研究:AI如何重塑人类推理与判断机制
科技数码
沃顿商学院研究:AI如何重塑人类推理与判断机制

IT之家 3 月 28 日消息,当地时间 3 月 27 日,据《福布斯》报道,美国宾夕法尼亚大学沃顿商学院最新研究显示,使用 AI 规划旅行、咨询医疗建议或撰写求职信,看似只是节省时间,实际上可能正

热心网友
03.29
龙虾、Token是什么?6位AI大咖为你深度解析
科技数码
龙虾、Token是什么?6位AI大咖为你深度解析

来源:人民日报客户端走红的“龙虾”(OpenClaw)打开了智能体的想象空间;巨量的词元(Token)反映着AI产业规模快速扩张……3月27日,在2026中关村论坛人工智能主题日,月之暗面创始人杨植

热心网友
03.28
龙虾之后的大模型共识困境与未来趋势
科技数码
龙虾之后的大模型共识困境与未来趋势

出品|虎嗅科技组作者|宋思杭编辑|苗正卿头图|中关村论坛现场上一次智谱AI与月之暗面同台,还是在1月10日。那天是智谱通过港交所聆讯后的第三天,一个周六,在中关村国际创新中心举行了一场名为AGI-N

热心网友
03.28
阿里林俊离职首文:AI迈向智能体式思考新阶段
科技数码
阿里林俊离职首文:AI迈向智能体式思考新阶段

AI正在走向“为了采取正确行动而思考”。编译整理|莘歆来源 | 盒饭财经(ID:daxiongfan)头图及封面来源 | 网络及即梦制作在X(推特)上宣布离职后的22天,林俊旸发了一篇长文。3月2

热心网友
03.27

最新APP

凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26

热门推荐

vivo Y500s与Y60m对比:双机深度解析,帮你选出最适合的一款
网络安全
vivo Y500s与Y60m对比:双机深度解析,帮你选出最适合的一款

如果你最近关注过手机市场,应该知道一件事:内存涨价了,而且涨得挺狠,相比之前,同配置的内存成本已经涨了近1000块。这对中低端机型的冲击最明显,本来利润就薄,成本一涨,要么涨价,要么砍配置,对于想换

热心网友
03.30
PPT演示模式鼠标消失怎么办?3种方法快速唤回光标
电脑教程
PPT演示模式鼠标消失怎么办?3种方法快速唤回光标

鼠标指针在PPT演示中消失通常因“指针选项”设为隐藏,可通过右键菜单选“可见”、按Ctrl+A快捷键、取消“自动隐藏鼠标指针”设置、Alt+Tab切换窗口重启渲染,或检查演示者视图

热心网友
03.30
豪威集团2025年业绩亮眼:营收净利双增,半导体业务全面开花
科技数码
豪威集团2025年业绩亮眼:营收净利双增,半导体业务全面开花

豪威集团近日发布最新财务公告,显示2025年业绩实现显著增长。全年营业收入达288 55亿元,较上年提升12 14%;净利润突破40 45亿元,同比增长21 73%。这一成绩主要得益于半导体设计业务

热心网友
03.30
乐聚建成国内首条年产万台人形机器人产线
科技数码
乐聚建成国内首条年产万台人形机器人产线

3月29日,国内首条年产能万台级的人形机器人自动化产线在广东正式投入使用,人形机器人规模化量产能力取得重大突破。该产线年产能突破一万台,可实现每30分钟下线一台人形机器人,高效满足市场规模化交付需求

热心网友
03.30
华羿机器人登陆港交所市值破百亿,领跑国内国际市场
AI
华羿机器人登陆港交所市值破百亿,领跑国内国际市场

今日,华沿机器人正式在港交所挂牌上市,开启了其资本市场的新征程。此次上市,华沿机器人发售价定为每股17 00港元,折合人民币约14 99元。开盘时,股价为16 8港元,即人民币14 82元,而收盘价

热心网友
03.30