谷歌Gemini 3 Flash模型发布,深夜突袭OpenAI,性能超GPT-4o
12月18日,就在Gemini 3 Pro发布尚不足一个月之际,谷歌在北京时间今日凌晨宣布,推出更注重效率的Gemini 3 Flash模型。

谷歌为其赋予了清晰的定位:在显著降低使用成本的同时,尽最大可能保留旗舰模型的专业级推理能力,使其更胜任日常应用场景。
测试结果显示,Gemini 3 Flash不仅全面超越了多款前代Gemini 2.5 Pro模型,还在多项核心对比中与OpenAI的GPT-5.2旗鼓相当。而后者正是OpenAI为应对Gemini 3 Pro而紧急推出的新版本。
在Humanity‘s Last Exam等高难度基准测试中,双方在无需借助外部工具的情况下,表现差距不足一个百分点。
在专门用于评估多模态理解和推理能力的MMMU-Pro测试中,Gemini 3 Flash取得了81.2%的成绩,略高于GPT-5.2的79.5%。
这表明,即使在“Extra High”推理模式下,Gemini 3 Flash仍能与GPT-5.2保持接近的性能,已展现出对OpenAI不容小觑的竞争压力。

据了解,谷歌已将Gemini 3 Flash作为默认模型,推送至Gemini App以及搜索中的AI Mode。谷歌表示,该模型面向全球用户免费开放,旨在提供更强大的日常AI助手能力。
此外,谷歌AI Mode还新增了对Nano Banana Pro的直接访问入口。美国地区的用户只需在模型选择器中依次启用“Thinking with 3 Pro”和“Create Images Pro”,即可在聊天界面中直接生成图像。
相关攻略
2026年谷歌I O大会聚焦人工智能进展。数据显示,谷歌平台每月处理Token量超3200万亿,同比激增7倍。Gemini应用月活用户突破9亿,实现翻倍增长,每日用户请求量也增长超7倍。此外,NanoBanana模型累计生成图片总量已超500亿张。
谷歌发布WearOS7,重点优化续航与智能交互。续航最高提升10%,缓解充电焦虑。新系统引入GeminiIntelligence智能能力,可理解指令并串联多步骤完成任务,使手表成为主动的智能伙伴。它还能减少掏手机频率,协调跨设备自动化流程。同时推出的AppFunctionsAPI支持开发者整合智能能力,创造更自然交互体验。
谷歌发布WearOS7智能手表系统,续航最高提升10%。新系统引入GeminiIntelligence智能能力,支持理解复杂指令、串联多步骤任务,实现更自然的交互。同时通过自动化体验减少对手机的依赖,并推出开发者接口以整合智能体能力。
谷歌推出Play商店新功能AskPlay,支持连续对话筛选应用与游戏。用户可逐步添加条件,系统合并语义以精准推荐。同时推出结果摘要功能,帮助快速预览。Gemini也将深度整合,根据对话意图主动推荐相关应用。这些变化使应用发现更智能便捷。
谷歌近日为安卓版Find Hub应用低调上线了一项智能位置共享新功能,进一步优化了实时位置追踪的体验。据科技媒体Android Authority披露,当联系人已与你共享实时位置后,你现在可以灵活设置接收对方“到达”或“离开”特定地点的自动通知。 该功能的操作入口设计得十分清晰。在Find Hub应
热门专题
热门推荐
近日,国家能源局联合发改委、工信部、国家数据局正式印发《关于促进人工智能与能源双向赋能的行动方案》。这份重磅文件的核心思路非常清晰:一方面,以坚实的能源基础支撑人工智能(AI)的快速发展;另一方面,利用AI技术赋能能源行业转型升级。其核心目标是推动能源、算力、应用场景、数据与算法模型五大关键要素深度
在挑选文生视频工具时,若您正在智谱清影与Runway Gen-3之间权衡,那么了解两者在生成效果上的具体差异,将有助于您做出更明智的选择。本文将从画质清晰度、细节纹理、运动自然度与视频连贯性等核心维度,通过实测对比为您详细解析。 一、画质与分辨率表现 首先对比硬性指标。智谱清影基于CogVideoX
想用通义万相生成一张科技感十足的数据可视化背景,但出来的画面总觉得少了点“内味儿”?数字界面、粒子流、电路纹理这些关键元素一个不见,画面平平无奇?这通常不是工具的问题,而是提示词没有精准锚定科技可视化的核心要素,或者模型参数没调到最佳状态。别急,下面这几种方法,能帮你把想法精准地“翻译”成画面。 一
想要在Vidu生成的视频中实现流畅的慢动作或快进效果?虽然模型界面没有提供直接调整播放速度的滑块,但通过巧妙的提示词设计、利用内置功能,或结合后期处理工具,你完全可以精准掌控视频的节奏与时间感。本文将为你详细解析四种实用方法,从生成前到生成后,全方位满足你的创作需求。 一、通过精准提示词引导运动节奏
当您使用海螺AI生成的英文论文在提交查重时遭遇高重复率或AIGC检测异常,请不要急于归咎于工具本身。核心原因在于,尽管AI生成的文本格式标准、语法地道,但其语言模式和常见短语组合,并未针对知网、维普、万方等中文查重数据库的语义比对逻辑进行专门优化。换言之,机器认为流畅自然的表达,在查重系统的算法看来





