首页 游戏 软件 资讯 排行榜 专题
首页
礼仪与书信
谷歌Gemini升级版3.1 Pro低调发布:小更新与AI竞赛长跑逻辑

谷歌Gemini升级版3.1 Pro低调发布:小更新与AI竞赛长跑逻辑

热心网友
82
转载
2026-02-20

  【CNMO】马年春节的热闹劲儿还没完全过去,国内的大模型战场正打得火热,硅谷那边也没闲着。就在行业还在消化上周Gemini 3 Deep Think、Claude Sonnet 4.6等一系列密集更新时,北京时间2月19日深夜,谷歌又毫无预兆地掷出了一枚“核弹”——Gemini 3.1 Pro正式上线。



  对于关注AI动态的人来说,这个消息来得既突然,又在情理之中。毕竟,距离去年11月Gemini 3 Pro发布才刚过三个月。但真正耐人寻味的,不是发布节奏的加快,而是谷歌这次打出的牌:一个“.1”的小版本迭代,却实现了让竞争对手大版本更新都汗颜的性能跃升。

“.1”背后的野心:推理能力翻倍与“思考模式”的进化

  Gemini 3.1 Pro的最新叙事非常聚焦:专为复杂任务而生,将机器的核心推理能力推向新高度。

  数据是最直观的佐证。在衡量AI应对全新逻辑问题能力的 ARC-AGI-2 基准测试中,Gemini 3.1 Pro拿下了77.1% 的实测得分。这是什么概念?上一代Gemini 3 Pro的得分是31.1%。虽然业内对于ARC-AGI测试集是否可能出现在训练数据中仍存有谨慎的讨论,但超过一倍的增长,即便剔除“刷题”水分,其底层逻辑能力的精进也是不容小觑的。

  另一个值得关注的维度是幻觉控制。在AA-Omniscience Index(衡量模型对自身知识边界认知能力的指标)上,Gemini 3.1 Pro从前代的13分跃升至30分,在主流模型中排名第一。这或许比单纯的跑分更具现实意义——在大模型从“玩具”走向“工具”的过程中,知道“我不知道”往往比强行生成一个似是而非的答案更重要。

  如果说跑分只是纸上谈兵,那么“三层思考模式”(Low/Medium/High)的引入,则是谷歌在工程落地层面的一次精妙设计。这相当于给模型装了一个可调节的“算力旋钮”。

  过去的模型是“一勺烩”,简单问答和复杂推理消耗的资源一样,成本和效率都不经济。现在,用户可以根据任务难度自主选择:日常闲聊用Low模式追求极速响应;复杂的数据分析或代码调试用High模式,让模型进入类似Deep Think的状态,花几分钟时间进行深度推理。这种对“计算-质量-成本”三角关系的显式化管理,体现的正是AI进入生产环境后的成熟度思维。

不止于“手搓”Demo:从代码生成到“氛围编程”

  当然,技术参数的进步最终要回归到用户体验。这次谷歌及其合作方展示的一系列案例,比以往任何时候都更具“杀伤力”。

  最直观的进化体现在视觉生成上。同样是生成“鹈鹕骑自行车”的SVG动画,Gemini 3 Pro生成的结果可能只是元素的堆砌,而Gemini 3.1 Pro生成的画面中,鹈鹕的身体结构、骑行姿态不仅更符合物理常识,甚至连自行车的链条、脚踏这些细节都清晰可见。

  但这不仅仅是画质的提升,更是对复杂指令理解能力的跃迁。开发者们用实测证明了这一点:

  有人让Gemini 3.1 Pro生成一个Windows 11风格的Web操作系统,结果它直接返回了一个包含完整图标、开始菜单和基础交互逻辑的可运行界面,与之前3.0 Pro生成的简陋形态形成鲜明对比。

  还有人要求它为《呼啸山庄》设计一个现代风格的个人作品集 。模型不仅完成了代码编写,更令人惊叹的是,它似乎“读懂了”小说中那种阴郁、狂野的文学氛围,并将其转化为了 的色彩、排版和整体视觉语言。这被一些开发者称为“氛围编程”的开始——模型不再只是执行指令的工具,而是能理解意图的创意伙伴。

  在更硬核的工程领域,Gemini 3.1 Pro也展示了其接入现实世界的能力。无论是直接接入公开遥测数据流,实时追踪国际空间站轨道的仪表盘,还是可交互的3D椋鸟群飞模拟,都证明了它在处理复杂API、构建完整应用方面的成熟度。

竞赛进入下半场:谷歌开始“卷”了,但卷的是“长跑”

  面对Gemini 3.1 Pro的发布,技术社区的评价呈现出有趣的分化。乐观派看到了它在硬核基准上的全面领先:在Artificial Analysis的综合智能维度以57分居首,超越Claude Opus 4.6的53分;在科学知识测试GPQA Diamond上更是拿下94.3%的高分。

  但质疑声同样存在。Gartner分析师William McKeon-White的评价代表了一种审慎态度:“这是好的持续进步,但没有什么根本性的游戏规则改变者。 ” 华盛顿大学教授Chirag Shah则进一步指出,更好的推理能力是处理复杂任务的必要条件,但并非充分条件,更何况“复杂”本身就是一个模糊的定义。

  然而,如果我们跳出单纯的性能对比,从行业战略层面审视这次发布,会发现一个更值得关注的信号:谷歌的迭代策略开始变得空前激进。

  这是谷歌首次在Gemini系列中使用“.1”作为版本增量。此前无论是从1.0到1.5,还是2.0到2.5,都是0.5的跨度。现在改为0.1的细粒度更新,意味着谷歌放弃了过去追求“大版本震撼”的发布模式,转向更贴近工程实际、更快速的持续迭代。

  这种转变本身就说明了AI竞赛的残酷性:单次爆发的窗口期正在急剧收窄。 在Anthropic发布Sonnet 4.6仅两天后,谷歌就携3.1 Pro正面回击。头部厂商的技术差距正在肉眼可见地缩小,大家拼的不再是谁能憋出“王炸”,而是谁能以更快的速度、更稳的步伐进行“长跑”。

  更耐人寻味的是定价。Gemini 3.1 Pro预览版的API价格与上一代完全持平:输入每百万tokens 2美元起,输出12美元起。这在一众涨价的竞品中显得尤为突出。Artificial Analysis算了一笔账:跑完其智能指数测试集,Gemini 3.1 Pro的花费还不到Claude Opus 4.6的一半。

当最强的模型不再伴随最高的溢价,这意味着大模型行业的竞争已经从“性能溢价”阶段,进入了“性能普惠”的新阶段。

结语:重新定义“王座”

  有人说Gemini 3.1 Pro是来“抢王座”的。但在我看来,在这样一个每周都有新王登基的时代,“王座”本身的概念正在被消解。

  过去,我们习惯于用一两个基准测试的榜首来定义王者。但今天,当谷歌用一个“.1”版本就实现了推理能力翻倍、幻觉率大幅下降,并将最强能力以最低价格推向市场时,它传递的信息其实是:AI竞赛的下一程,比的不是谁在领奖台上站得更高,而是谁能构建一个让开发者和企业真正愿意扎根的生态。

  Gemini 3.1 Pro或许不是一个颠覆性的“游戏规则改变者”,但它清晰地划出了谷歌的赛道:凭借Google Cloud和Workspace构成的企业基础设施,以及对核心推理能力的持续打磨,谷歌正在向外界证明,它要做的是那个能满足企业所有模型需求的“一站式商店”。

  AI的2026年,就这样在硅谷的你追我赶中拉开了序幕。DeepSeek们何时会再次出场“杀死比赛”仍是未知数,但可以确定的是,这场游戏的节奏,已经快到让所有人都必须屏住呼吸。

来源:https://www.163.com/dy/article/KM7Q79Q6051191D6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

苹果聘请前谷歌副总裁分管AI产品营销
科技数码
苹果聘请前谷歌副总裁分管AI产品营销

据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有

热心网友
03.29
谷歌为Google TV集成Gemini三大功能,优化互动体验
娱乐
谷歌为Google TV集成Gemini三大功能,优化互动体验

【CNMO科技消息】近日,谷歌宣布为Google TV上的Gemini助手推出三项全新功能,进一步升级家庭大屏的互动体验。此次更新聚焦于更直观的视觉回答、深度的知识探索以及便捷的体育资讯概览,旨在将

热心网友
03.29
曾轰动一时的全球现象,为何仅用两年就衰退了?
科技数码
曾轰动一时的全球现象,为何仅用两年就衰退了?

3月24日,人工智能领域迎来了一次沉重的转折。美国开放人工智能研究中心(OpenAI)在社交媒体上正式发布公告,宣布关停旗下人工智能视频生成工具Sora,这款明星产品,在历经两年的高光与挣扎后,正

热心网友
03.29
DDR5内存数月首降,曝光幕后推手及选购技巧
娱乐
DDR5内存数月首降,曝光幕后推手及选购技巧

快科技39日消息,持续数月走高的DDR5内存价格,终于迎来了首次明显回落。据市场跟踪数据显示,本周美国多家零售商的DDR5内存出现大范围降价,单套最高降幅达100美元,不过此次优惠仅覆盖少数厂商,

热心网友
03.29
DDR5内存迎数月首次大降价,三大幕后推手曝光
礼仪与书信
DDR5内存迎数月首次大降价,三大幕后推手曝光

快科技39日消息,持续数月走高的DDR5内存价格,终于迎来了首次明显回落。据市场跟踪数据显示,本周美国多家零售商的DDR5内存出现大范围降价,单套最高降幅达100美元,不过此次优惠仅覆盖少数厂商,

热心网友
03.29

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

鲁大师软件管家使用教程:一键升级常用电脑软件
电脑教程
鲁大师软件管家使用教程:一键升级常用电脑软件

鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;

热心网友
03.29
北京推进智能网联新能源车险,支持L2-L4级别统一适配
科技数码
北京推进智能网联新能源车险,支持L2-L4级别统一适配

3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失

热心网友
03.29
苹果今年将发布两款新iPhone应用,包含聊天机器人
科技数码
苹果今年将发布两款新iPhone应用,包含聊天机器人

预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple

热心网友
03.29
苹果聘请前谷歌副总裁分管AI产品营销
科技数码
苹果聘请前谷歌副总裁分管AI产品营销

据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有

热心网友
03.29
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀
科技数码
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀

3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个

热心网友
03.29