游乐游手机版
首页/科技数码/文章详情

Gemini Pro 3.1曝光:能力倍增价格不变,谷歌重塑AI竞争格局

时间:2026-02-20 11:07
推理能力翻倍,价格不变,这一次 Google 是真的想重新定义 AI 竞争的规则。作者|桦林舞王编辑|靖宇马年「AI 春运」赛程过半,OpenAI、Anthropic、阿里等玩家相继拿出新活儿,现在


推理能力翻倍提升,价格却保持不变——这一次,Google正在重新定义AI领域的竞争规则。


作者|桦林舞王

编辑|靖宇

马年“AI春运”赛程过半,OpenAI、Anthropic、阿里等玩家纷纷亮出新招,现在,Google也正式加入了战局!

当地时间2月19日,Google正式揭晓了Gemini 3.1 Pro最新模型。

这次Google没有玩任何花哨的概念,而是直接用数据说话。

在公认的推理基准测试ARC-AGI-2中,Gemini 3.1 Pro获得了77.1%的优异成绩。这意味着什么?它的前辈Gemini 3 Pro仅有31.1%,就连专门用于“深度思考”的Gemini 3 Deep Think也仅有45.1%。

从31.1%跃升至77.1%,这并非渐进式改进,而是推理能力的质的飞跃。

更让人意外的是,Google选择了一个近乎“反商业”的策略:维持原价。Gemini 3.1 Pro保持了与Gemini 3 Pro完全相同的定价结构——相当于为所有API用户免费升级了推理能力。

JetBrains的AI总监Vladislav Tankov在测试后坦言:相比之前版本有15%的质量提升,“更强大、更迅速……且效率更高,所需的输出tokens更少”。

这种“暴力美学”式的升级,让我想起了早期Google的作风——用技术说话,用实力碾压。

这次,Google能凭借Gemini 3.1 Pro,继续惊艳世界吗?

01

“.1”版本号的野心

细心的人可能注意到,这是Google首次使用“.1”这样的增量版本号。

在软件行业,“.1”通常意味着重要的功能更新,但并非颠覆性的架构重构。Google选择3.1而非4.0,实际上是在向市场传递一个信号:

我们还有更大的招数没出。


Gemini 3.1 Pro与自家和友商模型数据对比|图片

从企业客户的反馈来看,这个“.1”的威力确实不容小觑。

Databricks的CTO报告称,新模型在OfficeQA基准上取得了“同类最佳的结果”。Cartwheel的联合创始人更是直接指出,模型对3D变换的理解有了“显著提升”,解决了3D动画管道中长期存在的旋转顺序问题。

Box AI的企业评估数据更加直观:在医疗和生命科学领域,准确性从47%跃升至67%;在法律任务中,准确性从57%提升到74%。

这些不是实验室里的跑分游戏,而是真实商业场景中的能力验证。

02

AI竞争进入“推理纪元”

如果说过去一年的AI竞争是“谁更聪明”的比拼,那么Gemini 3.1 Pro的发布策略,可能正在把游戏规则拉向“谁更划算”。

在大多数基准测试中,Gemini 3.1 Pro都领先于Anthropic的Opus 4.6和OpenAI的GPT-5.2,但价格却是Opus 4.6的一半。这种性价比优势,对于大量使用AI API的企业客户来说,吸引力是致命的。

一位开发者在社区分享了一个令人印象深刻的案例:他用单个提示让Gemini 3.1 Pro构建了一个功能完整的Windows 11风格网络操作系统,包括文本编辑器、Python终端、代码编辑器、文件管理器、绘图应用和可玩游戏。

这种“一个提示解决复杂问题”的能力,正是推理模型的核心价值所在。

当然,Gemini 3.1 Pro也并非完美无缺。在GDPval-AA这个衡量真实世界经济任务的基准测试中,它的得分为1317分,明显低于Anthropic Sonnet 4.6的1633分。这提醒我们,即使是最先进的AI模型,在处理复杂现实问题时仍有局限性。


Gemini 3.1 Pro在设计上也更有“品味”了|图片

VentureBeat的分析师一针见血地指出:“Google加倍投入核心推理和ARC-AGI-2等专业基准,表明AI竞赛的下一阶段,将由能够思考问题的模型赢得,而不仅仅是预测下一个词。”

这句话道出了当前AI竞争的本质变化。

过去两年,我们见证了ChatGPT从“会聊天的AI”进化为“会推理的AI”,见证了Claude从“安全的助手”变成“深度思考的伙伴”。

现在,Google用Gemini 3.1 Pro告诉市场:推理能力,才是AI模型的核心护城河。

从技术角度看,Gemini 3.1 Pro与Google的新型代理开发平台Antigravity深度集成,开发者可以切换不同的“推理预算”,在速度和准确性之间找到平衡。这种灵活性,可能是未来AI应用开发的新范式。

从商业角度看,Google选择“性能翻倍、价格不变”的策略,实际上是在用规模经济对抗技术溢价。这背后的逻辑很简单:我有足够的资源和效率优势,可以用更低的成本提供更好的服务。

这场AI军备竞赛,正在从“技术炫技”回归到“商业本质”。

Gemini 3.1 Pro的发布,让我想起了那个曾经“不作恶”的Google——用技术改变世界,用创新降低门槛。虽然这家公司在过去几年经历了不少争议,但在AI这个关键战场上,它似乎正在找回自己最擅长的节奏。

当然,OpenAI和Anthropic不会坐以待毙。这场推理能力的军备竞赛才刚刚开始。

*头图

来源:https://www.163.com/dy/article/KM7096EU05119FMA.html
上一篇比亚迪海豚登陆日本:11万销量背后的小车大智慧 下一篇AMD为“AI云”借款担保,加速英伟达GPU芯片销售布局
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5