谷歌Gemini 3 Deep Think:奥数金牌级推理AI公测,截胡OpenAI
12月5日,科技媒体NeoWin发布报道称,谷歌面向Gemini Ultra订阅用户正式推出Gemini 3 Deep Think深度思考模式(Deep Think),该模式已于今日全面集成至Gemini应用中。Gemini Ultra 用户每月订阅费用为249.99美元。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
相比标准版Gemini 3 Pro模型,Deep Think模式通过调用更庞大的计算资源并采用全新的技术架构实现升级。即日起,Google AI Ultra订阅用户可直接在提示栏中选择“Deep Think”选项,即可启用这一强化推理功能。

谷歌最新测试数据显示,Deep Think模式在处理复杂数学问题、科学推理及逻辑分析时展现出突破性表现。根据其官方博客介绍,在被业界称为“最严苛AI基准测试之一”的Humanity’s Last Exam中,该模型取得了41%的高分,刷新了行业纪录。
在GPQA Diamond科学知识测评中,其得分高达93.8%;而在包含代码执行的ARC-AGI-2高难度测试中,同样以45.1%的成绩展现出顶尖水准,充分证明了其在复杂任务中的卓越推理能力。

Deep Think模式之所以能够取得如此突破,关键在于采用了先进的并行推理技术,使模型能够同时探索多种解题路径以寻找最优解。这一机制大幅提升了模型处理复杂问题的效率与准确性。
值得关注的是,该模型的变体此前已在国际数学奥林匹克竞赛与国际大学生程序设计竞赛全球总决赛中达到“金牌标准”。特别是在IMO竞赛环境下,模型需在无法访问互联网或外部工具的前提下,在两段4.5小时的限时测试中独立完成解题并撰写自然语言证明。
谷歌此次公测被视为对竞争对手的有力回应。OpenAI曾于今年7月宣称其实验性推理模型达到数学奥赛金牌水平,但截至目前该模型仍未向公众开放。
随着谷歌率先将达到IMO金牌标准的模型推向市场,业内普遍预测,这一举措或将迫使OpenAI加快同类产品的发布节奏,大模型领域的“推理能力竞赛”将进一步升级。
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





