2月14日晚间消息,谷歌在北京时间13日晚正式宣布对Gemini的Deep Think推理模式进行重大升级,这款专门为科研与工程场景设计的模式旨在推动智能技术的前沿发展。
据介绍,新版Deep Think由谷歌研发团队联合各领域科学家与研究人员共同打造,旨在解决真实科研环境中常见的复杂问题:边界条件模糊、答案不唯一、数据杂乱或残缺等挑战。
本次升级的核心突破在于Deep Think的适用范围进一步扩大。谷歌表示,更新后的Deep Think将于当地时间2月12日起,通过Gemini应用向Google AI Ultra订阅用户开放。
谷歌首次通过Gemini API向部分研究人员、工程师与企业提供Deep Think功能,采取“早期访问计划”的推进策略,并同步开放申请入口以招募意向用户。
在能力表现方面,谷歌强调新版Deep Think在数学、算法与编程等高难度推理任务上持续提升。该模式在不借助外部工具的情况下,在终极人类考试中取得48.4%的成绩;在ARC-AGI-2测试中达到84.6%的准确率,并获得ARC Prize基金会认证;在Codeforces编程竞赛基准测试中获得3455的Elo评分;同时在2025年国际数学奥林匹克竞赛中展现出金牌级别的解题能力。

除数学与编程领域外,谷歌还强调新版Deep Think在化学、物理等科学领域同样具备更强能力。最新数据显示,该模式在2025年国际物理奥林匹克与国际化学奥林匹克笔试部分取得金牌级表现,同时在理论物理相关的CMT-Benchmark测试中获得50.5%的得分。

谷歌表示,Deep Think的目标不仅是追求基准测试成绩,更希望推动实际工程与科研应用,例如帮助研究人员解析复杂数据、协助工程师通过代码对物理系统进行建模。谷歌称,未来将持续把Deep Think带到研究者和实践者“最需要的地方”,而通过Gemini API开放早期访问被视为实现这一目标的重要步骤。

