谷歌Gemini 3升级:Deep Think模型强化科研与多领域能力
谷歌近期宣布对其人工智能模型Gemini 3 Deep Think进行重大升级,推出了专为科研与工程领域设计的"推理模式"。这一版本由谷歌工程师联合多领域科研人员共同开发,旨在解决真实科研场景中普遍存在的复杂问题——包括边界模糊、多解并存以及数据不完整等挑战。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在应用范围方面,升级后的Deep Think自2月12日起通过Gemini应用向Google AI Ultra订阅用户开放。同时,谷歌首次通过Gemini API向特定研究人员、工程师和企业开放"早期访问计划",并设置申请通道招募测试用户。这一举措标志着该技术开始从实验室走向实际应用场景。
性能测试显示,新版模型在数学与编程领域表现尤为突出。在不借助外部工具的情况下,该模型在终极人类考试中取得48.4%的成绩,在ARC-AGI-2测试中达到84.6%(经ARC Prize Foundation验证),在Codeforces编程竞赛基准中获得3455的Elo评分,更在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水平。这些数据表明其推理能力已接近人类顶尖水准。
除计算领域外,模型在自然科学方面同样展现优势。在2025年国际物理奥林匹克与国际化学奥林匹克模拟笔试中,该模型均取得金牌级成绩,并在理论物理基础测试CMT-Benchmark中获得50.5%的得分。这些突破使其成为首个在多学科奥赛级别测试中均表现优异的人工智能系统。

谷歌强调,Deep Think的研发不仅关注基准测试分数,更注重实际科研与工程应用。该模型可协助研究人员解析复杂数据集,帮助工程师通过代码构建物理系统模型。通过Gemini API的早期访问计划,谷歌希望将这项技术推广至科研机构和工业界,解决现实世界中的技术难题。目前,首批测试用户已开始在气候建模、新材料开发等领域展开应用探索。
热门专题
热门推荐
华硕联席CEO许先越:苹果MacBook Neo冲击PC生态圈,定位“笔记本形态iPad” PC行业最近又迎来一个重磅话题。科技媒体PCMag日前报道称,在近期的财报电话会议上,华硕联席CEO许先越发表了一个引人瞩目的判断:苹果推出其最便宜的MacBook Neo笔记本,对整个PC行业而言,无疑是一
安伯尼克 Anbernic RG VITA 系列掌机规格揭晓:紫光展锐 T618 瑞芯微 RK3576 芯片 安伯尼克 Anbernic 于昨日通过视频,正式揭开了RG VITA及VITA Pro两款掌机的详细规格面纱。对于关注掌上游戏设备的玩家来说,这波参数放送,信息量着实不小。 具体两款机型
在龙族卡塞尔之门的战场,皇女零的阵容搭配艺术 想在《龙族卡塞尔之门》的战场上最大化皇女零的威力?阵容的搭配可是一门学问。她自身无疑是核心的输出利器,但要让这把利刃发挥极致,就得围绕她构建一个既能稳固防守、又能创造绝佳输出时机的团队。 核心角色选择:强攻与辅佐的默契 皇女零的定位清晰——核心输出。因此
XRP ETF:2025 年的最新发展 如果说2024年是比特币和以太坊ETF的“破冰之年”,那么2025年的聚光灯,无疑转向了XRP。随着现货比特币和以太坊ETF成为主流金融机构的标准配置,全球市场的目光正聚焦于下一个可能爆发的领域:XRP及其各类交易所交易基金(ETF)。从基于期货的美国产品到已
飞读小说APP:三步“读心术”,精准找到你的下一本心头好 面对海量书库,如何在飞读小说里高效率地挑出那本合胃口的好书?这事说难也简单,关键在于摸清楚平台的推荐逻辑和筛选工具。今天,我们就来把这套“选小说”的实用方法论,给你讲明白。 飞读小说app小说选择方法: 第一步,精准定位你的“阅读舒适区”。打





