谷歌Gemini 3升级:Deep Think模型强化科研与多领域能力
谷歌近期宣布对其人工智能模型Gemini 3 Deep Think进行重大升级,推出了专为科研与工程领域设计的"推理模式"。这一版本由谷歌工程师联合多领域科研人员共同开发,旨在解决真实科研场景中普遍存在的复杂问题——包括边界模糊、多解并存以及数据不完整等挑战。

在应用范围方面,升级后的Deep Think自2月12日起通过Gemini应用向Google AI Ultra订阅用户开放。同时,谷歌首次通过Gemini API向特定研究人员、工程师和企业开放"早期访问计划",并设置申请通道招募测试用户。这一举措标志着该技术开始从实验室走向实际应用场景。
性能测试显示,新版模型在数学与编程领域表现尤为突出。在不借助外部工具的情况下,该模型在终极人类考试中取得48.4%的成绩,在ARC-AGI-2测试中达到84.6%(经ARC Prize Foundation验证),在Codeforces编程竞赛基准中获得3455的Elo评分,更在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水平。这些数据表明其推理能力已接近人类顶尖水准。
除计算领域外,模型在自然科学方面同样展现优势。在2025年国际物理奥林匹克与国际化学奥林匹克模拟笔试中,该模型均取得金牌级成绩,并在理论物理基础测试CMT-Benchmark中获得50.5%的得分。这些突破使其成为首个在多学科奥赛级别测试中均表现优异的人工智能系统。

谷歌强调,Deep Think的研发不仅关注基准测试分数,更注重实际科研与工程应用。该模型可协助研究人员解析复杂数据集,帮助工程师通过代码构建物理系统模型。通过Gemini API的早期访问计划,谷歌希望将这项技术推广至科研机构和工业界,解决现实世界中的技术难题。目前,首批测试用户已开始在气候建模、新材料开发等领域展开应用探索。
热门专题
热门推荐
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练





