陶哲轩团队认可谷歌AI系统AlphaEvolve:大规模数学研究实现新突破
11月19日消息,谷歌旗下DeepMind开发的人工智能工具在辅助数学研究中展现出惊人的效率。参与测试的数学家表示,这项技术有望推动人工智能驱动的数学发现迈入前所未有的规模化新阶段。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据了解,今年5月谷歌正式发布了名为AlphaEvolve的人工智能系统,该系统能够自主发现新的算法与数学公式。其工作原理分为两个阶段:首先由谷歌AI聊天机器人Gemini生成大量潜在解法;随后,这些候选方案被输入独立的AI评估模块,由后者剔除聊天机器人难以避免产生的无效结果。研发团队在50余道公开数学难题上对AlphaEvolve进行了测试,结果显示,在四分之三的案例中,该系统能重新发现人类已知的最优解法。
近日,加州大学洛杉矶分校的陶哲轩及其合作者对AlphaEvolve展开了更严谨、范围更广的测评,涵盖67道前沿数学研究问题。结果表明,该系统不仅能复现既有解法,有时还能生成更优化的方案;这些改进后的候选解可进一步输入其他专用AI系统进行验证与深化,例如计算资源需求更高的Gemini增强版,或是谷歌今年用于在国际数学奥林匹克竞赛中斩获金牌的AlphaProof系统,后者能将此类解法转化为形式严谨的新数学证明。
陶哲轩指出,由于67道问题难度各异,难以给出统一的成功率指标,但可以明确的是:该系统在解题速度上始终显著快于单个数学研究者。"倘若我们以传统方式应对这67个问题,即为每个问题单独编程开发专用优化算法,整个工作将耗时数年,项目甚至根本不会启动。"他强调,"AlphaEvolve使我们在前所未有的规模上开展数学研究成为可能。"
需要说明的是,AlphaEvolve目前仅适用于一类称为"优化问题"的数学问题,即在特定约束下寻找最优数值、公式或对象。尽管该系统已能处理数论、几何学等截然不同数学分支中的优化问题,陶哲轩坦言,此类问题"仅占数学家所关注问题总体的一小部分"。然而,AlphaEvolve展现出的强大能力正激励数学家尝试将非优化类问题重新建模为该系统可处理的形式。"这些工具如今已成为攻克此类问题的一种全新范式。"他表示。
不过,该系统也存在明显弊端:陶哲轩指出,它有时会"钻空子",即利用问题表述中的技术漏洞或边缘情形生成看似正确、实则并未真正解决问题的答案。"这就好比给一群极其聪明但毫无道德约束的学生出考题,他们只求技术性地拿到高分,不择手段。"
尽管存在上述缺陷,AlphaEvolve所取得的成果仍引发了数学界更广泛的关注。据团队成员、罗德岛州布朗大学的哈维尔·戈麦斯-塞拉诺介绍,此前许多数学家仅对ChatGPT等通用型AI工具抱有兴趣,而AlphaEvolve的出现显著提升了其对专业AI工具的关注度。目前该系统尚未向公众开放,但团队已收到来自全球数学研究者的大量试用申请。
"人们如今明显更加好奇,也更愿意尝试这些工具,"戈麦斯-塞拉诺表示,"大家都在积极探索其潜在应用场景。相较一两年前的情形,它已在数学界激发出空前浓厚的兴趣。"
对陶哲轩而言,此类AI系统为卸下部分常规性数学工作、释放人力以聚焦更具创造性的研究提供了可能:"全球数学家数量有限,我们无法对每一个问题都投入高强度思考;但现实中存在大量中等难度的问题,恰恰非常适合AlphaEvolve这类中等智能水平的工具来解决。"
卡内基梅隆大学的杰里米·阿维加德指出,机器学习技术对数学研究正日益显现出实用价值。"当前亟需计算机科学家与数学家之间开展更深入的协同合作,"他表示,"我相信未来将涌现更多类似成果,并有望将这些方法拓展至更抽象的数学分支。"
相关攻略
1 故障现象:OpenClaw无法联网搜索的典型报错 许多开发者在配置OpenClaw AI助手的搜索功能时,常常会遭遇一个典型故障:日常对话交互完全正常,但一旦触发需要联网查询信息的指令,界面便会立刻弹出“抱歉,我目前无法使用网络搜索功能(需要配置 API 密钥)”或“HTTP 401: Inv
1 4 万亿词元!阿里 Qwen3 6-Plus 刷新全球最大 AI 聚合平台 OpenRouter 日调用量纪录 这事儿挺震撼的。就在4月4日,全球最大的AI模型聚合平台OpenRouter在其官方账号上公布了一个爆炸性数字:阿里刚刚发布的千问新模型Qwen3 6-Plus,上线仅仅一天,日调用量
Solidus AI 是什么 在AI与Web3加速融合的当下,一个名为Solidus AI的项目提出了自己的解决方案。它将自己定位为“Web3原生的AI HPC基础设施”,其蓝图相当清晰:以位于欧洲的环保高性能计算(HPC)数据中心为基石,向上构建一个计算与AI工具市场,并最终通过AITECH代币完
Cardano (ADA) 2026年价格预测:AI深度解析与增长路径 在瞬息万变的加密市场,人工智能分析正成为洞察未来趋势的关键工具。近期,由Grok AI模型发布的Cardano(ADA)2026年价格预测引发了广泛关注,其大胆展望ADA或有望触及两位数美元价格。这不仅彰显了AI数据分析的潜力,
京东“全民养虾计划”:开启AI助手体验新纪元 科技领域近期迎来一场别开生面的创新活动:京东正式推出“全民养虾计划”。表面看,它与美食相关,实际上是一场针对AI智能体技术普及的宏大实验。该计划通过“购买AI硬件、赠送专业安装服务与趣味小龙虾”的组合策略,为当前热门的开源AI智能体——OpenClaw,
热门专题
热门推荐
解限机天袭者滨湾运输中心实战教学:制霸空中与地形的终极指南 在《解限机》游戏的所有对战地图中,滨湾运输中心无疑是对玩家战术素养与地图掌控力的顶级试炼场。这片区域地形结构极为复杂,高楼耸立,集装箱遍布,形成了无数视野盲区与火力交叉点。若想在滨湾运输中心取得胜利,空有强大机甲与火力是远远不够的,关键在于
Soul聊天记录一键清理:批量删除完整步骤与隐私保护技巧 管理社交应用,如同定期整理你的数字家园。随着使用时间增长,Soul中的聊天记录会不断累积,无论是为了释放宝贵的手机存储空间,还是出于对个人隐私安全的重视,掌握批量删除功能都显得尤为必要。本文将为你提供一份清晰、易操作的Soul聊天记录批量删除
知名爆料人Kiwi Talkz近日透露,《GTA6》开发已进入最终收尾阶段,游戏确认不会再次延期。据爆料消息指出,其他游戏厂商要追赶R星在《GTA6》中达成的技术与内容高度,恐需15至20年时间。R星团队在部分技术目标上的规划极具突破性,展现了远超行业当前水准的雄心。 对于持续等待的全球玩家来说,这
《鸣潮》奥古斯塔养成全攻略:核心材料解析与高效培养路线 若想在《鸣潮》中将强力角色奥古斯塔培养成真正的战场主宰,详尽了解其养成材料是至关重要的第一步。这些资源直接决定了角色从前期成长到后期成型的完整路径,规划是否合理将极大影响实战表现与队伍构建。 首先,系统梳理奥古斯塔所需的各类养成素材是基础。经验
索尼工作室悄然修改措辞,PlayStation独占策略或将全面收紧,引发行业热议 近期,游戏行业内部关注到一个值得玩味的现象:索尼互动娱乐旗下多家核心第一方工作室,静悄悄地更新了其官方网站的简介说明。仔细对比可以发现,更新后的措辞发生了微妙但关键的转变——此前涉及PC平台的描述已基本被移除,取而代之





