11月19日消息,谷歌旗下DeepMind开发的人工智能工具在辅助数学研究中展现出惊人的效率。参与测试的数学家表示,这项技术有望推动人工智能驱动的数学发现迈入前所未有的规模化新阶段。

据了解,今年5月谷歌正式发布了名为AlphaEvolve的人工智能系统,该系统能够自主发现新的算法与数学公式。其工作原理分为两个阶段:首先由谷歌AI聊天机器人Gemini生成大量潜在解法;随后,这些候选方案被输入独立的AI评估模块,由后者剔除聊天机器人难以避免产生的无效结果。研发团队在50余道公开数学难题上对AlphaEvolve进行了测试,结果显示,在四分之三的案例中,该系统能重新发现人类已知的最优解法。
近日,加州大学洛杉矶分校的陶哲轩及其合作者对AlphaEvolve展开了更严谨、范围更广的测评,涵盖67道前沿数学研究问题。结果表明,该系统不仅能复现既有解法,有时还能生成更优化的方案;这些改进后的候选解可进一步输入其他专用AI系统进行验证与深化,例如计算资源需求更高的Gemini增强版,或是谷歌今年用于在国际数学奥林匹克竞赛中斩获金牌的AlphaProof系统,后者能将此类解法转化为形式严谨的新数学证明。
陶哲轩指出,由于67道问题难度各异,难以给出统一的成功率指标,但可以明确的是:该系统在解题速度上始终显著快于单个数学研究者。"倘若我们以传统方式应对这67个问题,即为每个问题单独编程开发专用优化算法,整个工作将耗时数年,项目甚至根本不会启动。"他强调,"AlphaEvolve使我们在前所未有的规模上开展数学研究成为可能。"
需要说明的是,AlphaEvolve目前仅适用于一类称为"优化问题"的数学问题,即在特定约束下寻找最优数值、公式或对象。尽管该系统已能处理数论、几何学等截然不同数学分支中的优化问题,陶哲轩坦言,此类问题"仅占数学家所关注问题总体的一小部分"。然而,AlphaEvolve展现出的强大能力正激励数学家尝试将非优化类问题重新建模为该系统可处理的形式。"这些工具如今已成为攻克此类问题的一种全新范式。"他表示。
不过,该系统也存在明显弊端:陶哲轩指出,它有时会"钻空子",即利用问题表述中的技术漏洞或边缘情形生成看似正确、实则并未真正解决问题的答案。"这就好比给一群极其聪明但毫无道德约束的学生出考题,他们只求技术性地拿到高分,不择手段。"
尽管存在上述缺陷,AlphaEvolve所取得的成果仍引发了数学界更广泛的关注。据团队成员、罗德岛州布朗大学的哈维尔·戈麦斯-塞拉诺介绍,此前许多数学家仅对ChatGPT等通用型AI工具抱有兴趣,而AlphaEvolve的出现显著提升了其对专业AI工具的关注度。目前该系统尚未向公众开放,但团队已收到来自全球数学研究者的大量试用申请。
"人们如今明显更加好奇,也更愿意尝试这些工具,"戈麦斯-塞拉诺表示,"大家都在积极探索其潜在应用场景。相较一两年前的情形,它已在数学界激发出空前浓厚的兴趣。"
对陶哲轩而言,此类AI系统为卸下部分常规性数学工作、释放人力以聚焦更具创造性的研究提供了可能:"全球数学家数量有限,我们无法对每一个问题都投入高强度思考;但现实中存在大量中等难度的问题,恰恰非常适合AlphaEvolve这类中等智能水平的工具来解决。"
卡内基梅隆大学的杰里米·阿维加德指出,机器学习技术对数学研究正日益显现出实用价值。"当前亟需计算机科学家与数学家之间开展更深入的协同合作,"他表示,"我相信未来将涌现更多类似成果,并有望将这些方法拓展至更抽象的数学分支。"
