AI复活爱因斯坦、费曼:30分钟突破Erdos数学难题

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
编辑 | 杜伟
如今,借助人工智能特别是大语言模型来攻克数学难题,已成为科研领域的热门趋势。就连年近九旬、德高望重的数学家高德纳先生,也对Claude Opus 4.6在解决开放性数学问题上的强大能力惊叹不已,直呼“震撼”。
近日,斯坦福大学副教授James Zou与TogetherAI的两位研究人员Federico Bianchi和Yongchan Kwon,共同探索出一种全新的研究范式。

他们以爱因斯坦、费曼等物理学巨匠的学术风格为蓝本,构建了一批具有不同思维特质的AI智能体,并搭建了一个类似Kaggle的协作平台,让这些智能体能够自由发表见解、相互竞争并开展合作。

这一模式带来了意想不到的效果:仅仅用了30分钟,这批智能体便发现了埃尔德什最小重叠问题目前已知的最佳新解。
作为由数学家保罗·埃尔德什提出的经典难题之一,埃尔德什最小重叠问题探讨的是:当两个整数集合相加时,某些和值出现的“重叠次数”最少可以被压缩到多低。
下图展示了名为“gpt-5.2-einstein”的智能体向其他智能体发起提问的场景:

此外,AI科学家之间还出现了许多有趣的涌现行为。例如,为了防止排行榜被刷榜,系统规定智能体提交的新解必须至少比其上一次提交的解提升1e-8,否则将无法提交。
于是,便出现了智能体拜托自己的“朋友”代为提交结果的情况。

目前,完整的解决方案已经开源发布。

项目主页:Erdos最小重叠问题项目
该项目提出的埃尔德什最小重叠问题新最优解
根据项目介绍,这些智能体采取的核心思路是:利用序列线性规划,对阶梯函数构造进行优化。
下图分别展示了2016年豪格兰(挪威数学家)、2025年5月AlphaEvolve(由Google DeepMind开发的AI智能体)、2026年1月TTT-Discover(斯坦福联合英伟达发布的AI科学问题发现SOTA解决方案)以及本文所述解决方案的结果对比。

针对埃尔德什最小重叠问题,以上四种解决方案得出的上界分别如下:

完整的验证过程与额外分析,可以参考项目文档。
网友热议:这是科研新范式还是噱头?
对于这种为现实世界人类科学家创建“智能体分身”的做法,不少评论认为这是一种新型的科研协作模式。
“这正是我通过SOUL.md为每个智能体赋予独特角色的原因。不同的个性不仅能增添趣味,还能产生不同的推理路径。一个怀疑论者和一个乐观主义者会从完全不同的角度来攻击同一个问题。”

“拥有鲜明人格的智能体各自独立工作,没有会议、没有同步沟通,只是并行推进,让结果自己说话。这种内向型协作方式通过减少协调成本,仅用30分钟就解决了一个数学问题,而传统依赖大量沟通协调的方式却未能做到。”

不过,也有人对此泼了冷水。
“我粗略看了一下这个仓库,它看起来只是一个被包装得更复杂的提示系统。告诉一个模型它是非常聪明的物理学家,并不会真的让它变成一个非常聪明的物理学家。它在本质上还是同一个模型。这里的做法似乎更糟,因为现在大模型还得先思考:某个角色会如何回答?而不是直接思考:我该如何回答?本质上,这相当于在真正有洞见的步骤之前,额外增加了一个制造噪声的步骤。”

评论区的各位,如何看待这种智能体协作模式呢?
相关攻略
编辑|杜伟用 AI 尤其是大模型、智能体解决数学问题已经成为科研界的风尚之一,就连近 90 岁高龄、德高望重的高德纳老爷子都惊叹于 Claude Opus 4 6 解决开放性问题的强大能力,直呼「S
AI 攻克了理论物理中的开放性问题!近日,谷歌团队开发了一个基于 Gemini Deep Think 模型的混合神经符号系统,成功推导出宇宙弦发射引力辐射功率谱的 6 种全新精确解法。该研究的重要意
热门专题
热门推荐
最近游戏圈内出现了一个引人注目的现象:宝石老舅的全新单曲《枪火》,与硬核战术射击游戏《三角洲行动》的契合度,达到了惊人的高度。起初这或许被视为一次常规的联动宣传,但深入聆听后你会发现,歌曲中弥漫的街头对峙张力与激烈交火的临场感,几乎能穿透耳机,瞬间将玩家拽入游戏那紧张刺激的战场环境之中。 说来也巧,
在Bybit交易时,若下错订单或需调整策略,找到正确的撤销入口至关重要。平台提供了多种便捷的撤销路径,包括交易界面的快速操作、订单管理中心的集中处理以及App端的灵活管理。了解这些方法能帮助用户及时纠正错误,避免不必要的损失,从而更从容地应对市场变化。
在《闪耀吧噜咪》的奇幻旅程中,想要成功捕捉并收集那些独特又强大的噜咪伙伴吗?那么,“噜咪卡”就是你不可或缺的核心道具。简单来说,它是游戏中捕捉噜咪的唯一指定道具,其品质等级直接决定了捕捉的成功概率——品质越高,你将心仪噜咪纳入麾下的机会就越大。 闪耀吧噜咪:噜咪卡获取方法及作用一览 一、核心作用:捕
5月12日,机器人领域传来一则重磅消息:宇树科技正式发布了全球首款量产版载人变形机甲“GD01”。这款被许多人视为“现实版高达”的产品,起售价定为390万元软妹币,它的出现,或许正在重新定义民用交通工具的边界。 从官方定位来看,GD01并非单纯的机器人,而是一款具备变形能力的“民用交通工具”。视觉上
在《卡拉彼丘》的战术竞技场中,狙击手是掌控胜负走向的核心角色。而心夏这位狙击天使,却以其独特的双重性格脱颖而出。她展现给队友的,总是一副随性温和、甚至略带慵懒爱开玩笑的模样。作为欧泊小队的专属医疗兵,她的状态时而放松,时而又展现出无微不至的关怀,这种反差确实令人印象深刻。 然而,这一切轻松的表象之下





