AI复活爱因斯坦、费曼:30分钟突破Erdos数学难题

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
编辑 | 杜伟
如今,借助人工智能特别是大语言模型来攻克数学难题,已成为科研领域的热门趋势。就连年近九旬、德高望重的数学家高德纳先生,也对Claude Opus 4.6在解决开放性数学问题上的强大能力惊叹不已,直呼“震撼”。
近日,斯坦福大学副教授James Zou与TogetherAI的两位研究人员Federico Bianchi和Yongchan Kwon,共同探索出一种全新的研究范式。

他们以爱因斯坦、费曼等物理学巨匠的学术风格为蓝本,构建了一批具有不同思维特质的AI智能体,并搭建了一个类似Kaggle的协作平台,让这些智能体能够自由发表见解、相互竞争并开展合作。

这一模式带来了意想不到的效果:仅仅用了30分钟,这批智能体便发现了埃尔德什最小重叠问题目前已知的最佳新解。
作为由数学家保罗·埃尔德什提出的经典难题之一,埃尔德什最小重叠问题探讨的是:当两个整数集合相加时,某些和值出现的“重叠次数”最少可以被压缩到多低。
下图展示了名为“gpt-5.2-einstein”的智能体向其他智能体发起提问的场景:

此外,AI科学家之间还出现了许多有趣的涌现行为。例如,为了防止排行榜被刷榜,系统规定智能体提交的新解必须至少比其上一次提交的解提升1e-8,否则将无法提交。
于是,便出现了智能体拜托自己的“朋友”代为提交结果的情况。

目前,完整的解决方案已经开源发布。

项目主页:Erdos最小重叠问题项目
该项目提出的埃尔德什最小重叠问题新最优解
根据项目介绍,这些智能体采取的核心思路是:利用序列线性规划,对阶梯函数构造进行优化。
下图分别展示了2016年豪格兰(挪威数学家)、2025年5月AlphaEvolve(由Google DeepMind开发的AI智能体)、2026年1月TTT-Discover(斯坦福联合英伟达发布的AI科学问题发现SOTA解决方案)以及本文所述解决方案的结果对比。

针对埃尔德什最小重叠问题,以上四种解决方案得出的上界分别如下:

完整的验证过程与额外分析,可以参考项目文档。
网友热议:这是科研新范式还是噱头?
对于这种为现实世界人类科学家创建“智能体分身”的做法,不少评论认为这是一种新型的科研协作模式。
“这正是我通过SOUL.md为每个智能体赋予独特角色的原因。不同的个性不仅能增添趣味,还能产生不同的推理路径。一个怀疑论者和一个乐观主义者会从完全不同的角度来攻击同一个问题。”

“拥有鲜明人格的智能体各自独立工作,没有会议、没有同步沟通,只是并行推进,让结果自己说话。这种内向型协作方式通过减少协调成本,仅用30分钟就解决了一个数学问题,而传统依赖大量沟通协调的方式却未能做到。”

不过,也有人对此泼了冷水。
“我粗略看了一下这个仓库,它看起来只是一个被包装得更复杂的提示系统。告诉一个模型它是非常聪明的物理学家,并不会真的让它变成一个非常聪明的物理学家。它在本质上还是同一个模型。这里的做法似乎更糟,因为现在大模型还得先思考:某个角色会如何回答?而不是直接思考:我该如何回答?本质上,这相当于在真正有洞见的步骤之前,额外增加了一个制造噪声的步骤。”

评论区的各位,如何看待这种智能体协作模式呢?
相关攻略
编辑|杜伟用 AI 尤其是大模型、智能体解决数学问题已经成为科研界的风尚之一,就连近 90 岁高龄、德高望重的高德纳老爷子都惊叹于 Claude Opus 4 6 解决开放性问题的强大能力,直呼「S
AI 攻克了理论物理中的开放性问题!近日,谷歌团队开发了一个基于 Gemini Deep Think 模型的混合神经符号系统,成功推导出宇宙弦发射引力辐射功率谱的 6 种全新精确解法。该研究的重要意
热门专题
热门推荐
猎豹浏览器免安装网页版入口是https: web lemur-browser com,具备界面简洁响应迅速、多端同步无缝衔接、安全防护层级丰富、文档处理能力突出、资源兼容性广泛覆
据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
Anthropic一款尚未发布的新AI模型因数据泄露意外曝光,引发市场对AI颠覆网络安全行业的担忧再度升温,网络安全板块股价周五盘前全线下挫。据《财富》杂志报道,Anthropic正在开发并已开始向
3月初,腾讯在深圳总部楼下设立“龙虾站”,引发千人排队尝鲜。OpenClaw掀起的“全民养虾”热潮,在短短一个月内让更多人看到了AI Agent深入业务场景的价值,随即推动Token调用量大规模增长





