首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
GPT-5.2 Pro完成数学家陶哲轩45年数论猜想证明

GPT-5.2 Pro完成数学家陶哲轩45年数论猜想证明

热心网友
79
转载
2026-01-19

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

AI证明数学猜想,这次来真的了。

OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔德什猜想。

论证过程经菲尔兹奖得主陶哲轩验证成立,还被评价为“迄今为止最明确的第一类结果(AI主要贡献)”。



这道题是埃尔德什问题库中的第281号,由传奇数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系。

45年来,这道题一直静静躺在问题库里,等待解答。

直到2026年1月17日,一位名叫Neel Somani的研究者把这道题扔给了GPT-5.2 Pro。



证明只用到GPT 5.2 Pro

埃尔德什问题 已收录AI证明结果。

整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁。



按陶哲轩的话说,它是“Furstenberg对应原理”的一个变体,这是遍历理论与组合数学交叉领域的标准工具。

但GPT-5.2 Pro的用法又有些不同,它比通常的论证更依赖伯克霍夫定理。



然而真正让陶哲轩印象深刻的不是证明方法本身,而是AI没有犯错。

让我更惊讶的是它避免了错误,比如极限交换或量词顺序的失误,这正是这道题最容易踩的坑。前几代大语言模型几乎肯定会在这些微妙之处栽跟头。

为了验证这份证明,陶哲轩亲自动手,把整套遍历论论证翻译成了组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理,重新走了一遍全部推导。

结论:证明成立。

一个意外的发现

正当大家讨论GPT-5.2 Pro的证明时,一位网名KoishiChan的用户在评论区抛出了一个令人意外的发现:

这道题其实有更简单的解法,而且所需的两个定理早在1936年和1966年就已经存在了。

第一个是达文波特(Harold Davenport)与埃尔德什本人在1936年合作证明的密度收敛定理。

第二个是罗杰斯定理,首次发表于1966年的哈尔伯斯塔姆-罗斯专著《序列》第五章。把这两个经典结果拼在一起,第281号问题几乎是直接推论。

这就奇怪了。埃尔德什自己就是1936年那篇论文的合著者,而他在1980年提出这道题时,都没有意识到答案近在眼前。



陶哲轩就此事专门写邮件请教了法国数学家特南鲍姆(Tenenbaum)。

特南鲍姆确认“只要满足你提到的两个经典结果(达文波特-埃尔多斯定理和罗杰斯定理),问题就能立即得到解决”,但他也猜测“问题的表述可能在某个环节被改动过”。不过目前没有人找到任何其他版本的表述,所以只能按原样处理。

更有意思的是,2007年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶尖专家在解决另一道埃尔德什问题时,同样不知道罗杰斯定理的存在,直到特南鲍姆提醒他们才补上了引用。

陶哲轩感慨:“罗杰斯定理没有得到它应有的传播。它只出现在哈尔伯斯塔姆-罗斯那本书里,没有单独发表,文献引用寥寥无几。或许这场讨论能让更多研究筛法和同余覆盖的人注意到这个结果。”

最终现在这道题有了两份证明:一份来自GPT-5.2 Pro的遍历论路径,一份来自KoishiChan挖出的经典文献组合。

陶哲轩确认两者是“不同的证明”,虽然在概念上有些重叠。



如何评估AI数学的真实成功率

消息传开后,各路AI模型纷纷被拉来交叉验证。

Gemini 3 Pro表示证明没有问题。另一位研究者用GPT-5.2 Pro反复检查论证细节,AI认为唯一需要补充严格性的地方在第二步,可以用法图引理绕过遍历论直接完成。

不过陶哲轩指出这里法图引理的方向用反:我刚教完研究生测度论,这类错误见得太多了。

随后又确认其实是对补集应用法图引理,方向没问题,论证成立。

但陶哲轩同时发出了冷静的提醒。他写道:

评估AI工具真实成功率时,最大的统计偏差来自强烈的报告偏差,负面结果几乎不会被披露。如果某人或某AI公司把工具用在开放问题上但没有进展,他们没有动力报告这个负面结论;即使报告了,也不太可能像正面结果那样在社交媒体上传播开来。尽管绝大多数集中在难度谱系的简单一端,远不能说明中等难度的埃尔德什问题已经进入AI的射程范围。

他推荐了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源项目,系统记录前沿大语言模型在埃尔德什问题上的正面和负面结果。



数据显示,这些工具在埃尔德什问题上的真实成功率大约只有百分之一到二。

但考虑到问题库里有超过600道未解难题,这个比例仍然意味着一批数量可观且非平凡的AI贡献。



参考链接:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812

来源:https://www.163.com/dy/article/KJLAQBP60511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

上海打造数学人才高地 不唯顶刊更重原创研究
科技数码
上海打造数学人才高地 不唯顶刊更重原创研究

上海数学与交叉学科研究院不唯顶刊论文,注重原创与潜力,为科研人员提供宽松自由的学术环境和长周期评价机制。研究院聚焦基础数学、应用数学及交叉学科,鼓励沉浸式研究,已吸引全球百余位科研人员,致力于通过基础研究推动国产芯片、人工智能等领域的突破,并促进成果转化。

热心网友
05.24
GPT5仅用18分钟破解黑洞方程效率远超人类科学家
AI资讯
GPT5仅用18分钟破解黑洞方程效率远超人类科学家

2026年,科学研究的范式正在悄然改变。人工智能,这位曾经的“辅助工具”,如今正以“合作者”的身份,深度介入从数学证明到黑洞物理的前沿探索。它带来的不仅是效率的提升,更是一种思维模式的拓展——科学加速的时代,已然拉开序幕。 从三个夜晚到一页证明:AI如何成为数学家的“思维翻跟斗” 数学,被誉为科学的

热心网友
05.20
从数学上帝粒子到基本函数:一个运算符的完整推导
AI资讯
从数学上帝粒子到基本函数:一个运算符的完整推导

机器之心编辑部 仅凭一个简单的二元运算符和常数1,就能构建出科学计算器上的所有基础数学函数?这听起来像是数学领域的终极简化梦想,而近期一项来自计算机科学界的突破性研究,正将这个看似不可思议的构想变为现实。 这项能够将复杂数学体系极度简化的底层发现,被广泛认为具有革命性潜力。该研究的论文作者Andrz

热心网友
05.19
门外汉借ChatGPT破解60年数学难题陶哲轩坦言研究走入误区
AI资讯
门外汉借ChatGPT破解60年数学难题陶哲轩坦言研究走入误区

困扰数学界长达60年的一个“世纪猜想”,竟然被一位门外汉给攻克了。 这位年轻人只有23岁,从未接受过任何高等数学训练。他仅仅凭借一段提示词,就让ChatGPT在80分钟内破解了这道难题。菲尔兹奖得主陶哲轩在审阅后坦言:过去六十年里,所有研究者在第一步就集体走偏了。 23岁门外汉,让全网破防 故事的主

热心网友
05.18
谷超豪院士百年诞辰纪念讲座在上海科技馆举行
科技数码
谷超豪院士百年诞辰纪念讲座在上海科技馆举行

2025年5月15日,是著名数学家、中国科学院院士、国家最高科学技术奖得主谷超豪先生诞辰一百周年的纪念日。为缅怀这位科学巨匠的毕生贡献,弘扬其追求真理的科研精神,并向公众展现基础数学研究的独特魅力,一场主题科普活动于5月10日在上海科技馆报告厅成功举办。这就是第240期上海科普大讲坛特别策划的“遇见

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

委内瑞拉通胀突破600% 六成民众选择美元与加密资产
web3.0
委内瑞拉通胀突破600% 六成民众选择美元与加密资产

来看一组让人揪心的数字:截至5月28日,超过半数的委内瑞拉民众,选择支持经济“美元化”——他们想要用美元来对抗全球数一数二的恶性通胀。根据AtlasIntel的调研,31%的受访者明确支持美元化,另有26%的人表示强烈支持,加起来支持率高达57%;而明确反对或强烈反对的,合计只有30%。换句话说,在

热心网友
05.29
异环女主角是谁及内容介绍
游戏资讯
异环女主角是谁及内容介绍

游戏开局,玩家第一眼看到的主角是谁?没错,就是零。不过这里有个挺常见的误会——很多人会下意识觉得零是女主角,那是不是还有个男主角?其实不然。进入游戏之后,外观是可以自由选择的,性别、形象都由你定,男女主角本质上都是同一个人。两种造型唯一的区别就是视觉风格,至于基础属性、成长路线、技能体系,完全一致。

热心网友
05.29
ElevenLabs Music v2发布 一曲多变与商业版权全授权
AI资讯
ElevenLabs Music v2发布 一曲多变与商业版权全授权

或许有人觉得,AI音乐生成工具不过是图个新鲜感,与专业音乐制作相距甚远。但5月28日,ElevenLabs推出的Music v2,很可能改变这一印象。这次升级版音乐生成模型,已不再停留在去年那个“新手友好”的初级阶段,而是在工作流、版权合规和落地场景上都做了充分布局。 一、核心进化:创作从“一次性生

热心网友
05.29
iPhone20外观重大调整:四曲屏配圆润边框
业界动态
iPhone20外观重大调整:四曲屏配圆润边框

iPhone20周年纪念款将采用四曲面屏与圆润边框设计,边框仅1 1毫米,但边缘亮度存在失真问题,苹果正与三星、LG合作解决。若无法攻克,可能沿用平面边框。该款预计2027年亮相,属于Pro系列,含双版本,并计划采用屏下前摄与FaceID。

热心网友
05.29
播面让你像听歌一样高效刷面试题
AI教程
播面让你像听歌一样高效刷面试题

对于技术从业者而言,面试备考始终是一个老生常谈却又不断变化的话题。时间碎片化、知识点庞杂、实战表达欠缺,每一项都可能成为关键时刻的瓶颈。有没有一种方法,能让我们把通勤、运动等零散时间充分利用起来,高效地“打磨技能”呢?今天要介绍的「播面」,或许就是一个值得关注的解题新思路。 播面是什么 简单来说,「

热心网友
05.29