首页 游戏 软件 资讯 排行榜 专题
首页
AI
GPT-5.2 Pro完成数学家陶哲轩45年数论猜想证明

GPT-5.2 Pro完成数学家陶哲轩45年数论猜想证明

热心网友
31
转载
2026-01-19

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

AI证明数学猜想,这次来真的了。

OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔德什猜想。

论证过程经菲尔兹奖得主陶哲轩验证成立,还被评价为“迄今为止最明确的第一类结果(AI主要贡献)”。



这道题是埃尔德什问题库中的第281号,由传奇数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系。

45年来,这道题一直静静躺在问题库里,等待解答。

直到2026年1月17日,一位名叫Neel Somani的研究者把这道题扔给了GPT-5.2 Pro。



证明只用到GPT 5.2 Pro

埃尔德什问题 已收录AI证明结果。

整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁。



按陶哲轩的话说,它是“Furstenberg对应原理”的一个变体,这是遍历理论与组合数学交叉领域的标准工具。

但GPT-5.2 Pro的用法又有些不同,它比通常的论证更依赖伯克霍夫定理。



然而真正让陶哲轩印象深刻的不是证明方法本身,而是AI没有犯错。

让我更惊讶的是它避免了错误,比如极限交换或量词顺序的失误,这正是这道题最容易踩的坑。前几代大语言模型几乎肯定会在这些微妙之处栽跟头。

为了验证这份证明,陶哲轩亲自动手,把整套遍历论论证翻译成了组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理,重新走了一遍全部推导。

结论:证明成立。

一个意外的发现

正当大家讨论GPT-5.2 Pro的证明时,一位网名KoishiChan的用户在评论区抛出了一个令人意外的发现:

这道题其实有更简单的解法,而且所需的两个定理早在1936年和1966年就已经存在了。

第一个是达文波特(Harold Davenport)与埃尔德什本人在1936年合作证明的密度收敛定理。

第二个是罗杰斯定理,首次发表于1966年的哈尔伯斯塔姆-罗斯专著《序列》第五章。把这两个经典结果拼在一起,第281号问题几乎是直接推论。

这就奇怪了。埃尔德什自己就是1936年那篇论文的合著者,而他在1980年提出这道题时,都没有意识到答案近在眼前。



陶哲轩就此事专门写邮件请教了法国数学家特南鲍姆(Tenenbaum)。

特南鲍姆确认“只要满足你提到的两个经典结果(达文波特-埃尔多斯定理和罗杰斯定理),问题就能立即得到解决”,但他也猜测“问题的表述可能在某个环节被改动过”。不过目前没有人找到任何其他版本的表述,所以只能按原样处理。

更有意思的是,2007年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶尖专家在解决另一道埃尔德什问题时,同样不知道罗杰斯定理的存在,直到特南鲍姆提醒他们才补上了引用。

陶哲轩感慨:“罗杰斯定理没有得到它应有的传播。它只出现在哈尔伯斯塔姆-罗斯那本书里,没有单独发表,文献引用寥寥无几。或许这场讨论能让更多研究筛法和同余覆盖的人注意到这个结果。”

最终现在这道题有了两份证明:一份来自GPT-5.2 Pro的遍历论路径,一份来自KoishiChan挖出的经典文献组合。

陶哲轩确认两者是“不同的证明”,虽然在概念上有些重叠。



如何评估AI数学的真实成功率

消息传开后,各路AI模型纷纷被拉来交叉验证。

Gemini 3 Pro表示证明没有问题。另一位研究者用GPT-5.2 Pro反复检查论证细节,AI认为唯一需要补充严格性的地方在第二步,可以用法图引理绕过遍历论直接完成。

不过陶哲轩指出这里法图引理的方向用反:我刚教完研究生测度论,这类错误见得太多了。

随后又确认其实是对补集应用法图引理,方向没问题,论证成立。

但陶哲轩同时发出了冷静的提醒。他写道:

评估AI工具真实成功率时,最大的统计偏差来自强烈的报告偏差,负面结果几乎不会被披露。如果某人或某AI公司把工具用在开放问题上但没有进展,他们没有动力报告这个负面结论;即使报告了,也不太可能像正面结果那样在社交媒体上传播开来。尽管绝大多数集中在难度谱系的简单一端,远不能说明中等难度的埃尔德什问题已经进入AI的射程范围。

他推荐了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源项目,系统记录前沿大语言模型在埃尔德什问题上的正面和负面结果。



数据显示,这些工具在埃尔德什问题上的真实成功率大约只有百分之一到二。

但考虑到问题库里有超过600道未解难题,这个比例仍然意味着一批数量可观且非平凡的AI贡献。



参考链接:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812

来源:https://www.163.com/dy/article/KJLAQBP60511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

伊利诺伊大学香槟分校破解AI训练难题:五大技巧让机器学习更稳定
科技数码
伊利诺伊大学香槟分校破解AI训练难题:五大技巧让机器学习更稳定

当我们开车在高速公路上行驶时,最怕遇到的就是车子突然失控,方向盘变得异常敏感,稍微一动就可能冲出车道。这种情况在人工智能的训练过程中也经常发生,特别是在训练那些能够进行推理和对话的大型语言模型时。来

热心网友
03.31
威斯康星大学新突破:揭秘AI机器人精准模仿人类的秘密
科技数码
威斯康星大学新突破:揭秘AI机器人精准模仿人类的秘密

这项由威斯康星大学麦迪逊分校研究团队完成的突破性研究,发表于2026年3月的《机器学习》期刊,论文编号为arXiv:2603 20538v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究

热心网友
03.31
研究院:AI文本驱动实现复杂问题高效推理
科技数码
研究院:AI文本驱动实现复杂问题高效推理

这项由高通AI研究院领导的突破性研究发表于2026年3月的预印本论文,论文编号为arXiv:2603 08462v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究解决了一个让所有AI研究

热心网友
03.31
ChatGPT首次独立验证数学猜测,研究突破引学界热议
业界动态
ChatGPT首次独立验证数学猜测,研究突破引学界热议

3月31日消息,近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。OpenAI旗下ChatGPT-5 2(Thinking)

热心网友
03.31
中科院计算所XBridge:语言模型秒变多语言专家的翻译桥梁
科技数码
中科院计算所XBridge:语言模型秒变多语言专家的翻译桥梁

这项由中科院计算技术研究所智能信息处理实验室和AI安全重点实验室联合开展的研究,发表于2026年3月的arXiv预印本平台(论文编号:arXiv:2603 17512v1),为解决大型语言模型的多语

热心网友
03.30

最新APP

奥特曼传奇英雄2
奥特曼传奇英雄2
体育竞技 04-07
我的安吉拉
我的安吉拉
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
胜利之吻
胜利之吻
棋牌策略 04-07
同人圣三国蜀汉传
同人圣三国蜀汉传
棋牌策略 04-07

热门推荐

机圈专业V单来了!vivo X300 Ultra正式开售:6999元起
网络安全
机圈专业V单来了!vivo X300 Ultra正式开售:6999元起

4月3日消息,今日,vivo年度影像旗舰X300 Ultra正式开售,新机定位专业V单+口袋摄影机,影像能力全面拉满。vivo X300 Ultra配备蔡司大师镜头群,覆盖14mm蔡司超广角、35m

热心网友
04.07
微软委屈喊话:别什么锅都甩给Windows更新!先想想自己干了啥
电脑教程
微软委屈喊话:别什么锅都甩给Windows更新!先想想自己干了啥

4月2日消息,微软资深Windows工程师Raymond Chen发布长文,呼吁用户和企业IT团队,不要每次在系统出现问题后就第一时间将责任归咎于Windows更新。Chen指出,许多被归咎于每月更

热心网友
04.07
卡普空女性角色建模争议:十年对比凸显技术进步与表现力倒退
科技数码
卡普空女性角色建模争议:十年对比凸显技术进步与表现力倒退

近期,日本玩家围绕卡普空旗下女性角色视觉风格的变迁展开了广泛讨论。有玩家将十年前以当时技术水准塑造的代表性美少女角色玛莉·萝丝,与近年运用最新技术打造的英格丽德进行对比,认为后者在角色表现力上并未体

热心网友
04.07
AQUAPLUS正式终止ToHeart3开发:情怀难续,故事止于恰当时刻
科技数码
AQUAPLUS正式终止ToHeart3开发:情怀难续,故事止于恰当时刻

有多少资深玩家还记得AQUAPLUS旗下那款经典的恋爱冒险作品ToHeart?多年来,关于推出第三部续作的呼声始终不绝于耳。然而,这一计划事实上已被官方终止。近日,该公司社长在一次访谈中透露了项目搁

热心网友
04.07
电动自行车行业遭遇补贴退场与成本飙升双重压力
科技数码
电动自行车行业遭遇补贴退场与成本飙升双重压力

2026年4月5日,电动自行车行业正面临双重压力:国家层面的以旧换新补贴政策正式退出,叠加原材料成本持续攀升,导致终端售价普遍上调,市场销售明显承压。根据2026年最新实施的消费品以旧换新政策,电动

热心网友
04.07