游乐游手机版
首页/业界动态/文章详情

23岁青年借ChatGPT破解数学难题陶哲轩称研究方向被颠覆

时间:2026-05-24 18:22
困扰数学界整整六十年的一个“世纪猜想”,竟然被一位“门外汉”给破解了。更令人惊讶的是,这位年轻人年仅23岁,从未接受过任何高等数学的系统训练。他仅仅凭借一段精心设计的提示词,就引导ChatGPT找到了通往答案的路径。 当菲尔兹奖得主陶哲轩审阅完这份证明后,留下了一句意味深长的评价。他指出,过去六十年

困扰数学界整整六十年的一个“世纪猜想”,竟然被一位“门外汉”给破解了。更令人惊讶的是,这位年轻人年仅23岁,从未接受过任何高等数学的系统训练。他仅仅凭借一段精心设计的提示词,就引导ChatGPT找到了通往答案的路径。

当菲尔兹奖得主陶哲轩审阅完这份证明后,留下了一句意味深长的评价。他指出,过去六十年间,所有研究过这个问题的人,几乎都在第一步就集体踏入了同一条思维歧途。

23岁门外汉,让全网破防

故事的主角名叫利亚姆·普莱斯(Liam Price)。翻看他的履历,你找不到任何高等数学学位的痕迹,他并非传统意义上的“数学科班”出身。

然而,就在2025年底,他与剑桥大学数学系大二学生凯文·巴雷托(Kevin Barreto)联手,开启了一场近乎“疯狂”的实验:他们从著名的“埃尔德什问题”列表中随机抽取尚未解决的难题,直接抛给ChatGPT。

他们不做前置的文献调研,不深入阅读相关论文,也不从某个特定的分析框架入手。整个过程,全凭直觉,用最朴素的语言描述问题本身,然后让大型语言模型自己去摸索道路。后来,圈子里的同行给这种方法起了个名字,叫“氛围数学”。

在挑战第1196号问题之前,普莱斯和巴雷托已经用类似的方法,在几个较小的问题上取得了进展,逐渐引起了一些关注。OpenAI听说了他们的实验,甚至赠送了ChatGPT Pro订阅服务以示鼓励。这个在当时看似微小的举动,后来被证明可能是2026年数学史上回报率最高的一笔“投资”。

但谁也没想到,真正的大鱼会这么快上钩。这一次,他们瞄准的是埃尔德什问题中的第1196号,一个关于“原始集”的猜想——所谓原始集,即集合中任意两个元素互不整除。

60年猜想证毕,ChatGPT仅80分钟

在这个问题上走得最远的人类数学家,是牛津大学的贾里德·利希特曼。他围绕原始集问题埋头苦干了整整七年,发表了多篇重要论文,将已知的上界一步步推进到了大约1.399。

看上去,距离最终的证明似乎只差临门一脚。然而,这“最后一脚”,七年时间都未能成功踢入。

令人意想不到的是,普莱斯将问题描述作为提示词发出后,GPT-5.4 Pro经过80分钟的推理,直接给出了渐近上界为1+O(1/log x)的结论,可谓一刀到底。

这里有必要先把问题本身说清楚。所谓“原始集”,指的是一组正整数,其中任何一个数都不能被集合中的另一个数整除。举个例子,{2, 3, 7, 12}就不是原始集,因为12能被2和3整除;而{2, 3, 7, 11}则是。

早在1968年,数学家保罗·埃尔德什与他的合作者萨科齐、塞迈雷迪就提出了一个猜想:关于原始集的某个特定求和式,存在一个明确的渐近上界。问题表述起来简洁优雅,却让数学界僵持了58年之久。

更关键的区别,其实不在于速度,而在于路线。此前所有研究该问题的数学家,包括利希特曼在内,都默认从解析数论的工具箱入手。这条路看似自然,走了几十年,却无形中将思维锁定在了一条狭窄的通道里。

GPT-5.4 Pro选择了一条完全不同的路径:它结合了马尔可夫链方法和冯·曼戈尔特权重。这两样工具在数论的其他分支里已是成熟技术,但此前从未有人想到将它们应用于原始集问题。

耐人寻味的是,普莱斯在接受《科学美国人》采访时坦言,GPT最初的输出“其实质量很差”。证明过程冗长、混乱,逻辑跳跃随处可见。是巴雷托和后来介入的专家们,从一堆杂乱的推导中,识别出了那个关键的全新洞见。

利希特曼的评价相当克制,但分量极重:“这需要专家去筛选,才能真正理解它试图表达什么。”紧接着,他说了一句让整个数学圈安静下来的话:“这是第一个达到‘埃尔德什之书’水平的AI数学成果。”

熟悉数学史的人立刻能明白这句话的重量。“埃尔德什之书”是埃尔德什生前的一个著名比喻,他相信上帝手中有一本书,里面收录了每个数学定理最优雅、最完美的证明。利希特曼的意思是,AI不仅解决了问题,其解法本身具备了数学意义上的“美感”。

陶哲轩:人类集体走偏了

菲尔兹奖得主陶哲轩的点评,则引发了更深层次的思考。他指出,以前研究这个问题的人,一开始往往会采用一套标准的、近乎本能的路数。而大型语言模型则选择了一条完全不同的路线,它使用了一个在相关数学分支中众所周知、却从未有人想过要应用到这类问题上的公式。

这个“集体走偏的第一步”,可以追溯到1935年以来形成的标准路径:将数论问题翻译成概率论语言,沿着“默滕斯定理”那条线推进。所有人都默认这条路是正确的。一代又一代的研究生进来,先学习这套翻译方法,再在其基础上添加细节、深化研究。

GPT-5.4 Pro完全没有学过这套“传统”。它反手就调用了冯·曼戈尔特函数——这是解析数论中用来编码算术基本定理的一个经典对象——从而走上了一条完全不同的道路。利希特曼后来也解释道,这个公式在相关领域其实大家都熟悉,但就是没人想到把它用到埃尔德什的这个具体问题上。

陶哲轩对这次成果的定性更为深刻:“我们发现了一种思考大整数及其结构的全新方式。”一个在利希特曼问题上钻研了七年的人,最终输给了一个不知道这个问题“应该怎么研究”的素人。在AI时代,“无知”似乎成了一种结构性的优势。没有历史包袱,自然不会跟着集体思维一起走偏。

数学的钥匙,正在换手

1900年,大卫·希尔伯特在巴黎国际数学家大会上提出了23个问题,几乎定义了整个20世纪数学的发展方向。在那个时代,有能力触碰数学最前沿的人,全球不过寥寥数百。

而2026年4月一个普通的周一下午,一位23岁的年轻人,凭借一段提示词和80分钟的等待,就叩开了一道尘封六十年的难题之门。数学殿堂的大门并未降低其高度,但门锁旁,似乎多出了一把全新的钥匙。手握这把钥匙的人,或许不再需要花费十年光阴,去熟记前人走过的所有弯路。

来源:https://36kr.com/p/3784203770551305
上一篇适马35mm F2 DG DN全金属镜头售价4499元 下一篇10分钟AI如何影响大脑专注力与思考能力
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿