门外汉借ChatGPT破解60年数学难题陶哲轩坦言研究走入误区
困扰数学界长达60年的一个“世纪猜想”,竟然被一位门外汉给攻克了。
这位年轻人只有23岁,从未接受过任何高等数学训练。他仅仅凭借一段提示词,就让ChatGPT在80分钟内破解了这道难题。菲尔兹奖得主陶哲轩在审阅后坦言:过去六十年里,所有研究者在第一步就集体走偏了。


23岁门外汉,让全网破防
故事的主角名叫Liam Price。他的履历里找不到任何高等数学学位的痕迹,完全称不上“数学科班出身”。然而,就在2025年底,他与剑桥大学数学系的大二学生Kevin Barreto联手,开启了一场近乎“疯狂”的实验:从著名的埃尔德什问题集(Erdős Problems)中随机抽取未解难题,直接丢给ChatGPT去尝试。

他们不做前置研究,不读相关论文,也不从任何既定的分析框架入手。全凭直觉,用最朴素的语言描述问题,然后让大模型自己寻找路径。数学圈给这种方法起了个名字,叫“vibe mathing”。

在挑战第1196号问题之前,Price和Barreto已经用类似的方法在几个较小的问题上取得了进展,逐渐引起了一些关注。OpenAI听说后,甚至给他们赠送了ChatGPT Pro订阅,鼓励他们继续探索。这个举动,后来被证明是2026年数学史上回报率最高的一笔“投资”之一。但当时没人能预料到,真正的大鱼会来得如此之快。
60年猜想证毕,ChatGPT仅用80分钟
他们这次盯上的埃尔德什问题#1196,是关于“原始集”的:即一个正整数集合,其中任意两个元素都互不整除。
在这个问题上走得最远的人类数学家,是牛津大学的Jared Lichtman。他在原始集问题上深耕了整整7年,发表了多篇重要论文,将已知的上界一步步推进到了约1.399。距离最终的证明,似乎只差临门一脚。但这最后一脚,七年都没能踢进去。


没想到,Price将问题描述发送出去后,GPT-5.4 Pro推理了80分钟,直接给出了渐近上界1+O(1/log x),一刀到底,完成了证明。
先把问题本身说清楚。所谓“原始集”,就是一组正整数,其中任何一个数都不能被集合中的另一个数整除。举个例子,{2, 3, 7, 12}就不是原始集,因为12能被2和3整除;而{2, 3, 7, 11}则是。

早在1968年,埃尔德什与合作者Sárközy、Szemerédi就提出了一个猜想:关于原始集的一个特定求和式,存在一个渐近意义上的明确上界。表述简洁,却让数学界僵持了58年。
更关键的差距不在于速度,而在于路线。此前所有研究这个问题的数学家,包括Lichtman在内,都默认从解析数论的工具箱入手。这条路看似自然,走了几十年,但它无形中将思维锁死在一个狭窄的通道里。

GPT-5.4 Pro走了一条完全不同的路:它采用了马尔可夫链方法,并结合了冯·曼戈尔特权重。这两样工具在数论的其他分支里都是成熟的,但从来没有人想到把它们组合起来,用在原始集问题上。
耐人寻味的是,Price在接受《科学美国人》采访时坦言:GPT最初的输出“其实质量很差”。证明冗长、混乱,逻辑跳跃随处可见。是Barreto和后来介入的专家,从一堆杂乱的推导中,辨认出了那个关键的全新洞见。
Lichtman的评价很克制,但分量极重:“这需要专家去筛选,才能真正理解它在试图表达什么。”随后,他说了一句让整个数学圈安静下来的话:“这是第一个达到‘埃尔德什之书’水平的AI数学成果。”

熟悉数学史的人会立刻明白这句话的重量。“埃尔德什之书”是埃尔德什生前的一个著名比喻:上帝手中有一本书,里面收录了每个数学定理最优雅、最本质的证明。Lichtman的意思是,AI不仅解了题,而且其解法本身具备了一种数学上的“美”。
陶哲轩:人类集体走偏了
菲尔兹奖得主陶哲轩的点评,引发了更深层的思考。他是这么说的:以前研究这个问题的人,一开始往往会采用一套标准的、已成惯例的路数。而大语言模型则选择了一条完全不同的路线,它使用了一个在相关数学分支中众所周知、却从未有人想过要应用到这类问题上的公式。
这个“集体走偏的第一步”,可以追溯到1935年以来形成的标准路径:把数论问题翻译成概率论问题,沿着“默滕斯定理”那条线走。所有人都默认这条路是对的。一代又一代的研究生进来,先学习这套翻译方法,再在其基础上添加细节、进行修补。

GPT-5.4 Pro完全没学过这套“传统”。它反手就调用了冯·曼戈尔特函数——这是解析数论中用来编码算术基本定理的一个经典对象——从而走上了一条完全不同的道路。Lichtman后来解释:这个公式在相关数学领域里其实大家都熟悉,但就是从来没人想到把它用到埃尔德什这个问题上。
陶哲轩对这次结果的定性更为深刻:“我们发现了一种思考大整数及其结构的全新方式。”一个在Lichtman的问题上钻研了7年的人,最终输给了一个不知道这个问题“应该怎么研究”的素人。在AI时代,“无知”反而成了一种结构性的优势。没有历史包袱,自然不会跟着集体思维一起走偏。
数学的钥匙,正在换手
1900年,大卫·希尔伯特在巴黎国际数学家大会上提出了23个问题,几乎定义了整个20世纪数学的发展方向。那个时代,能够触碰数学前沿的人,全球不过数百。

时间来到2026年4月一个普通的周一下午,一个23岁的年轻人,凭借一段提示词和80分钟的计算,改写了历史。数学圣殿的大门并没有降低门槛,但门上多了一把全新的钥匙。拿着这把钥匙的人,不再需要先花上十年时间,去学会前人走过的所有弯路。
相关攻略
困扰数学界长达60年的一个“世纪猜想”,竟然被一位门外汉给攻克了。 这位年轻人只有23岁,从未接受过任何高等数学训练。他仅仅凭借一段提示词,就让ChatGPT在80分钟内破解了这道难题。菲尔兹奖得主陶哲轩在审阅后坦言:过去六十年里,所有研究者在第一步就集体走偏了。 23岁门外汉,让全网破防 故事的主
2025年5月15日,是著名数学家、中国科学院院士、国家最高科学技术奖得主谷超豪先生诞辰一百周年的纪念日。为缅怀这位科学巨匠的毕生贡献,弘扬其追求真理的科研精神,并向公众展现基础数学研究的独特魅力,一场主题科普活动于5月10日在上海科技馆报告厅成功举办。这就是第240期上海科普大讲坛特别策划的“遇见
为纪念谷超豪先生百年诞辰,5月10日将在上海科技馆举办专题科普讲座。李大潜院士将回顾谷超豪从数学少年成长为学科开拓者的历程,展现其科学精神传承。沈维孝院士则以多项式求根为例,引领听众领略数学的深邃与精巧。这是一次与顶尖学者对话、感受数学魅力的难得机会。
当我们开车在高速公路上行驶时,最怕遇到的就是车子突然失控,方向盘变得异常敏感,稍微一动就可能冲出车道。这种情况在人工智能的训练过程中也经常发生,特别是在训练那些能够进行推理和对话的大型语言模型时。来
这项由威斯康星大学麦迪逊分校研究团队完成的突破性研究,发表于2026年3月的《机器学习》期刊,论文编号为arXiv:2603 20538v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究
热门专题
热门推荐
广东无人机适飞空域扩大16%至10 24万平方公里,覆盖全省57%陆地面积,滨海、郊野、工业园区及非核心城区公园等区域开放,深圳市区新增连片适飞区。飞行需通过民航局UOM平台提前申请,严禁“黑飞”,违者将受处罚。平台已升级,实现全国规则统一与分钟级空域更新,支持低空物流与巡检等应用。
杭州Costco门店因iPhone17系列手机引发抢购热潮,数百人排队致迅速断货。抢购源于官方降价与地方补贴叠加:iPhone17Pro全系直降千元,同时当地青年消费补贴可再减10%,最高省千元。双重优惠下,256GB版iPhone17Pro到手价低至7172元,较电商平台便宜近千元,吸引本地及周边消费者。目前门店仍处缺货状态,补货时间未定。
5月17日晚,长征八号运载火箭在海南商业航天发射场点火升空,成功将千帆星座第九批组网卫星送入预定轨道。此次发射是该发射场启用以来的第15次成功发射,也是今年第5次发射,体现了我国商业航天发射能力的日益成熟和常态化运营的稳步推进。
七彩虹新款iGameM15 M16Origo2026款游戏本已发售,起售价11499元。M15为15 3英寸黑色机身,配备2 5K300Hz屏,最高可选Ultra9处理器与RTX5070显卡。M16为16英寸白色款,屏幕规格相同,处理器性能更强,电池容量更大。两款均提供多种配置,享受国家补贴后价格更具竞争力,面向中高端游戏玩家与创作者。
联想在北美市场推出新款ThinkPadT14Gen7商务笔记本,支持用户自行更换LPCAMM2内存。该机型提供多款英特尔酷睿Ultra处理器选项,内存可选16GB至64GB,电池与屏幕亦有多种配置,其中顶配版搭载OLED屏幕。产品起售价为1618美元,高配版本价格超过3700美元,主要面向商用及专业办公市场,兼顾性能、可升级性与不同预算需求。





