陶哲轩呼吁AI数学研究转型：停止造神，赋能人类

首页

热心网友

转载

2026-01-11

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

新智元报道

编辑：犀牛

【新智元导读】当AI自主攻克难题吹成神话时，陶哲轩深夜发帖辟谣：别断章取义，孤例不等于AI已具备高级数学能力。他强调AI更像工具链——擅长检索、改写、形式化验证和跑套路，但数学真正的灵魂活仍离不开人类。

你可能刷到过这种极具煽动性的新闻标题：「AI完全自主解决了人类五十年未解的数学难题！数学家要失业了！」

对于渴望见证AGI诞生的人来说，这无疑又是一剂强心针。而对于坚守人类智力尊严的数学家而言，这仿佛是最后堡垒陷落的警报。

随着这些文章的影响力越来越大，终于有人坐不住了，出手降温。

有趣的是，这个人正是AI数学研究最积极的推动者之一——陶哲轩。

陶哲轩并没有否定AI的数学研究能力，他只是想把水温调回现实。

就在今天凌晨，陶哲轩发帖称，AI解决数学问题的能力被断章取义地夸大了。

他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。

他强调外界对AI解决Erdős问题的解读很容易过度，尤其是把某个孤立战果当成「AI已具备高级数学能力」的证据。

陶哲轩到底在澄清什么？AI在Erdős问题上究竟做到了什么程度？

陶哲轩的深夜辟谣

首先要说的是，陶哲轩并不是否认AI在数学上的进步。

他否认的主要是一种偷懒叙事：把「AI在某些问题上能产出可验证结果」，偷换成「AI已经会做数学、能独立创新、能替代人类」。

在他更新的「AI contributions to Erdős problems」页面里表示，看AI在Erdős问题上的成绩单时，千万别只盯着「解了多少题」，还特别注意下面几点：

题目难度差得离谱，「解题数」不能直接比：Erdős问题的难度跨度非常夸张，一端是公认超级硬核的核心难题，另一端是大量长期没人细查、研究很少的「长尾题」。后者里有不少其实属于「低垂果实」，更适合当前AI工具发挥。问题是：你很难在不做专家级文献梳理的前提下，提前判断一题属于哪一类。所以，拿「谁解得多」来PK，很可能不是同一难度段的对比。

很多题目「是否未解」本身就不确定：上不少问题缺少系统文献回顾，因此「Open」（未解）这个标签往往只是暂定。AI解出一题后，大家往往很快发现——原来文献里早有人解过（可能方法略不同）。这会让「AI首解」的叙事非常容易翻车。

我们看到的多是成功案例，失败被隐藏了：对AI工具的记录并不完整，尤其对没进展、失败尝试的记录更少。

有些题目原始表述有误，可能被「钻字面漏洞」解掉：极少数情况下，Erdős的题目表述可能不严谨甚至有误，要还原本意，往往需要结合上下文、靠领域经验做判断——这一步带有一定主观性。

数学价值不只在答案，更在「连接知识网络」：数学的意义不只是证明成立，还在于这件事对相关领域有什么启发？和已有理论怎么挂钩？有哪些可迁移的方法？人类写证明时，往往会自然补上这些旁白：背景、动机、文献对比、方法边界。但AI主导的证明常常缺少这层知识的光晕，结果可能技术上对，但对数学共同体的可用价值更低。

解出冷门长尾题，不等于够格投顶级期刊：不是每解一个未解题都等价于可发表论文。尤其当题目本身很冷门、方法只是对已有套路的小改动时，更未必能进好期刊。

把AI生成的证明形式化到Lean这类证明助手里，是提高可信度的好办法，但仍可能被钻空子。比如形式化时偷偷引入额外公理、问题陈述被误形式化、或者利用数学库/语法的某些「边角行为」。特别是当形式化证明短得离谱或啰嗦得异常时，更要警惕。

简单来说，陶哲轩认为AI在Erdős问题上的进展值得关注，但真正要看的是题目的难度层级、文献核查、题意还原、知识融入，以及验证链条是否扎实等更多维度的指标。

AI能做出成果不等于AI已具备完整数学能力。

AI不是数学家

而是工具链的一环

那现实里，AI到底做了什么？

陶哲轩的这份GitHub页面把AI贡献分成了多个类别。

有AI生成了完整（或部分）解答，有AI以为题目未解、结果发现文献早就解过的案例，有AI参与文献检索，有AI把证明形式化到 Lean，有AI帮人类重写既有论证，等等。

例如，页面列出 #728问题在2026年1月6日由Aristotle与ChatGPT 5.2 Pro 给出完整解答（Lean验证），#729问题在1月8-10日也获得完整解答（Lean验证）。

这意味着在某些题型、某些难度区间，AI确实能做出「可运行的证明结构」，甚至进入形式化验证流程。

有些问题完全由AI解决，但后来才发现，有人早就解决了。

陶哲轩还专门列了「AI-powered literature review（AI驱动的文献回顾）」一类：AI被用来搜索是否已有结果、是否存在误判Open的情况。

人类仍然是主角

如果仅凭几个孤例就认为「AI数学无敌」，显然有些片面。

但反过来，觉得AI做数学啥也不行，同样会错过它真正有价值的部分。

更准确的说法可能是：AI正在学会做数学的体力活和工程活：跑套路、补漏洞、做形式化、写稿改稿、查文献。

而数学真正的「灵魂」——提出深刻问题、创造新概念、把一个结果嵌进整个学科的知识网络——仍然高度依赖人类。

所以，陶哲轩这次深夜发帖想要说的，正在于此。

未来的数学家，或许不再是孤独的思考者，而是统领着硅基智能大军的指挥官：在那片广袤的数学原野上，人类指引方向，AI开路架桥。

别断章取义地神话AI，但也绝不要低估这股正在重塑真理探索方式的力量。

参考资料：https://mathstodon.xyz/@tao/115871649394962391

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

来源:https://www.163.com/dy/article/KJ0P5PMI0511ABV6.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：2026技术格局：特斯拉xAI与苹果AI崛起，硅谷新风向下一篇：豆包AI回答详略度调整指南：3步设置教程

热门推荐

游戏攻略

《无限轮回》萌新必备小技巧

《无限轮回》新手入门指南：高效开局与核心机制解析你是否渴望在《无限轮回》中快速成长，成为团队中可靠的伙伴？对于新手而言，正确的开局思路至关重要。切忌盲目拾取未知物品，一个不当操作——例如过早将关键法器“葫芦”交给队友——就可能打乱核心输出的成长节奏，导致团队覆灭。作为团队辅助，你的首要目标并非打出

热心网友

04.03

游戏资讯

累计突破82万！《宝可梦Pokopia》Fami通销量四连冠

Fami通最新销量榜出炉：日本实体游戏软件销量数据解读（2026年3月16日-22日）日本游戏市场每周的风向变幻，总是由那些长青的头部作品与新晋热作共同书写。根据权威媒体《Fami通》最新发布的实体销量估算数据，在2026年3月16日至3月22日这一周，市场格局呈现出清晰的趋势：任天堂Switch

热心网友

04.03

游戏攻略

王者荣耀s43射手梯度排行

王者荣耀S43赛季射手梯度排行榜单新赛季的射手格局已基本定型，可以用一句话概括核心趋势：敖隐与蚩妩两位英雄构成双星闪耀的T0阵营，综合强度堪称断层领先。紧随其后的T1梯队中，公孙离、艾琳、孙权、元流之子（射手）等英雄各怀绝技，或凭借极致的灵活拉扯掌控战局，或依赖无解的持续输出主宰团战。而处于T2梯

热心网友

04.03

游戏攻略

《长生：天机降世》游戏玩法介绍

长生：天机降世怎么玩：从入门到精通的全面攻略《长生：天机降世》是一款深度策略卡牌手游。其核心玩法在于通过策略性的卡牌组合与角色搭配，在限定回合内，最大化自身伤害输出并在竞技排行榜上取得优势。想要玩好这款游戏，深入理解其底层机制是关键第一步。《长生：天机降世》新手入门与高阶玩法解析：一、游戏核心

热心网友

04.03

手机教程

本来生活如何查物流信息

在本来生活平台下单购物后，及时查询并跟踪物流信息，可以帮助我们准确掌握包裹的预计送达时间，提前做好收货安排。那么，在本来生活应该如何高效地查询快递物流状态呢？下面为您详细介绍几种常用方法。进行网络购物之后，用户最关心的问题通常是“我的包裹现在运送到哪里了？”实时了解物流进度，不仅能减少等待期间的焦

热心网友

04.03

陶哲轩呼吁AI数学研究转型：停止造神，赋能人类

相关攻略

热门专题

最新APP

热门推荐