首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
陶哲轩紧急呼吁叫停AI造神:人工智能再颠覆数学?

陶哲轩紧急呼吁叫停AI造神:人工智能再颠覆数学?

热心网友
18
转载
2026-01-12


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

文章转载于新智元

你可能刷到过这种极具煽动性的新闻标题:「AI完全自主解决了人类五十年未解的数学难题!数学家要失业了!」

对于渴望见证AGI诞生的人来说,这无疑又是一剂强心针。而对于坚守人类智力尊严的数学家而言,这仿佛是最后堡垒陷落的警报。

随着这些文章的影响力越来越大,终于有人坐不住了,出手降温。

有趣的是,这个人正是AI数学研究最积极的推动者之一——陶哲轩。

陶哲轩并没有否定AI的数学研究能力,他只是想把水温调回现实。

就在今天凌晨,陶哲轩发帖称,AI解决数学问题的能力被断章取义地夸大了。


他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。

他强调外界对AI解决Erdős问题的解读很容易过度,尤其是把某个孤立战果当成「AI已具备高级数学能力」的证据。

陶哲轩到底在澄清什么?AI在Erdős问题上究竟做到了什么程度?

1

陶哲轩的深夜辟谣

首先要说的是,陶哲轩并不是否认AI在数学上的进步。

他否认的主要是一种偷懒叙事:把「AI在某些问题上能产出可验证结果」,偷换成「AI已经会做数学、能独立创新、能替代人类」。

在他更新的「AI contributions to Erdős problems」页面里表示,看AI在Erdős问题上的成绩单时,千万别只盯着「解了多少题」,还特别注意下面几点:

题目难度差得离谱,「解题数」不能直接比:Erdős问题的难度跨度非常夸张,一端是公认超级硬核的核心难题,另一端是大量长期没人细查、研究很少的「长尾题」。后者里有不少其实属于「低垂果实」,更适合当前AI工具发挥。问题是:你很难在不做专家级文献梳理的前提下,提前判断一题属于哪一类。所以,拿「谁解得多」来PK,很可能不是同一难度段的对比。

很多题目「是否未解」本身就不确定: 上不少问题缺少系统文献回顾,因此「Open」(未解)这个标签往往只是暂定。AI解出一题后,大家往往很快发现——原来文献里早有人解过(可能方法略不同)。这会让「AI首解」的叙事非常容易翻车。

我们看到的多是成功案例,失败被隐藏了: 对AI工具的记录并不完整,尤其对没进展、失败尝试的记录更少。

有些题目原始表述有误,可能被「钻字面漏洞」解掉:极少数情况下,Erdős的题目表述可能不严谨甚至有误,要还原本意,往往需要结合上下文、靠领域经验做判断——这一步带有一定主观性。

数学价值不只在答案,更在「连接知识网络」:数学的意义不只是证明成立,还在于这件事对相关领域有什么启发?和已有理论怎么挂钩?有哪些可迁移的方法?人类写证明时,往往会自然补上这些旁白:背景、动机、文献对比、方法边界。但AI主导的证明常常缺少这层知识的光晕,结果可能技术上对,但对数学共同体的可用价值更低。

解出冷门长尾题,不等于够格投顶级期刊:不是每解一个未解题都等价于可发表论文。尤其当题目本身很冷门、方法只是对已有套路的小改动时,更未必能进好期刊。

把AI生成的证明形式化到Lean这类证明助手里,是提高可信度的好办法,但仍可能被钻空子。比如形式化时偷偷引入额外公理、问题陈述被误形式化、或者利用数学库/语法的某些「边角行为」。特别是当形式化证明短得离谱或啰嗦得异常时,更要警惕。

简单来说,陶哲轩认为AI在Erdős问题上的进展值得关注,但真正要看的是题目的难度层级、文献核查、题意还原、知识融入,以及验证链条是否扎实等更多维度的指标。

AI能做出成果不等于AI已具备完整数学能力。


1

AI不是数学家 而是工具链的一环

那现实里,AI到底做了什么?

陶哲轩的这份GitHub页面把AI贡献分成了多个类别。

有AI生成了完整(或部分)解答,有AI以为题目未解、结果发现文献早就解过的案例,有AI参与文献检索,有AI把证明形式化到 Lean,有AI帮人类重写既有论证,等等。

例如,页面列出 在2026年1月6日由Aristotle与ChatGPT 5.2 Pro 给出完整解答(Lean验证), 在1月8-10日也获得完整解答(Lean验证)。

这意味着在某些题型、某些难度区间,AI确实能做出「可运行的证明结构」,甚至进入形式化验证流程。


有些问题完全由AI解决,但后来才发现,有人早就解决了。


陶哲轩还专门列了「AI-powered literature review(AI驱动的文献回顾)」一类:AI被用来搜索是否已有结果、是否存在误判Open的情况。


1

人类仍然是主角

如果仅凭几个孤例就认为「AI数学无敌」,显然有些片面。

但反过来,觉得AI做数学啥也不行,同样会错过它真正有价值的部分。

更准确的说法可能是:AI正在学会做数学的体力活和工程活:跑套路、补漏洞、做形式化、写稿改稿、查文献。

而数学真正的「灵魂」——提出深刻问题、创造新概念、把一个结果嵌进整个学科的知识网络——仍然高度依赖人类。

所以,陶哲轩这次深夜发帖想要说的,正在于此。

未来的数学家,或许不再是孤独的思考者,而是统领着硅基智能大军的指挥官:在那片广袤的数学原野上,人类指引方向,AI开路架桥。

别断章取义地神话AI,但也绝不要低估这股正在重塑真理探索方式的力量。

参考资料:https://mathstodon.xyz/@tao/115871649394962391

点个“爱心”,再走 吧

来源:https://www.163.com/dy/article/KJ2JB5EN0511N33R.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中科院计算所XBridge:语言模型秒变多语言专家的翻译桥梁
科技数码
中科院计算所XBridge:语言模型秒变多语言专家的翻译桥梁

这项由中科院计算技术研究所智能信息处理实验室和AI安全重点实验室联合开展的研究,发表于2026年3月的arXiv预印本平台(论文编号:arXiv:2603 17512v1),为解决大型语言模型的多语

热心网友
03.30
维基百科新规:禁止AI直接编撰条目细则
科技数码
维基百科新规:禁止AI直接编撰条目细则

来源:环球网【环球网科技综合报道】3月27日消息,据Engadget报道,英文版维基百科近日宣布更新编辑规则,明确禁止编辑人员使用人工智能直接撰写或重写百科条目,不过并未完全禁用AI工具,仍允许其在

热心网友
03.27
维基百科禁止AI直接撰写条目,但仍允许辅助性使用
科技数码
维基百科禁止AI直接撰写条目,但仍允许辅助性使用

IT之家 3 月 26 日消息,据外媒 The Verge 今晚报道,维基百科宣布更新规则,明确禁止编辑使用 AI 直接撰写或重写条目。该政策于上周加入编辑指南,原因是 AI 生成内容经常违反平台的

热心网友
03.27
奥斯特大学新突破:AI精准识别相似语言的关键技术与方法
科技数码
奥斯特大学新突破:AI精准识别相似语言的关键技术与方法

这项由奥斯陆大学信息学系语言技术小组主导的研究发表于2026年2月的arXiv预印本平台(论文编号:arXiv:2602 13139v1),研究团队开发了一个名为OpenLID-v3的语言识别系统,

热心网友
03.11
柏林团队首次揭秘:如何让土耳其语AI真正理解人类对话
科技数码
柏林团队首次揭秘:如何让土耳其语AI真正理解人类对话

在人工智能快速发展的今天,大多数AI模型都专门为英语等主流语言量身定制,而像土耳其语这样的复杂语言往往被忽视。这项由柏林独立研究团队主导的开创性研究发表于2026年2月的剑桥期刊,研究编号为arXi

热心网友
02.12

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02