陶哲轩点赞GPT-5.2：人工智能会让我们沦为“硅基俘虏”吗？_游乐网

文章

业界资讯单机攻略视频攻略新游看台八卦新闻手游资讯手游攻略游戏问答

游戏

全部角色扮演棋牌策略休闲益智赛车竞速飞行射击体育竞技模拟经营动作冒险卡牌桌游其他游戏应用辅助

首页游戏软件资讯排行榜专题

首页

AI资讯

陶哲轩点赞GPT-5.2：人工智能会让我们沦为“硅基俘虏”吗？

陶哲轩点赞GPT-5.2：人工智能会让我们沦为“硅基俘虏”吗？

热心网友

45

转载

2026-01-25

新智元报道

编辑：倾倾

【新智元导读】币圈玩家Neel Somani带着GPT-5.2暴力踹开了数学圣殿的大门。陶哲轩亲自盖章确认，但这并非「AI成神」，而是一场成功率仅1%的算力挖矿。当数学证明变成工业流水线，我们失去的不仅是天才，还有对真理的最后一点敬畏。

总统先生，数学界的第四座塔倒了！

昨晚，这张总统耳语的Meme图，在美国学术圈引发了核爆级的讨论。

Paul Erdos留下的第281号难题，被一个「门外汉」用AI暴力破解了。

人类最严肃的智力高地，沦为一张Meme图的注脚。旧世界的规则，崩塌了。

第一现场：被GPT-5.2攻破的百年难题

这不仅是破解，更是「入侵」。

一个手持H100算力集群的「野蛮人」，一脚踹开了象牙塔的大门。

光看Neel Somani的履历表，就足以让传统数学家感到信仰崩塌：

前Citadel量化研究员（以高频交易著称的华尔街巨头）；

前Eclipse创始人（Solana生态的高性能区块链项目）；

现役AI与区块链交叉领域的探索者。

他来自Eclipse，混迹于加密货币与区块链的丛林。在他的世界里，算力即权力，共识即真理。

2026年1月，他带着硅谷的算力崇拜，横冲直撞地闯入了数学界——通过投资或协作的方式，推动了ErdosProblems.com平台，把Paul Erdős留下的的数学悬赏，变成了一场公开的「猎杀游戏」。

他的武器不是天才的大脑，而是GPT-5.2Pro。

Somani的逻辑简单粗暴：既然数学证明可以被形式化，那它本质上和比特币挖矿没有任何区别。

只要显卡够多，只要AI试错速度够快，我就能通过穷举撞开真理的大门。

结果呢？他赌赢了。

就在几天前，作为这个收割月的重磅，GPT-5.2成功攻克了Erdős Problem#281。

Erdős Problem#281，源自1980年Erdős和Graham的工作，焦点是「覆盖系统」的极限行为：

给定一个无限递增的正整数序列n₁

这题卡了46年，牵扯到遍历理论、profinite整数上的Haar测度等硬核工具。

Somani的GPT-5.2Pro用遍历理论+点态遍历定理+Dini定理给出了证明，陶哲轩评价这个思路与已知的Rogers/Davenport-Erdős证明相当不同。

X上的网友也将其誉为「第一台真正达到博士级别的AI」。

这已经是2026年1月第三个被GPT-5.2Pro击落的Erdős问题了。

从圣诞节到现在，ErdosProblems.com上已有15个问题从「open」转为「solved」，其中11个明确标注AI参与。

陶哲轩甚至开了个wiki页面，专门记录「AI对Erdős问题的贡献」。

https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com

数学界从「会不会来」直接跳到「来得有多快、会扫荡多少」的恐慌阶段。

Somani用行动告诉世界：不需要理解数学之美，只要电费管够、GPU跑满，就能收割数学界的「圣杯」。

但是，在这一片欢呼声中，如果你去翻看Somani公布的后台数据，就能发现这场「胜利」的底色，其实是一片尸横遍野的荒原。

数据库尸横遍野

Neel Somani赢了，但赢得非常难看。

登陆ErdosProblems.com，关掉「只显示成功」的滤镜，你会看到，后台躺着成千上万具「尸体」。

根据数据库后台的真实统计，GPT-5.2 Pro对这类问题的一次性通过率，只有可怜的1%到2%。

这意味着，为了那个登上头条的完美证明，AI在后台进行了成百上千次的胡言乱语。

它会捏造不存在的引理，陷入逻辑死循环，甚至把数学证明写成一首打油诗。

如果只有一个GPT-5.2，这堆垃圾早就把数学界淹没了。

所以，在这场游戏中，真正的MVP根本不是GPT，而是一个被大众忽略的冷酷工具——「Aristotle」。

Aristotle其实是Harmonic公司开发的专用工具，它把GPT输出的自然语言（经常是胡说八道）自动翻译并强制转换成Lean形式语言，然后交给Lean内核做严格验证。

相当于给AI配了一个「无限试错+零容忍bug」的自动编译+单元测试系统。

没有它，GPT的1%到2%成功率根本无法浮出水面。

现在的AI解题流程越来越标准化。GPT疯狂猜→Aristotle强制形式化+杀垃圾→Lean验证通过→人类再读。

一次，两次，一万次。直到那个概率极低的「幸存者」出现，Aristotle才会放行。

大众以为的「神迹」，其实是统计学必然。

陶哲轩在Mastodon上一针见血。他拒绝使用「Intelligence（智能）」，而是发明了一个新词：「Artificial General Cleverness（人工通用小聪明）」。

注意这个词：小聪明。

就像是一个从来不听课、也没看懂课本的差生，靠着疯狂的作弊和试错，硬生生蒙对了一道奥数题。

而这，正是NeelSomani想要的。对于「挖矿」的人来说，只要能挖出金子，谁在乎矿机懂不懂地质学？

最后的防线：人类只负责「提问」，不再负责「解答」

那么，人类数学家要失业了吗？

未必。但他们的工种，将发生一次彻底的变异。

在Neel Somani开启的这个暴力版本里，数学研究不再是属于艺术家的吟唱，而变成了属于建筑师的图纸。

以前，数学家需要亲自下矿井，一镐一镐地去挖掘真理。现在，GPT-5.2接过了镐头。

人类唯一剩下的特权，也是最后的防线，叫做「定义问题」。

你需要告诉那个疯狂的AI矿工：去哪里挖？挖什么？以及最重要的——为什么值得挖？

这听起来像是升职了，从「矿工」变成了「包工头」。但这背后藏着一个巨大的隐忧：我们正在失去对「为什么」的掌控。

当GPT-5.2扔给你一个长达几千行的Lean证明代码时，Aristotle会告诉你「这是对的」，但你可能根本读不懂中间发生了什么。

表面上，人类从「矿工」升职成了「包工头」。实际上，我们正在丧失对「为什么」的解释权。

数学曾是人类理解宇宙的语言，追求的是极致的优雅和简洁。

而在AI的统治下，数学可能变成一堆虽然正确、但毫无美感的、乱七八糟的「逻辑堆砌物」。

这或许就是陶哲轩所说的「小聪明」的代价。我们用算力换来了效率，却把理解这件事，外包给了机器。

当然，陶哲轩也反复强调，这些被AI快速解决的Erdős问题多属于「最低垂的果实」——可以用标准工具、只是之前没人费心去组合的那一类。

真正最硬核的几十个（比如需要全新思想或新对象的）目前AI还远没有触及。

但问题在于：一旦算力×模型继续指数上升，昨天的「最硬核」可能就是明天的「最低垂果实」。这不是结束，而是加速。

那张500美元的支票，已经被Neel Somani的算法兑现了。

这笔钱很少，但代价昂贵。它兑现了天才的祛魅，瓦解了数学最后的神圣感。

真理不再是上帝的耳语，它只是服务器里风扇狂转后，吐出的一行代码。

从此，决定真理的不再是智商的高低，而是显卡的多少。

醒醒吧，大航海时代结束，工业革命开始了。

当年蒸汽机让肌肉贬值，电力让距离贬值，今天的GPU集群正在让「数学直觉的稀缺性」贬值。

下一个被收割的，可能不是Erdős题，而是某个价值5000万美元的工业优化问题、或者卡了二十年的药物分子设计关键引理。

数学的象牙塔倒了——就像那张总统耳语的Meme图，下一个可能是你的行业。

参考资料：

https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/

https://www.erdosproblems.com/forum/thread/281

https://x.com/neelsomani/status/2012695714187325745

https://mathstodon.xyz/@tao/115911902186528812

https://www.erdosproblems.com/forum/thread/281#post-3327

来源:https://www.163.com/dy/article/KK4QOH5E0511ABV6.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：OpenAI老用户转投Claude三年，我们为何忍痛卸载ChatGPT 下一篇：蔚来换电网络超7309座，电池升级进展突破90%

相关攻略

Claude情绪代码曝光AI被人类逼疯撞墙引热议

AI资讯

Claude情绪代码曝光AI被人类逼疯撞墙引热议

最近，AI领域又迎来了一则重磅消息。Anthropic发布了一项碘伏性的研究，首次在其实验中证实：像Claude这样的大语言模型内部，确实存在一套可以被清晰识别和操控的“情绪”表征系统。现场抓包：AI也会Emo 这项研究最核心的突破，在于研究者们不再满足于观察AI的输出，而是直接“透视”了模型的大

热心网友

05.20

奥特曼豪宅凌晨爆炸本人发布现场照片

AI资讯

奥特曼豪宅凌晨爆炸本人发布现场照片

当地时间4月10日凌晨3点45分，旧金山的一处住所外门被火焰吞噬。这不是普通的火灾，而是针对OpenAI首席执行官萨姆·奥特曼（Sam Altman）的一次燃烧弹袭击。所幸，装置从房屋上弹开，未造乘人员伤亡。几个小时后，奥特曼在个人博客发布了一篇长文。文章以一张他与伴侣及孩子的家庭合照开篇，字里行

热心网友

05.20

奥特曼家被炸事件最新消息与详细经过

AI资讯

奥特曼家被炸事件最新消息与详细经过

一场针对科技领袖的袭击，将人工智能领域潜藏的汹涌暗流，推到了公众视野的中心。当地时间周五清晨，旧金山的一栋价值2700万美元的豪宅遭遇了燃烧弹袭击。这栋房子的主人，正是OpenAI的首席执行官萨姆·奥特曼。凌晨4点12分，警方接到报警，所幸火势被及时控制，无人受伤。嫌疑人随后徒步逃离。然而，事件

热心网友

05.20

善恶有报！钟汉良《蜜语纪》38集大结局，是今年看过最解气结局

娱乐

善恶有报！钟汉良《蜜语纪》38集大结局，是今年看过最解气结局

2026年开春收视黑马《蜜语纪》，于4月底迎来大结局。当所有看惯国产剧套路的观众，都以为结局无非是霸道总裁携“娇妻”登顶职场巅峰时，《蜜语纪》却给出了截然不同的答案——它不仅让观众看爽了，更抛出了全剧最清醒、最硬核的内核。反派悉数恶有恶报！剧中那位让人恨得牙痒痒的鲁贞贞，可谓将算计做到了极致。怀

热心网友

05.01

张雪成为符号，故事开始俗套

娱乐

张雪成为符号，故事开始俗套

张雪：逆袭故事背后的真实温度十四岁，初中毕业，从摩托车修理铺的学徒工起步；二十五年后，带领团队战胜国际强队，站上世界超级摩托车锦标赛的最高领奖台——这是张雪的故事。听起来，是不是像极了那些年在《读者》《意林》里反复出现的励志叙事？热血，逆袭，以凡人之躯比肩传奇。但看得多了，难免会生出一种熟悉的疏

热心网友

04.29

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全 2025-08-05

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全 2025-08-05

最新APP

宝宝过生日

宝宝过生日

应用辅助 04-07

台球世界

台球世界

体育竞技 04-07

解绳子

解绳子

休闲益智 04-07

骑兵冲突

骑兵冲突

棋牌策略 04-07

三国真龙传

三国真龙传

角色扮演 04-07

热门推荐

Romark Logistics与Dexory合作以AI实时库存可视化平台优化仓储管理

AI资讯

Romark Logistics与Dexory合作以AI实时库存可视化平台优化仓储管理

在现代化仓储物流管理中，实现实时、精准的库存可视化是提升运营韧性与效率的核心环节。近日，知名定制化第三方物流服务商Romark Logistics宣布了一项重要技术升级：在其位于哈兹尔顿的仓储基地正式部署由Dexory提供的AI驱动仓储可视化平台DexoryView。此举标志着Romark Logi

热心网友

05.20

谷歌Gemini Spark AI助手全天候处理数字任务提升效率

AI资讯

谷歌Gemini Spark AI助手全天候处理数字任务提升效率

今天，谷歌正式将我们带入了一个新的阶段：AI智能体时代。其推出的Gemini Spark，被定义为一款能够全天候运行的个人AI助手。它的核心使命很明确——接管我们日益复杂的数字生活，并实实在在地替我们处理一些工作。这款助手的“大脑”是最新发布的Gemini 3 5 Flash模型，而协调其行动的“

热心网友

05.20

两款AI科学助手成功实现药物重定向应用

AI资讯

两款AI科学助手成功实现药物重定向应用

近日，《自然》杂志同期发表了两项突破性研究，展示了两种旨在革新科研工作流的AI系统。一款来自谷歌，名为Co-Scientist，强调人机深度协作；另一款由非营利机构FutureHouse开发，其系统更进一步，能对特定生物实验数据进行自动化评估与分析。尽管谷歌表示其系统架构同样适用于物理学探索，但两

热心网友

05.20

谷歌AI Studio上线对话式开发安卓原生应用教程

AI资讯

谷歌AI Studio上线对话式开发安卓原生应用教程

谷歌近期对其“氛围编程”平台进行了重要升级。现在，开发者可以直接在谷歌AI Studio中，通过自然语言对话来构建安卓原生应用。具体操作流程非常直观：用户只需用日常语言描述自己的应用构思，平台内置的安卓模拟器便会实时生成应用预览。若想在实际设备上测试，只需将安卓手机连接至电脑，即可直接安装体验。更

热心网友

05.20

1099元龙虾耳机开箱评测音质与性价比如何

AI资讯

1099元龙虾耳机开箱评测音质与性价比如何

今天，科大讯飞旗下孵化的AI硬件品牌未来智能，正式发布了其创新产品——viaim讯飞智能体耳机。这款产品的核心突破在于，将先进的办公AI Agent能力，集成到一款日常可佩戴的耳机设备中。它不仅超越了传统录音转写功能，更实现了长期记忆存储、多模型灵活调用与智能复盘分析，目标清晰：将耳机从单纯的音频播

热心网友

05.20