陶哲轩回应AGI质疑：GPT-5.2 Pro攻克经典数学难题_游乐网

文章

业界资讯单机攻略视频攻略新游看台八卦新闻手游资讯手游攻略游戏问答

游戏

全部角色扮演棋牌策略休闲益智赛车竞速飞行射击体育竞技模拟经营动作冒险卡牌桌游其他游戏应用辅助

首页游戏软件资讯排行榜专题

首页

AI资讯

陶哲轩回应AGI质疑：GPT-5.2 Pro攻克经典数学难题

陶哲轩回应AGI质疑：GPT-5.2 Pro攻克经典数学难题

热心网友

30

转载

2026-01-03

新智元报道

编辑：Aeneas

【新智元导读】就在刚刚，陶哲轩po文揭秘：当前的AI无法实现真正的AGI，不过，他们倒是拥有一些有用的小聪明，或者可以说「通用狡猾」。而就在同时，又一多年数学难题被GPT-5.2 Pro攻克了。

就在今天，即将离职Meta的LeCun再次给当前AI判死刑——这条路行不通，而且永远不会成功。

前不久，谷歌DeepMind首席科学家Shane Legg给出预测：最小AGI有50%的可能性在2028年实现。

业界都在讨论的AGI之争，陶哲轩是如何看待的？

就在刚刚，陶哲轩po文明确了自己的态度——还不行。

他认为，目前还无法实现AGI。

我怀疑目前工具还无法实现真正意义上的「人工通用智能」。然而，我认为一种较弱但仍然非常有价值的「人工通用才智」，正在以各种方式成为现实。

而他的观点，立马在网上引起了广泛讨论。

网友们表示，陶哲轩这样聪明的人，都认为AGI并未实现，这样太令人绝望了——希望他是错的吧。

陶哲轩：不是AGI，只是魔术师

什么叫通用才智？

陶哲轩是这样解释的。

「通用才智」是指通过某种临时手段解决广泛复杂问题的能力。

这些手段可能是随机的，也可能是暴力计算的成果；它们可能缺乏根基或容易出错；它们可能难以解释，也可能能追溯到AI训练数据中类似的技巧。

因此，它们不能被视为任何真正「智能」的结果。

然而，它们在实现日益广泛的任务时，可以拥有非同寻常的成功率，尤其是在结合严格的验证程序以过滤掉错误或不具前景的方法时，其规模已超出了单个人类所能达到的范围。

可以理解为，这是一种「通用狡猾」AI。

而这种「通用狡猾」AI，就会让人感觉非常匪夷所思。

比如在有时候，这些技术非常实用，令人印象深刻，然而从根本上说，它却令人不满和失望。

AI是「最强大脑」魔术师？

想象这样一个场景：一位魔术师上台，凭空变出鸽子、猜中你选的牌、把水杯变成金鱼。全场掌声雷动，观众目瞪口呆。

结果他平静自曝：「其实我袖子藏了十八个机关，桌下有暗格，牌是特制的，金鱼是提前藏好的。」掌声戛然而止。

如今的AI，就像这位魔术师一样。

它能写诗、编程、解数学题——但如果你问它：「你是怎么想到这个答案的？」

它可能会诚实坦白：「我在训练数据里见过类似题目，概率上这个回答匹配度最高。」

所以，这其实不是智能，而是基于海量数据的「聪明把戏」。

「通用狡猾AI」，反而起了大作用

对于这种「通用狡猾AI」，陶哲轩是怎么解释的。

虽然聪明才智和智力在人类身上是某种程度上相关的特质，但对于AI工具（这些工具通常被优化以追求聪明才智）来说，它们却更加解耦，将当前一代这样的工具主要视为一个随机生成有时聪明，且往往有用的思想和输出的生成器，在尝试使用它们解决难题时，可能是一种更具生产性的视角。

也就是说，智能≠聪明。

对人来说，二者是同时存在的；但对于AI而言，所谓的「聪明」，也就是快速解决复杂问题，可以独立存在。

当前AI的「聪明」，是随机的，暴力的，可错的，难解释的。

最终，它并不是靠智慧取胜，而是靠「大规模试错与匹配」，就像用超级望远镜，在答案星海里捞最亮的几颗。

当今的AI，并不是全知全能，然而这个「不够智能但足够聪明」的工具，却已经悄悄改变知识工作的每一个环节。

对于陶哲轩的说法，网友们表示的确如此。

对于目前的AI来说，看似便利但难以预测的思想，似乎是一种主要应用场景。

可以说，陶哲轩所说的，就是目前AI能力「参差不齐的边界」。

甚至评论区还出现了中文留言，认为目前的AI底层架构就决定了，即使投入无限多的算力，产出的东西也依然有边际。

而在Reddit的帖子中，网友们也对此展开热议。

有人对表示，自己非常尊重陶哲轩，但对他的部分观点表示反驳。

有人说，他用「狡猾」或「巧妙」一词，来针对现代LLM缺乏系统性思维的缺点。

目前，他或许是对的。不过，ChatGPT还只有3岁，如果要宣布所有LLM都有此局限，至少还应该再等待十年。

又一数学难题被AI破解

巧的是，就在陶哲轩发出这个论点不久，又有一道数学难题被AI破解了！

滑铁卢大学计算机系的助理教授Kimon Fountoulakis激动发帖称，GPT-5.2刚刚解决了COLT 2024开放问题——

使用标准加速梯度算法和互补性边界假设，证明加速L1正则化PageRank的运行时间复杂度。

其中，所有证明都由GPT-5.2 Pro生成。算法总工作量的关键界限，则是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 组合完成了自动的形式化。

多伦多大学的教授Daniel Litt也出来表示，GPT-5.2 Pro的确很强，它对于自己的代数几何和数论研究，都产生了巨大飞跃。

悬赏8年难题，GPT-5.2用数学证明封神

这道难题，已经困扰了教授8年。

自2024年以来，每次OpenAI或谷歌发布一个新模型，他都会拿过来尝试一下。

令人没想到的是，这一次，GPT-5.2竟然成功了！

教授这样回忆道：这个开放性问题，我们尝试了三年，失败了；找博士生做，也失败了；问了多位顶尖学者，都说太难了。

2024年，这道关于「加速L1正则化PageRank算法时间复杂度」的难题，被正式列为COLT国际顶级会议的开放问题之一，悬赏求解。

谁也没想到，两年后，这道难倒无数学者的题目，竟被GPT-5.2悄然攻克。

悬赏

故事要从2016年说起。当时，教授在优化PageRank算法时发现，经典迭代软阈值算法在求解带L1正则的PageRank问题时，其运行时间竟然只与最终解的非零节点数有关，出奇地高

一个很自然的追问随之而来：如果用上加速算法，比如在优化领域声名显赫的FISTA，会不会更快？

理论上应该如此。但现实却泼了一盆冷水：FISTA在迭代过程中会「激活」大量本应为零的节点，虽然最终能收敛到正确的稀疏解，但中间过程却很铺张浪费。

开始，教授尝试了三个月，想从理论上界定FISTA的总计算量，失败了。后来断断续续又试了几次，直到2024年，无论是教授最杰出的学生，还是几位大牛研究者，都对这个问题束手无策。

团队决定，将这个难题公之于众。

2024年，它被正式列为COLT的开放问题，向全球机器学习社区发起挑战。

破局

第一个成功的解法，出现在2024年。David Martínez-Rubio等人提出了一种新颖的加速算法，从完全不同的角度给出解答。

然而，这个算法为了达到加速效果，需要在每一步求解一个昂贵的子问题，在实际应用中效率很低。

直到GPT-5.2发布后，真正的转折点来了。

这一次，GPT-5.2给出了完整的证明。

而且令人震惊的是，它给出的恰恰是针对经典FISTA算法的证明。

它揭示了在一种被称为「互补性边界」的合理假设下，FISTA的总计算量可以被优雅地界定，并且在特定的图结构上，能展现出明确优于经典算法的加速效果。

更关键的是，这个证明解释了长期困扰学界的现象：尽管FISTA在迭代中会激活更多节点，但这些「多余激活」是可控的、暂时的。一旦迭代进入最优解的一个邻域，算法就会迅速收敛。

怎么证明？三重验证

GPT-5.2的证明能令人信服吗？为此，团队搭建了一个三重验证体系。

首先，GPT-5.2 Pro生成了完整的证明初稿。

接着，团队借助@HarmonicMath的Aristotle系统，结合Gemini 3 Pro模型，将证明中的关键不等式和复杂度上界，逐行转化成了形式化的Lean代码。

而且除了形式化验证之外，教授自己也把证明从头到尾证明了两遍。目前看来，证明是没问题的。

陶哲轩会被说服吗

又一数学难题被GPT-5.2 Pro攻克，这不由得引起网友讨论——

它会成为AGI吗？陶哲轩会看到希望吗？

至少，目前GPT-5.2再一次证明了LLM在深度数学推理上的惊人潜力。

而且，它也弥合了理论分析与实际算法之间的鸿沟。它的证明，为最经典的加速算法提供了缺失的理论基石。

当然，这并不意味着AI能取代理论科学家。

可以说，它更像是一个拥有惊人直觉和不知疲倦的协作者。

人类提出关键问题、界定框架、判断价值，AI则能在庞大的数学空间里，帮我们找到那条通往答案的隐秘小径。

参考资料：

https://mathstodon.xyz/@tao/115722360006034040

https://x.com/kfountou/status/2000957773584974298

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

来源:https://www.163.com/dy/article/KIBPL4380511ABV6.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：港城电子皮肤突破：机器人自检损伤与主动感知痛觉下一篇：中国纯电动车以色列车市占近八成，比亚迪奇瑞捷途位居前列

相关攻略

OpenClaw人人养虾接入Matrix平台操作指南

AI资讯

OpenClaw人人养虾接入Matrix平台操作指南

Matrix 是一种开放且去中心化的即时通讯协议，允许用户自主部署私有服务器并接入全球 Matrix 联邦网络。OpenClaw 网关通过集成 Matrix 的 Client-Server API，实现与这一分布式通信生态的无缝对接。前置准备在配置 OpenClaw 连接 Matrix 之前，请

热心网友

05.20

阿里官方揭秘欢乐马项目源自ATH郑波团队

AI资讯

阿里官方揭秘欢乐马项目源自ATH郑波团队

周二晚间，AI领域迎来了一则重磅消息。在权威AI评测平台Artificial Analysis的榜单上，一个名为「HappyHorse-1 0」的神秘模型异军突起，一举登顶视频生成能力排行榜，引发了业界的广泛关注与热议。这一成绩极具含金量。无论是文本生成视频，还是图像生成视频，HappyHorse

热心网友

05.19

世界模型AI直播预约开启引爆人工智能新浪潮

AI资讯

世界模型AI直播预约开启引爆人工智能新浪潮

当AI开始学会“脑补”物理世界的运行规律，并尝试模拟一个动态变化的真实环境时，我们距离那个传说中的通用人工智能（AGI）究竟还有多远？进入2026年以来，“世界模型”毫无悬念地成为了科技圈最炙手可热的核心议题。它标志着一个关键的范式转变：人工智能正从被动地“感知当下”，迈向主动地对时空与动态变化进

热心网友

05.19

世界模型第二期直播预约AI技术前沿与应用解析

AI资讯

世界模型第二期直播预约AI技术前沿与应用解析

上周三关于“世界模型”的线上沙龙反响空前热烈，这充分表明，从被动感知迈向主动推演，这条被视为实现通用人工智能（AGI）的核心技术路径，正深度吸引着整个AI行业的关注。鉴于持续高涨的讨论热度，我们决定加开一场深度分享会。那么，这条充满潜力却又极具挑战性的前沿赛道，目前进展到了何种阶段？顶尖的研究者们

热心网友

05.19

许哲诚计算性设计展演评析：数字逻辑与物质建构的生成境域

科技数码

许哲诚计算性设计展演评析：数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力（江苏省美术馆策展人）当代设计与造物的核心范式，正经历着由计算性设计带来的深刻变革。2026年3月20日，南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演，正是这一前沿趋势的集中体现。本次展览超越

热心网友

05.18

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全 2025-08-05

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全 2025-08-05

最新APP

宝宝过生日

宝宝过生日

应用辅助 04-07

台球世界

台球世界

体育竞技 04-07

解绳子

解绳子

休闲益智 04-07

骑兵冲突

骑兵冲突

棋牌策略 04-07

三国真龙传

三国真龙传

角色扮演 04-07

热门推荐

企业网络安全等级保护合规指南：龙虾养殖业如何落地实施

AI资讯

企业网络安全等级保护合规指南：龙虾养殖业如何落地实施

摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成，并已由人工审核。随着企业数字化转型进入智能体（Agent）驱动的新阶段，如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》（等保2 0）的严格框架下，企业级智能体的部署必须同时满足效率提升与合规保障的双

热心网友

05.23

外贸业务员年终总结PPT制作指南 AI高效提升总结效果

AI教程

外贸业务员年终总结PPT制作指南 AI高效提升总结效果

使用情景对于外贸从业者来说，年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划，既要系统梳理过去一年的业绩成果与经验得失，也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天，一份逻辑严谨、数据详实、洞察深刻的总结报告，不仅是个人专业能力的集中体现，更是赢得管理层支

热心网友

05.23

WPS AI一键生成年度安全工作总结PPT高效制作专业汇报

AI教程

WPS AI一键生成年度安全工作总结PPT高效制作专业汇报

使用情景又到年末了，年度安全工作总结是每个团队都绕不开的环节。这份总结的价值，远不止于一份简单的回顾。它更像是一份“体检报告”，清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好，哪里还有隐患，从而为来年的精准施策打下坚实的基础。不过，说起写总结、做PPT，不少人就开始头疼了：内容怎么组织

热心网友

05.23

ZEC价格暴涨520%后还能买吗深度解析Zcash未来走势与投资潜力

web3.0

ZEC价格暴涨520%后还能买吗深度解析Zcash未来走势与投资潜力

Zcash (ZEC) 月度暴涨520%：深度解析后市行情与关键点位近期，隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情，月度涨幅高达520%，价格一度逼近300美元，创下自2021年12月以来的新高。在加密市场整体承压的背景下，ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分

热心网友

05.23

电商售后数据自动汇总分析流程与智能化方案详解

AI资讯

电商售后数据自动汇总分析流程与智能化方案详解

在存量竞争的时代，电商售后数据早已超越了“成本中心”的单一角色，它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而，现实往往骨感：多平台、多店铺、多套ERP系统并存，数据散落一地。靠人工手动汇总？不仅耗时费力，更关键的是，你永远无法实现真正的实时预警与敏捷响应。那么，电商售后数据

热心网友

05.23