首页 游戏 软件 资讯 排行榜 专题
首页
AI
陶哲轩回应AGI质疑:GPT-5.2 Pro攻克经典数学难题

陶哲轩回应AGI质疑:GPT-5.2 Pro攻克经典数学难题

热心网友
60
转载
2026-01-03


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:Aeneas

【新智元导读】就在刚刚,陶哲轩po文揭秘:当前的AI无法实现真正的AGI,不过,他们倒是拥有一些有用的小聪明,或者可以说「通用狡猾」。而就在同时,又一多年数学难题被GPT-5.2 Pro攻克了。

就在今天,即将离职Meta的LeCun再次给当前AI判死刑——这条路行不通,而且永远不会成功。

前不久,谷歌DeepMind首席科学家Shane Legg给出预测:最小AGI有50%的可能性在2028年实现。

业界都在讨论的AGI之争,陶哲轩是如何看待的?

就在刚刚,陶哲轩po文明确了自己的态度——还不行。


他认为,目前还无法实现AGI。

我怀疑目前工具还无法实现真正意义上的「人工通用智能」。然而,我认为一种较弱但仍然非常有价值的「人工通用才智」,正在以各种方式成为现实。

而他的观点,立马在网上引起了广泛讨论。


网友们表示,陶哲轩这样聪明的人,都认为AGI并未实现,这样太令人绝望了——希望他是错的吧。

陶哲轩:不是AGI,只是魔术师

什么叫通用才智?

陶哲轩是这样解释的。

「通用才智」是指通过某种临时手段解决广泛复杂问题的能力。

这些手段可能是随机的,也可能是暴力计算的成果;它们可能缺乏根基或容易出错;它们可能难以解释,也可能能追溯到AI训练数据中类似的技巧。

因此,它们不能被视为任何真正「智能」的结果。

然而,它们在实现日益广泛的任务时,可以拥有非同寻常的成功率,尤其是在结合严格的验证程序以过滤掉错误或不具前景的方法时,其规模已超出了单个人类所能达到的范围。

可以理解为,这是一种「通用狡猾」AI。


而这种「通用狡猾」AI,就会让人感觉非常匪夷所思。

比如在有时候,这些技术非常实用,令人印象深刻,然而从根本上说,它却令人不满和失望。

AI是「最强大脑」魔术师?

想象这样一个场景:一位魔术师上台,凭空变出鸽子、猜中你选的牌、把水杯变成金鱼。全场掌声雷动,观众目瞪口呆。

结果他平静自曝:「其实我袖子藏了十八个机关,桌下有暗格,牌是特制的,金鱼是提前藏好的。」掌声戛然而止。

如今的AI,就像这位魔术师一样。


它能写诗、编程、解数学题——但如果你问它:「你是怎么想到这个答案的?」

它可能会诚实坦白:「我在训练数据里见过类似题目,概率上这个回答匹配度最高。」

所以,这其实不是智能,而是基于海量数据的「聪明把戏」。

「通用狡猾AI」,反而起了大作用

对于这种「通用狡猾AI」,陶哲轩是怎么解释的。

虽然聪明才智和智力在人类身上是某种程度上相关的特质,但对于AI工具(这些工具通常被优化以追求聪明才智)来说,它们却更加解耦,将当前一代这样的工具主要视为一个随机生成有时聪明,且往往有用的思想和输出的生成器,在尝试使用它们解决难题时,可能是一种更具生产性的视角。

也就是说,智能≠聪明。

对人来说,二者是同时存在的;但对于AI而言,所谓的「聪明」,也就是快速解决复杂问题,可以独立存在。

当前AI的「聪明」,是随机的,暴力的,可错的,难解释的。

最终,它并不是靠智慧取胜,而是靠「大规模试错与匹配」,就像用超级望远镜,在答案星海里捞最亮的几颗。

当今的AI,并不是全知全能,然而这个「不够智能但足够聪明」的工具,却已经悄悄改变知识工作的每一个环节。

对于陶哲轩的说法,网友们表示的确如此。

对于目前的AI来说,看似便利但难以预测的思想,似乎是一种主要应用场景。


可以说,陶哲轩所说的,就是目前AI能力「参差不齐的边界」。


甚至评论区还出现了中文留言,认为目前的AI底层架构就决定了,即使投入无限多的算力,产出的东西也依然有边际。


而在Reddit的帖子中,网友们也对此展开热议。

有人对表示,自己非常尊重陶哲轩,但对他的部分观点表示反驳。


有人说,他用「狡猾」或「巧妙」一词,来针对现代LLM缺乏系统性思维的缺点。

目前,他或许是对的。不过,ChatGPT还只有3岁,如果要宣布所有LLM都有此局限,至少还应该再等待十年。


又一数学难题被AI破解

巧的是,就在陶哲轩发出这个论点不久,又有一道数学难题被AI破解了!

滑铁卢大学计算机系的助理教授Kimon Fountoulakis激动发帖称,GPT-5.2刚刚解决了COLT 2024开放问题——

使用标准加速梯度算法和互补性边界假设,证明加速L1正则化PageRank的运行时间复杂度。

其中,所有证明都由GPT-5.2 Pro生成。算法总工作量的关键界限,则是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 组合完成了自动的形式化。


多伦多大学的教授Daniel Litt也出来表示,GPT-5.2 Pro的确很强,它对于自己的代数几何和数论研究,都产生了巨大飞跃。


悬赏8年难题,GPT-5.2用数学证明封神

这道难题,已经困扰了教授8年。


自2024年以来,每次OpenAI或谷歌发布一个新模型,他都会拿过来尝试一下。

令人没想到的是,这一次,GPT-5.2竟然成功了!


教授这样回忆道:这个开放性问题,我们尝试了三年,失败了;找博士生做,也失败了;问了多位顶尖学者,都说太难了。

2024年,这道关于「加速L1正则化PageRank算法时间复杂度」的难题,被正式列为COLT国际顶级会议的开放问题之一,悬赏求解。

谁也没想到,两年后,这道难倒无数学者的题目,竟被GPT-5.2悄然攻克。

悬赏

故事要从2016年说起。当时,教授在优化PageRank算法时发现,经典迭代软阈值算法在求解带L1正则的PageRank问题时,其运行时间竟然只与最终解的非零节点数有关,出奇地高

一个很自然的追问随之而来:如果用上加速算法,比如在优化领域声名显赫的FISTA,会不会更快?

理论上应该如此。但现实却泼了一盆冷水:FISTA在迭代过程中会「激活」大量本应为零的节点,虽然最终能收敛到正确的稀疏解,但中间过程却很铺张浪费。

开始,教授尝试了三个月,想从理论上界定FISTA的总计算量,失败了。后来断断续续又试了几次,直到2024年,无论是教授最杰出的学生,还是几位大牛研究者,都对这个问题束手无策。


团队决定,将这个难题公之于众。

2024年,它被正式列为COLT的开放问题,向全球机器学习社区发起挑战。


破局

第一个成功的解法,出现在2024年。David Martínez-Rubio等人提出了一种新颖的加速算法,从完全不同的角度给出解答。

然而,这个算法为了达到加速效果,需要在每一步求解一个昂贵的子问题,在实际应用中效率很低。

直到GPT-5.2发布后,真正的转折点来了。

这一次,GPT-5.2给出了完整的证明。


而且令人震惊的是,它给出的恰恰是针对经典FISTA算法的证明。

它揭示了在一种被称为「互补性边界」的合理假设下,FISTA的总计算量可以被优雅地界定,并且在特定的图结构上,能展现出明确优于经典算法的加速效果。

更关键的是,这个证明解释了长期困扰学界的现象:尽管FISTA在迭代中会激活更多节点,但这些「多余激活」是可控的、暂时的。一旦迭代进入最优解的一个邻域,算法就会迅速收敛。


怎么证明?三重验证

GPT-5.2的证明能令人信服吗?为此,团队搭建了一个三重验证体系。

首先,GPT-5.2 Pro生成了完整的证明初稿。

接着,团队借助@HarmonicMath的Aristotle系统,结合Gemini 3 Pro模型,将证明中的关键不等式和复杂度上界,逐行转化成了形式化的Lean代码。

而且除了形式化验证之外,教授自己也把证明从头到尾证明了两遍。目前看来,证明是没问题的。


陶哲轩会被说服吗

又一数学难题被GPT-5.2 Pro攻克,这不由得引起网友讨论——

它会成为AGI吗?陶哲轩会看到希望吗?

至少,目前GPT-5.2再一次证明了LLM在深度数学推理上的惊人潜力。

而且,它也弥合了理论分析与实际算法之间的鸿沟。它的证明,为最经典的加速算法提供了缺失的理论基石。

当然,这并不意味着AI能取代理论科学家。

可以说,它更像是一个拥有惊人直觉和不知疲倦的协作者。

人类提出关键问题、界定框架、判断价值,AI则能在庞大的数学空间里,帮我们找到那条通往答案的隐秘小径。

参考资料:

https://mathstodon.xyz/@tao/115722360006034040

https://x.com/kfountou/status/2000957773584974298

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

来源:https://www.163.com/dy/article/KIBPL4380511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenClaw人人养虾:接入Discord
AI
OpenClaw人人养虾:接入Discord

Discord接入:让OpenClaw成为你的社区智能管家 对于全球数亿的游戏玩家和社群爱好者来说,Discord几乎等同于线上“大本营”。那么,有没有可能让你精心搭建的Discord服务器也拥有一个聪明能干的AI助手呢?答案是完全可行。通过创建Discord Bot(机器人),你可以将OpenCl

热心网友
04.15
Claude强到不敢发的Mythos,被质疑用了字节Seed技术
AI
Claude强到不敢发的Mythos,被质疑用了字节Seed技术

Claude最强“神话”模型,可能用到来自字节的技术? 这条猜测直接冲上了热搜榜。 这款被形容为“强到不敢公开发布”的Mythos模型,确实极大地刺激了人们对下一代大语言模型架构的想象空间。 社区讨论的焦点,正集中在它是否采用了“循环语言模型”(Looped Language Model)这一创新架

热心网友
04.14
DeepSeek上线专家模式:国产AI激战正酣,V4能否复刻去年春节炸场?
科技数码
DeepSeek上线专家模式:国产AI激战正酣,V4能否复刻去年春节炸场?

国产大模型DeepSeek迎来重大更新:快速模式与专家模式上线 最新消息显示,国产AI大模型DeepSeek再次迎来重要升级。4月8日,用户在访问DeepSeek时发现,输入框上方新增了“快速模式”与“专家模式”两个选项。根据官方说明,快速模式专注于日常对话场景,响应速度快,同时支持图片和文件中的文

热心网友
04.14
OpenClaw人人养虾:接入飞书
AI
OpenClaw人人养虾:接入飞书

飞书接入指南:为你的团队嵌入一位AI同事 如果你身处国内互联网或科技行业,对飞书这款高效协作平台一定非常熟悉。如今,它已不仅是团队沟通工具,更成为众多企业的数字化工作中枢。那么,能否让团队成员在飞书内部,直接调用强大的AI智能助手来提升效率呢?答案是肯定的。本指南将手把手教你,如何将OpenClaw

热心网友
04.14
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26
AI
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

NovaTalks : 全渠道客服解决方案
AI
NovaTalks : 全渠道客服解决方案

需求人群 这套解决方案面向的是所有需要处理客户沟通的团队,尤其是在客服和销售这两个核心领域。如果你正在为如何给客户提供更贴心、更高效的个性化服务而头疼,那么它很可能就是你正在寻找的工具。 产品特色 它的核心能力,首先体现在“连通”上。产品提供了一个能够整合多种社交媒体平台的聊天与客服工具,这意味着你

热心网友
05.01
Sublime右侧滚动条太宽怎么办?Sublime自定义滚动条样式设置
编程语言
Sublime右侧滚动条太宽怎么办?Sublime自定义滚动条样式设置

Sublime Text滚动条宽度调整指南:修改主题文件与禁用悬浮模式 Sublime Text滚动条宽度由主题文件控制,无法通过设置项调整 许多用户发现Sublime Text的滚动条过宽,第一反应是去设置中寻找调整选项。但这里需要明确一个关键点:Sublime Text的滚动条样式(包括宽度、颜

热心网友
05.01
centos如何排查php-fpm错误日志
编程语言
centos如何排查php-fpm错误日志

CentOS系统下PHP-FPM错误日志的全面排查与优化指南 当您的网站出现访问异常、页面加载缓慢或PHP应用报错时,PHP-FPM错误日志是进行故障诊断的首要入口。这份日志如同服务器的“健康监测报告”,精准记录了运行时发生的各类问题。本指南将为您提供一套系统化的排查流程,帮助您快速定位并修复Cen

热心网友
05.01
centos中php-fpm与nginx如何联调
编程语言
centos中php-fpm与nginx如何联调

CentOS系统下Nginx与PHP-FPM集成配置:从安装到测试的完整教程 在CentOS服务器上实现Nginx与PHP-FPM的协同工作是部署动态网站的核心环节。虽然涉及多个配置步骤,但只要遵循清晰的流程,即可高效完成环境搭建。本指南将详细讲解从软件安装、服务配置到功能验证的全过程,帮助您快速建

热心网友
05.01
php-fpm在centos上如何设置并发数
编程语言
php-fpm在centos上如何设置并发数

CentOS服务器PHP-FPM并发数优化配置指南 想要充分发挥CentOS服务器上PHP-FPM的性能潜力,科学设置并发进程数是至关重要的优化环节。合理的并发配置能够显著提升网站在高流量场景下的响应速度与运行稳定性,有效避免因资源不足导致的卡顿或崩溃。本文将详细讲解如何通过调整关键参数来优化PHP

热心网友
05.01