首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
AI攻克42年数学难题迈向通用人工智能新突破

AI攻克42年数学难题迈向通用人工智能新突破

热心网友
82
转载
2026-05-18

一个困扰数学界长达42年的难题,被解开了。

但解开它的,并非某个顶级研究所的团队,也不是一篇刚刚发表的重量级论文,而是一场持续三天、总计约12小时的人机对话。

2026年4月,OpenAI高级研究员Ernest Ryu在一场播客访谈中回顾了这段经历。他与ChatGPT反复交流,不断指出模型推理中的错误并调整方向,一步步逼近最终结论。那道关于经典优化算法收敛性的开放问题,在过去四十多年里始终悬而未决。直到一个完整的证明在对话中浮现。Ryu亲自验证了一遍,又让模型复核了一遍,结果完全正确。

“如果没有这些工具,我可能需要三个月,甚至更久。”他坦言。

同场对话中,另一位研究员Sébastien Bubeck也分享了观察:模型在国际数学奥林匹克竞赛中已达到顶尖水平,在部分研究级问题上也开始提供实质性帮助。更关键的是,它甚至能将散落在不同领域的既有成果串联起来,走出前人未曾走通的路径。

AI的能力边界,正在被实实在在地向前推进。这无疑是AGI进程中一个值得认真对待的信号。

第一节|从工具到参与者

要理解这件事的意义,不妨先建立一个参照系。

就在2025年初,模型还难以可靠完成一些听起来极其简单的任务:比如,三个人野营后有一堆消费明细,帮忙算算每人该付多少;或者,为三个不同时区的人找一个合适的Zoom会议时间。

然而,就在同一年,一个数学界42年的开放问题,在12小时的人机对话中被解决了。

如此巨大的跨度,仅用“模型变聪明了”显然无法解释。事实上,大约一年半前,Sébastien Bubeck曾参加一场学术辩论,主题是“扩展大语言模型能否帮助解决重大数学开放问题”。开场投票时,80%的与会者认为“不可能”。辩论结束后,这个比例变成了五五开。而仅仅八个月后,模型就已经开始处理研究级别的数学问题了。

这个过程,早已超越了简单的问答。模型没有一次性给出答案,也没有沿着一条笔直稳定的路径推进。整个进程是来回往复的:提出思路,展开推理,发现漏洞,调整路径,再次追问,继续延展。

这,恰恰更接近真实的研究状态。

过去的模型,即便能解决复杂问题,本质上仍停留在“输出结果”的层面。而现在,它开始进入“过程”本身。研究的推进方式,是在反复试探中逐步逼近,而非从问题直接跳到答案。一旦模型能够参与这个过程,它的角色就从“工具”转变为了“参与者”。

与此同时,当研究团队尝试用模型处理一批长期未解的数学问题时,还发现了一个有趣的现象:有些问题的答案,其实早已隐藏在不同领域的既有成果中,只是从未被联系起来。模型通过大规模检索和推理,在庞杂的知识网络中找到可用线索并建立连接,新的结果才得以浮现。

正因如此,这个案例绝不仅仅是一次成功的解题。它标志着一个更根本的转变:AI正式走入了真实、动态的研究流程。

第二节|思考更久,才是真突破

如果仅仅将其理解为模型能力的单点爆发,很容易得出一个片面结论:这源于某一次突然的技术跃迁。但Sébastien Bubeck在访谈中的解释恰恰相反——没有哪一个单一因素能解释这一切,这种变化是多种能力在同一时期叠加后集中显现的结果。

而在所有这些能力中,最核心的突破在于:模型开始能够进行更长时间的持续性推理,并在此过程中保持思路的连贯与一致。

这一点为何如此关键?数学乃至更广泛的科学研究,难点往往不在于某一个具体的计算步骤,而在于整条推导链能否自始至终逻辑严密。只要中间出现一个细微的偏差,后续所有构建都可能失去意义。这就要求推理者能在很长一段时间内,持续地进行自我检查和修正,光会向前推进是远远不够的。过去的模型在短链条推理上表现尚可,但一旦链条拉长,就容易偏离主题或陷入循环,很难在复杂任务中持续推进。

要体会这个跨度有多大,可以回溯到四年前。2024年前后,谷歌发布了专门针对数学的模型Minerva。Sébastien Bubeck回忆说,他当时激动得差点从椅子上跳起来,而原因仅仅是:给模型几个平面点的坐标,它能正确地画出一条穿过这些点的直线。

如今,科技行业内部正在逐渐形成一个新衡量尺度:“AGI时间”。它衡量的不再是模型瞬间有多“聪明”,而是它能连续、专注地“思考”多久。从最早只能处理几秒钟的简单问答,到可以维持数分钟的推理,再到如今能够围绕一个难题展开数小时甚至数天的探索性对话。

Ernest Ryu在访谈中用Codex做了一个类比。Codex能够在很长的工作周期内处理庞大的代码仓库,通过不断压缩和整理对话记录,在持续的交互中推进复杂编程任务。Ryu认为,数学研究正在走上同样的道路:数学笔记相当于代码仓库,推理过程则相当于长周期的工作会话。模型无需在单次对话中完成全部推导,它可以像人类研究者一样,今天推进一部分,整理成笔记,下周接着来,最终将数月思考浓缩为一篇论文。

顺着这个逻辑展望,如果模型能在更长的周期——比如几周甚至更久——内保持推理的稳定性,那么它所能处理的问题类型将发生质变。许多需要长期酝酿、反复推敲的研究任务,也将逐渐进入它的能力范围。

所谓更接近AGI,或许并不需要等待某个突然降临的奇点。更现实的路径,正是“思考时间”的持续延长:从短暂的条件反射,到持续的推理分析,再到接近人类研究节奏的长期、深度思考。

决定AI能力边界的,不只是它能“做什么”,更是这种能力能“维持多久”。

第三节|科学,正在被重新组织

数学,只是AI这种新型能力最早产生深刻影响的领域之一。真正需要关注的,是这种能力一旦普及,将如何重塑整个科学的工作方式。

第一个层面,是知识的验证方式。Bubeck的团队测试过大量已发表的数学论文,发现其中存在相当数量的错误,有些是细微瑕疵,有些则是根本性的逻辑漏洞。过去,一篇长达300页的证明从发表到被学界全面核实,往往需要数年时间,期间整个领域可能已经在某个错误结论的基础上继续前行了。现在,AI有望大幅压缩这个检验周期。既有知识体系的可靠性,正在被重新梳理。

第二个层面,是研究的起点。模型开始不只是回答问题,也学会了提出有价值的问题。访谈中提到,他们内部的模型已经能够生成高质量的研究假设,其质量甚至让人类研究者认为“这个方向值得专门写一篇论文去探讨”。当“提出问题”这个最源头的环节也能被AI深度辅助时,研究者需要保留的核心能力,就变成了判断哪些问题值得追逐,能否在关键节点做出明智的取舍,以及识别哪个方向才具备真正的突破潜力。这些,恰恰是模型目前最难替代的部分。

当然,这种重构并不会自动带来更好的研究成果。过度依赖模型,反而可能让研究者只停留在理解结果的表层,失去深入推导、把握本质的能力。工具越强大,对使用者判断力的要求就越高。

长期来看,科学研究正在经历一次深刻的分工调整。重复性的推导、验证与信息整合工作,AI可以承担得越来越多;而判断“做什么”、“往哪里去”的战略决策部分,其重要性反而在急剧提升。研究者的核心价值,正从“执行”转向“决策”。

历史总是相似的。计算机诞生时,曾有人预言数学界将不再有难题。结果呢?计算本身开辟了全新的研究领域,待解的难题只增不减。如今的逻辑如出一辙:工具越强大,值得追问的深层次问题就越多,而能提出好问题的人,反而越显稀缺。

这种变化绝不会止步于数学。材料科学、生物医学、理论物理……所有依赖大量逻辑推理和交叉验证的学科,只要问题具备相对清晰的结构,AI都将逐步深入参与其中。

AI加速的,是科学发现的节奏。未曾改变的,是科学始终需要人类来定义方向这件事本身。

结语|方向,仍然在人

42年没有答案的问题,在12小时里浮现出曙光。但这绝非终点,它只是一个清晰的新起点。

真正拉近距离的,是模型开始能在更长时间里维持连贯、严谨的推理,从而真正“进入”了研究过程本身。这一点,比任何单次的、炫目的突破都更值得关注。

当工具替代了越来越多的常规执行,剩下的核心问题便愈发清晰:你能不能看懂它给出的结果?你有没有能力提出下一个更好的、真正重要的问题?

思考正在被加速,但选择的方向盘,仍然握在人的手中。

来源:https://36kr.com/p/3787151983664384
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI卡皮巴拉如何撰写营销文案 实例解析与效果评估
AI
AI卡皮巴拉如何撰写营销文案 实例解析与效果评估

想让AI生成真正具备“卡皮巴拉”灵魂的营销文案?如果你总觉得产出内容差了点火候——要么机械生硬,要么只是浮于表面的卖萌,症结往往在于提示词的构建策略。真正的解法,在于将抽象的风格感知,转化为AI能够精准理解并执行的“操作指南”。以下这套四步方法论,或许能为你提供全新的优化路径。 一、构建具象化角色人

热心网友
05.18
千问AI如何自动生成API文档提升后端开发效率
AI
千问AI如何自动生成API文档提升后端开发效率

千问AI能够有效辅助生成高质量的API文档,主要涵盖四个核心应用场景:一、基于代码注释智能生成符合OpenAPI规范的文档初稿;二、将Swagger OpenAPI契约文件转化为易于理解的中文技术文档,并补充业务逻辑说明;三、同步生成配套的接口测试用例与文档调用示例;四、依据接口变更点自动生成结构化

热心网友
05.18
千问AI文件读取教程 如何授权文件夹操作指南
AI
千问AI文件读取教程 如何授权文件夹操作指南

想让千问AI帮你解读本地文件?无论是PDF合同、Word报告还是Excel表格,关键在于通过官方客户端完成正确的上传与授权。不同场景下,操作路径略有差异,选对方法能让效率倍增。 网页端:处理长文档与混合格式的首选 如果你需要处理篇幅较长或格式多样的文件,网页端是最佳选择。它支持直接拖拽上传,系统会自

热心网友
05.18
千问AI如何助力社群运营实现自动回复与管理
AI
千问AI如何助力社群运营实现自动回复与管理

千问AI赋能社群自动化运营:一、关键词触发智能回复;二、定时任务精准推送;三、敏感词实时过滤预警;四、成员标签化智能分组。 社群运营工作繁杂,常常需要处理大量重复性任务,如解答常见问题、发布定时通知、监控群内动态等,这让运营者倍感压力。如何实现高效、智能的社群管理,解放人力?利用千问AI的强大功能,

热心网友
05.18
Cmd+K快捷键使用指南:掌握Cursor AI高效操作技巧
AI
Cmd+K快捷键使用指南:掌握Cursor AI高效操作技巧

在 Cursor 编辑器中使用 AI 辅助编程时,你是否发现核心快捷键 Cmd+K(macOS)或 Ctrl+K(Windows Linux)有时响应不理想?这通常与触发条件、编辑器焦点或上下文准备不足有关。别担心,本文将为你详细解析 Cursor AI 快捷键的正确用法,帮助你高效生成、解释和重构

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币巨量流出CEX 24小时超5740枚 市场抄底信号显现
web3.0
比特币巨量流出CEX 24小时超5740枚 市场抄底信号显现

过去24小时全球主要交易所比特币流向分化明显,整体净流出5740 82枚。其中CoinbasePro流出约5457枚,币安、Gemini分别流出1023枚和504枚;而OKX则逆势录得约530枚净流入。

热心网友
05.18
魔兽世界恶魔的气息任务全流程攻略与完成步骤详解
游戏攻略
魔兽世界恶魔的气息任务全流程攻略与完成步骤详解

卡拉赞的“恶魔的气息”任务需向大法师奥图鲁斯领取,随后击败玛克扎尔王子并回提交还。任务奖励包括金币、经验与声望。

热心网友
05.18
魔力宝贝狗洞位置详解与前往路线指南
游戏攻略
魔力宝贝狗洞位置详解与前往路线指南

《魔力宝贝》中“狗洞”即“奇怪的洞窟”,位于亚留特村西南方向黄色传送石处,是12至20级玩家高效练级地点。前往路线为:从法兰城至伊尔村,向北进入哈巴鲁东边洞窟击败“熊男”,穿越后抵达亚留特村,再向西南探索即可找到入口。洞内怪物等级较高,建议携带“风地”属性水晶提升生存能力。

热心网友
05.18
贾跃亭获7000万美元融资 将推进多年造车计划
业界动态
贾跃亭获7000万美元融资 将推进多年造车计划

时隔七年,贾跃亭以CEO身份重掌法拉第未来(FF)帅印,并成功为公司注入了关键的发展动力。近期,FF累计完成了高达7000万美元的机构融资。这笔至关重要的资金,被贾跃亭定位为驱动公司机器人业务实现第一阶段战略目标的“核心粮草”。 随着资金与团队就位,贾跃亭的信心显著增强。他公开立下目标:将用两年时间

热心网友
05.18
原神修复水道任务攻略法沙利亚的狂想曲通关详解
游戏攻略
原神修复水道任务攻略法沙利亚的狂想曲通关详解

任务需修复两条水道。首先跟随指引找到NPC并进入幻境,使用号角对准壁画激活飞鸟幻影,触碰并跟随其路径即可修复第一条水道。第二条水道位于洞xue内,跟随萤火虫找到入口,重复使用号角并借助弹跳水母到达高处,跟随飞鸟完成修复。完成后可获得奖励并推进剧情。

热心网友
05.18