首页 游戏 软件 资讯 排行榜 专题
首页
AI
Claude破解《计算机程序设计艺术》难题,背后玄机揭晓

Claude破解《计算机程序设计艺术》难题,背后玄机揭晓

热心网友
58
转载
2026-03-06

编辑|Panda

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

「震惊!震惊!」

是什么让著名计算机科学家和数学家、《计算机程序设计艺术》作者、图灵奖得主高德纳(Donald Knuth)发出了如此惊呼?



图片由 AI 生成

你没有猜错,正是AI

在他近期在斯坦福大学正式上公布的一篇论文《Claude’s Cycles》中,开篇的「Shock! Shock!」非常直白地表达了他对于 AI 强大能力的震惊。



论文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

紧接着他便写到:「我昨天得知,我已经研究了几周的一个开放性问题刚刚被 Claude Opus 4.6——Anthropic 公司三周前发布的混合推理模型 —— 解决了!看来我得在某个时候重新审视我对『生成式 AI』的看法了。不仅我的猜想有了一个不错的解决方案,而且这标志着自动推理和创造性问题解决领域的巨大进步,这真是一件令人高兴的事。我会在这篇短文中简要讲述这个过程。」

此事引发了广泛关注,网友们纷纷点评,感叹新时代的到来。





这是 Hacker News 用户 Ian Danforth 给出的太长不读版本:高德纳提出一个问题,他的朋友借助 Claude 进行了 30 多次探索,在人类的仔细指导下,Claude 最终编写了一个 Python 程序,能够为所有奇数找到解。高德纳随后为该方法撰写了证明,并对 Claude 的贡献感到非常满意。偶数情况仍是未解之谜(Claude 在这方面未能取得太大进展)。



困扰算法泰斗的图论难题

高德纳在为《计算机程序设计艺术》未来卷撰写关于有向哈密顿环的内容时,遇到了一个棘手的开放性问题。

具体而言,需要考虑一个具有 m³ 个顶点的有向图,顶点坐标记为 ijk,其中 0≦ i, j, k

2 的情况。

高德纳此前已经解决了 m=3 的基础情况,并将其作为书中的一道练习题。他的朋友 Filip Stappers 随后通过实验发现了 4≦ m≦16 的解,这使得所需分解法存在的可能性极高。为了寻找通解,Stappers 将这个问题原封不动地交给了 Claude 处理。

31 步探索:AI 的解题逻辑

在交互过程中,Stappers 对 Claude 设定了严格的规则指令:

在运行完任何探测代码后,必须立即更新 plan.md 文件。在记录完成之前,绝对不允许开始下一步的探索。

Claude 采取了多种数学工具进行尝试。它最初尝试了简单的线性与二次函数,但均未奏效。接着,它尝试使用暴力深度优先搜索,最终因为搜索空间过大而放弃。随后,它引入了「2D 蛇形分析」,并准确识别出该有向图是一个带有两个生成元的凯莱图(Cayley digraph)。

问题的突破发生在后半程的探索中:

在第 15 次探索时,Claude 引入了「纤维分解」框架,将问题转化为在坐标上选择算子的排列组合。在第 25 次探索后,它自主得出结论,认为模拟退火算法虽然能找到解,却无法给出通用构造,此时需要纯粹的数学推导。最终在第 31 次探索时,Claude 注意到每个纤维的选择仅依赖于单个坐标,并据此给出了一个具体的 Python 构造程序,成功得出了 m=3, 5, 7, 9, 11 的完美分解方案。



简化版的 Python 程序,用 C 语言形式写的

严谨的数学证明与偶数域的挑战

得出构造代码仅仅是第一步。Stappers 验证了 3 到 101 之间所有奇数 m 的情况,均获得了完美的分解方案。随后,高德纳接手进行了严谨的数学证明。他详细推导了生成的第一个环包含所有具备相同特征的 m² 个顶点,从而证实其长度确为 m³,是一个真正的哈密顿环。

高德纳进一步研究发现,在所有类似 Claude 生成逻辑的分解法中,恰好有 760 种对所有奇数 m>1 均有效的解。Claude 凭借自身推导准确找到了其中的一种。

目前,偶数 m 的情况依然悬而未决。

Claude 在探索中曾找到 m=4, 6, 8 的解,但未能发现其中的通用规律。当被要求继续攻克偶数情况时,Claude 陷入了困境,后续甚至无法正确编写探索程序。另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了处理大于 8 的偶数 m 的代码,并在高达 m=2000 的规模下测试成功。但由于其模式过于复杂,目前人工证明其正确性的难度极大。

在 Hacker News 和 Reddit 等技术社区中,开发者们普遍认为这次事件的核心意义在于,AI 在数学辅助证明中展现出了自主更换探索工具、排查无效路径的能力。

正如高德纳在文末所感叹的那样,克劳德・香农(Claude Shannon)在天之灵若能知晓他的名字与此类进步联系在一起,定会感到骄傲。

Hats off to Claude!

AI 进军数学殿堂:从竞赛夺金到前沿探索

高德纳的惊叹并非孤例。事实上,在过去的一年多时间里, AI 在解决复杂数学和逻辑问题上已经取得了多个具有实质性意义的突破。

国际奥数突破:2025 年 7 月,Google DeepMind 发布的 Gemini(Deep Think 模式)在 IMO 试题评测中达到金牌标准成绩,取得 35 分,并能在接近正式考试条件下输出完整自然语言证明。与此同时,OpenAI 也披露其内部模型达到了类似水平,但最新认证与评测细节相对有限。编程竞赛能力跃升:2025 年 9 月,OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平,能够在严格时间限制内解决高难度算法问题。不过,这些成绩主要来自平行测试或基准评估,并非以正式参赛身份在 International Collegiate Programming Contest 中获得最新金牌。从解题到科研协作:如今,AI 在科研中的角色显著增强。模型开始借助外部工具参与数学研究与问题验证,在复杂猜想与定理探索中发挥辅助作用。例如, GPT-5.2 借助外部工具,协助数学家解决了数个悬而未决的 Erdős 猜想,并得到了著名数学家陶哲轩的验证。部分系统已展示出生成研究草稿与进行结构化推理的能力。

驱动这些突破的核心机制也发生了改变。 AI 开始减少对单次快速生成的依赖。现在的模型普遍采用「测试时计算扩展」或「慢思考」策略。通过在推理阶段投入更多算力,模型能够并行探索多条解题路径并进行严格的自我验证。

展望未来, AI 与数学的结合将突破封闭环境下的标准化考题。随着自然语言理解力与形式化逻辑的深度融合,AI 将成为数学家与工程师身边得力的合作者,帮助人类共同攻克那些停滞多年的科学难题。

来源:https://www.163.com/dy/article/KNB3HS3B0511AQHO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路
AI
DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路

新智元报道编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用tok

热心网友
03.30
阿伯丁研究团队破解AI时间推理,突破双重密码难题
科技数码
阿伯丁研究团队破解AI时间推理,突破双重密码难题

这项由阿伯丁大学和格勒诺布尔阿尔卑斯大学联合开展的研究发表于2025年,相关论文编号为arXiv:2603 19017v1。当我们使用ChatGPT或其他AI助手处理时间相关问题时,比如 "2024年

热心网友
03.30
清华大学BEAVER模型:大语言模型智能压缩与加速新方案
科技数码
清华大学BEAVER模型:大语言模型智能压缩与加速新方案

这项由清华大学、青海大学和蚂蚁集团联合进行的研究发表于2026年,有兴趣深入了解的读者可以通过论文编号arXiv:2603 19635v1查询完整论文。随着人工智能技术的飞速发展,我们的聊天机器人和

热心网友
03.30
UCL新突破:AI学会像人类一样主动培养技能与成长
科技数码
UCL新突破:AI学会像人类一样主动培养技能与成长

来自伦敦大学学院(University College London)的研究团队在2026年3月发表了一项突破性研究,该研究于arXiv平台发布,编号为arXiv:2603 18743v1,专门探讨

热心网友
03.30
Anthropic联合创始人:AI两年内将实现自我繁殖,如细胞般进化
AI
Anthropic联合创始人:AI两年内将实现自我繁殖,如细胞般进化

新智元报道编辑:倾倾【新智元导读】AI自主训练的成绩单出炉了!最强Agent 6个月进步3倍,更让人震惊的是,越聪明的AI越会作弊。同时,70多个矿工用家庭宽带训出了72B大模型,黄仁勋亲自点名。J

热心网友
03.30

最新APP

史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28

热门推荐

vivo Pad6 Pro发布:首款4K原彩屏配骁龙8,售4499元起
网络安全
vivo Pad6 Pro发布:首款4K原彩屏配骁龙8,售4499元起

3月30日消息,今晚除了手机之外,vivo还发布了全新的旗舰平板——vivo Pad6 Pro。行业首发13 2英寸4K原彩屏,分辨率3840×2160,347PPI,支持1-144Hz LTPS自

热心网友
03.30
WPS表格提取括号内容:3步掌握MID函数实战用法
电脑教程
WPS表格提取括号内容:3步掌握MID函数实战用法

WPS表格中提取括号内容有四种方法:一、单对英文小括号用FIND+MID;二、中英文括号通用需SUBSTITUTE预处理;三、多对括号取最后一对需REVERSESTRING反向查找

热心网友
03.30
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕
科技数码
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕

3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌

热心网友
03.30
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?
科技数码
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?

电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末

热心网友
03.30
美议员为何急于拉黑中国机器人却暗留后门?
科技数码
美议员为何急于拉黑中国机器人却暗留后门?

白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党

热心网友
03.30