哈佛学者发布“思维压缩器”：AI推理效率提升5倍

时间：2026-01-07 17:01

来自哈佛大学、加州理工学院MIT和Hippocratic AI的研究团队在2025年11月发表了一项突破性成果，论文题目为 "ORION: Teaching Language Models to Re

来自哈佛大学、加州理工学院MIT和Hippocratic AI的研究团队在2025年11月发表了一项突破性成果，论文题目为"ORION: Teaching Language Models to Reason Efficiently in the Language of Thought"。这项研究发表在顶级会议的评审中，感兴趣的读者可以通过论文编号arXiv:2511.22891v1查询完整内容。

当前的大型语言模型就像一个思维过度活跃的学生，为了解决一道简单的数学题，它会在草稿纸上写满密密麻麻的推理过程，用上千个词来表达本来几句话就能说清楚的思路。比如回答"一个农夫有3只鸡和2头牛，它们总共有多少条腿？"这样的问题，现在的AI模型会絮絮叨叨写上300多个词，反复验算、自我纠错，就像一个缺乏自信的学生在考试时不断检查答案。

这种"话痨式"推理带来了严重的问题。首先是速度慢得让人抓狂，用户等待AI回答一个简单问题可能需要好几秒钟，因为系统在后台生成了大量冗余的思考文字。其次是成本高昂，每多生成一个词就意味着更多的计算资源消耗，就像出租车按里程计费一样，绕远路的代价最终都要用户买单。更重要的是，这种冗长的推理过程往往充满矛盾和错误，就像一个人自言自语时越说越糊涂。

研究团队受到了一个有趣的心理学理论启发——"思维语言假说"。这个理论认为，人类大脑进行复杂思考时并不是用我们平时说话的自然语言，而是用一种更加简洁、符号化的"内在语言"，就像程序员写代码时使用的简洁命令一样。当你心算"8+5"时，大脑并不会默念"八加上五等于十三"这样的完整句子，而是用某种更直接的符号运算。

基于这个洞察，研究团队开发了一套名为"Mentalese"（心智语言）的压缩推理系统。这就像给AI安装了一个"思维压缩器"，让它学会用最简洁的符号来表达推理过程。原本需要300个词的农夫数腿问题，在新系统中只需要10个词就能搞定："鸡2腿，牛4腿...3×2+2×4=14"。

然而，仅仅让AI学会简洁表达还不够，研究团队面临一个关键挑战：如何在保持简洁的同时不损失推理的准确性？这就像要求一个健谈的人突然变得惜字如金，初期肯定会出现表达不清、遗漏要点的问题。

为了解决这个难题，研究团队设计了一种巧妙的训练方法，叫做"短优偏好优化"（SLPO）。这种方法的核心思路类似于一个明智的老师评判学生作业：如果两份作业都答对了，那么表达更简洁的那份会得到更高的分数；但如果只有冗长的那份答对了，老师绝不会因为它太啰嗦就给低分。

这种训练策略的精妙之处在于它的自适应性。面对简单问题时，系统会倾向于用最简洁的方式表达；但遇到复杂问题时，系统不会被强制压缩，而是允许使用更多的推理步骤。这就像一个经验丰富的医生，看感冒时几分钟就能下诊断，但面对疑难杂症时会进行详细的检查和分析。

研究团队的训练过程分为两个阶段，就像培养一个高效思考者的完整流程。第一阶段是"符号化学习"，让AI系统熟悉这种简洁的表达方式，就像教孩子学会用数学符号而不是文字来表达数学概念。第二阶段是"强化优化"，通过奖励机制让AI在保持准确性的前提下追求表达的简洁性。

实验结果令人印象深刻。在数学推理任务上，新开发的ORION模型实现了4到16倍的文字压缩比，推理速度提升了5倍，训练成本降低了7到9倍。更重要的是，准确率只下降了2到10个百分点，这在工程实践中是完全可以接受的代价。

以AIME数学竞赛为例，原本的DeepSeek R1模型需要平均7481个词来解答一道题目，而ORION模型只需要184个词就能达到相近的正确率。这种压缩不是简单的删减，而是真正提取了推理的本质，去除了冗余和噪音。

研究团队还与最先进的商业模型进行了对比测试。令人惊讶的是，他们只有15亿参数的ORION模型，在保持2倍压缩率的情况下，准确率竟然比GPT-4o和Claude-3.5这样的大型模型还要高出5%。这就像一台小巧的跑车在燃油经济性和速度上同时击败了大型SUV。

这项技术的应用前景非常广阔。在实时对话系统中，用户不再需要等待AI冗长的"思考"过程，可以获得几乎即时的智能回复。在教育领域，AI辅导系统可以提供更加清晰、直接的解题思路，而不是让学生被冗长的推理过程搞得更加困惑。在专业咨询服务中，AI可以快速给出要点明确的建议，提高工作效率。

不过，这项技术也存在一些局限性。研究团队发现，过度的压缩训练可能导致AI在面对真正复杂问题时推理深度不够。此外，当给AI设置了过长的生成限制时，它有时会"退化"回原来冗长的推理模式，就像一个已经养成简洁习惯的人在压力下又开始啰嗦。

从技术发展的角度看，这项研究代表了AI领域一个重要的范式转变：从追求"更多"转向追求"更好"。过去几年，AI的发展主要依赖于增加模型规模和数据量，但这种方式面临着成本和效率的双重压力。ORION模型证明了，通过改进算法和训练方法，可以用更小的模型达到更好的效果。

这种技术进步对整个AI产业的意义重大。它降低了部署智能系统的门槛，让更多中小企业能够承担AI应用的成本。同时，它也为AI在移动设备和边缘计算场景中的应用打开了新的可能性，因为压缩后的模型需要更少的计算资源和存储空间。

研究团队还开源了包含4万个数学问题的"MentaleseR-40k"数据集，为其他研究者提供了宝贵的资源。这个数据集中的每个问题都被转换成了简洁的符号化推理形式，就像为AI研究社区提供了一本"高效思维"的教科书。

展望未来，这项技术有可能催生新一代的AI助手，它们不仅更快、更省资源，还能提供更加清晰和直观的推理过程。这对于需要AI解释其决策过程的关键应用场景特别重要，比如医疗诊断、法律分析或金融投资建议。

说到底，这项研究的最大价值在于它改变了我们对AI推理的理解。它证明了智能不在于话说得多，而在于思考得准。就像古人说的"言简意赅"，真正的智慧往往体现在用最少的话表达最深刻的思想。ORION模型让AI向着这个方向迈出了重要一步，为未来更加高效、实用的人工智能系统奠定了基础。这不仅是技术的进步，更是AI向人类思维模式学习的一次成功尝试。

Q&A

Q1：Mentalese心智语言是什么？

A：Mentalese是研究团队开发的一种压缩推理语言，类似于数学公式那样用符号化的方式表达思维过程。它让AI不再用冗长的自然语言进行推理，而是用简洁的符号命令，比如用"SET:w;EQ:abs(180-5.5*w)=110"这样的格式来解决数学问题，从而大幅减少不必要的文字。

Q2：ORION模型的推理压缩技术会影响准确率吗？

A：会有一定影响，但在可接受范围内。ORION模型虽然将推理文字压缩了4到16倍，但准确率只下降了2到10个百分点。更重要的是，在某些测试中，ORION模型甚至比GPT-4o和Claude这样的大型模型准确率还要高出5%，证明简洁推理不等于推理能力降低。

Q3：短优偏好优化SLPO训练方法有什么特别之处？

A：SLPO的特别之处在于它不会盲目追求简洁而牺牲准确性。就像一个明智的老师，如果学生的两份作业都答对了，它会奖励更简洁的那份；但如果只有详细的作业答对了，它绝不会因为篇幅长而给低分。这种智能化的奖励机制让AI学会了在保证正确性的前提下追求表达效率。

来源：https://www.163.com/dy/article/KIMC7V4F0511DTVV.html

推理数学算法符号化哈佛大学思维压缩器

上一篇工信部推动工业互联网平台加快低代码人工智能创新 下一篇市场监管总局：规范数字人直播监管，防范虚假信息传播风险

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

OpenClaw手机App上线，结果翻车了

OpenClaw 官方宣布，已正式推出 iOS 和 Android 原生移动 App，用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接：把 Agent 放进口袋里，让用户可以在移动端处理频道消息、任务和回复。从功能上看，OpenClaw 移动端并

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5