首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
科学家发现隐空间推理范式:AI无需思考过程,推理速度提升30倍

科学家发现隐空间推理范式:AI无需思考过程,推理速度提升30倍

热心网友
14
转载
2026-03-15

AI 终于会心算了,这不是它在偷懒,而是科学家发现了一种新的推理范式。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在过去几年里,大模型的推理几乎都依赖思维链(CoT,Chain-of-Thought):模型需要把推理一步步写出来,再给出最终答案。这种方式在很多任务中非常有效,但在科学问题中,它也许并不是最自然的计算路径。

在最近的一项研究中,科学家提出了一种新的范式:让模型在连续隐空间中完成推理,再输出文字回答。

简单来理解这项研究:传统的 AI 做化学题需要输出所有思考过程,这就像必须每个步骤都大声念出来再向下一步推进,不仅费时费力还不一定准确;现在 LatentChem 让 AI 可以像化学家那样先“默想”,在内部完成复杂计算后再直接给答案。

在化学任务中,这种方式尤为重要。做过分子优化、分子编辑等任务的研究人员,应该都遇到过这样的场景:模型能写出一长段看似专业的推理过程,谈电子效应、位阻、官能团和反应位点,但最终生成的 SMILES 或分子结构却和前文分析不一致,甚至连修改位置都错了。

这类问题背后,其实指向了一个更根本的矛盾:化学推理未必天然适合被“翻译”成离散的自然语言 token。

来自 Haven 团队的叶新武、尹臻菲、廖雨萱、唐相儒联合斯坦福大学丛乐教授、吴英成博士、吴方博士等研究团队设计了 LatentChem 系统,针对这一问题进行了全新探索。


图丨叶新武(来源:受访者)

它并不否定推理,也不是简单地压制模型输出思维链,而是换了一种实现路径:将推理的主要载体从显式文本 CoT 转移到连续隐空间中。也就是说,模型会先在隐空间中完成多步计算,再生成最终回答。

这类似于化学家的“默想”过程,例如,化学家在脑海中思考三维分子结构时,并不会把每一步推理都用语言表达出来,而是在形成完整判断后再将结果呈现出来。

更有意思的是,在结果导向的强化学习训练中,模型会主动减少甚至停止输出显式 CoT,只保留极短的过渡符号后直接给出答案。但这并不意味着模型不再思考,恰恰相反,推理并未消失,而是被内化到了隐空间中。

“我们只是训练让它正确地回答,并不是在训练目标中让它做这件事,结果模型会自发地选择在隐空间中进行主要思考。需要大量推理的任务对 token 需求量非常高,而将 token 放到隐空间中的设计,会大大提高效率。”叶新武对 DeepTech 表示。

结果显示,在分子优化任务中,LatentChem 的成功率比“写出”CoT 的 AI 高 59.88%。此外,由于省去了输出时间,其平均推理速度提升了 10.84 倍,甚至在分子优化和反应预测任务中快了近 30 倍。

这意味着,假如从前药物研发、材料设计等需要一年的工作,现在能够 1 个多月就能完成虚拟筛选。

近日,相关论文以《LatentChem:从文本思维链到隐空间思考的化学推理》(LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning)为题发表在预印本 arXiv[1]。


图丨相关论文(来源:arXiv)

当化学家“默想”时,AI还在“念推理链”

实际上,化学推理与自然语言存在本质区别:化学推理本质上更像是在连续、结构化的分子空间与性质空间中进行移动、聚焦和更新;而自然语言 token 是离散的、符号化的。

研究团队提出了一个尖锐的问题:用语言进行化学变化的模拟,会不会从一开始就选错了工具?他们注意到,尽管在以往的研究中已有在大模型通过隐空间思考(Latent thinking)的相关探索,但是效果甚微。他们推测,原因可能是用在了一些错误的任务上。

叶新武解释道:“例如,在分子结构空间中寻找更优候选,修改某个官能团,调整分子性质以及优化结合亲和力,这些操作本质上更接近连续空间中的结构变换。”

当用户要求模型将这些连续推理过程逐步写成文字时,就会出现这项研究中所提到的“连续性-离散化差距(Continuity-Discretization Gap)”:如果一个本来更适合在连续表征中完成的推理过程,被强行离散化成语言,不仅效率低,还可能经常出现“说得通、做不对”的现象。

也就是说,模型往往“心口不一”,尽管输出的推理过程看似合理,但最终生成的分子结构却与推理不一致。“从这个角度看,文本 CoT 更像是推理的描述,而不一定是推理真正发生的地方。”叶新武告诉 DeepTech。


图丨化学推理中连续性-离散化间隙的概念性图示(来源:arXiv)

给AI装上一个会“转弯”的化学大脑

LatentChem 的核心思路是,允许模型在输出文本形式的回复之前,先在隐空间中进行隐式的思考。

整个框架主要包含四个关键模块:ChemAdapter、Latent thinking、ChemUpdater以及 Latent Projector。

·ChemAdapter:把分子信息变成可供语言模型使用的软提示。

模型先通过分子编码器提取结构表示,再压缩成固定数量的 ChemTokens。这些 ChemTokens 会作为软提示拼接到文本指令前,为后续推理提供分子上下文。

·Latent thinking:用连续 latent states 承载多步推理。

不同于逐 token 生成文本 CoT,LatentChem 会在隐空间中生成一系列 latent thought 向量,这些向量构成了模型真正执行中间推理的主要轨迹。

·ChemUpdater:推理过程中反复“再看一眼分子”。

该研究的一个关键设计在于,每一步 latent thought 都可以通过 ChemUpdater 的 cross-attention 机制,递归地更新 ChemTokens。这意味着模型在多步推理过程中,不是一次性读入分子后就“闭门思考”,而是可以不断回看分子表示,并动态聚焦到不同的子结构或关键信息上。

叶新武表示:“我们把 Latent thinking 用于化学推理任务是比较关键的设计。基于这种机制可以动态更新大模型的 Chemtoken,可以将它理解为一种化学的记忆。”

·Latent Projector:把隐状态继续映射回可迭代的输入空间。

更新后的 hidden state 会经由 Latent Projector 映射回输入嵌入空间,作为下一步 latent 推理的基础,从而形成多步迭代的闭环。


(来源:arXiv)

该研究中最值得关注的观察之一,是强化学习阶段模型行为的变化。在研究人员采用的 GRPO 训练中,奖励并不看思维链写得是否完整,也不要求解释过程是否漂亮,而是只看三件事:输出格式是否正确、答案是否有效以及最终结果是否正确。

在这种纯结果导向的奖励信号下,模型逐渐形成了一种稳定模式:先进行 latent thinking,再输出一个极短的过渡符号(例如 “.” 或 “:”),然后直接给出最终答案。

这说明,一旦不再被显式鼓励去“写推理”,模型会自然倾向于把主要计算留在内部完成,只输出任务真正需要的最终结果。

但需要了解的是,这并不意味着模型是在“跳步”或“偷懒”,研究团队进行了进一步因果验证。他们将前 k 个 latent steps 用高斯噪声替换,结果模型性能随噪声注入步数增加而单调下降。这表明,latent states 确实承载了关键推理信息,而不是可有可无的中间变量。


(来源:arXiv)

研究中另一个值得关注的发现是,当隐空间预算不够,模型会重新把推理“写出来”。

如果 LatentChem 的本质只是“禁止输出 CoT”,那模型无论在什么条件下都不该再写长推理。但研究人员观察到的现象恰恰更微妙:当 latent thinking 的步数预算被压缩得很低时,模型会重新启用显式 CoT。例如,当 latent step 数量少于约 6 步时,模型更明显地开始输出文字化推理,以弥补内部计算容量不足。

这说明,LatentChem 学到的并不是一个固定的铁律,而是一种类似“液压补偿”的动态分配机制(Hydraulic Trade-off):当 latent 预算充足时,主要推理留在隐空间完成,输出更短、更快;而当 latent 预算不足时,模型则会把部分推理过程“外显”为文本,以帮助完成任务。

因此,LatentChem 的关键意义不是让模型不写 CoT,而在于证明:显式 CoT 只是推理的一种外化形式,而不是推理本身唯一的实现方式。


图丨预算压力测试(来源:arXiv)

推理更快也更准:速度最高提升近30倍

在多个化学任务 benchmark 上,LatentChem 同时展现出更好的性能和更高的推理效率。

以 ChemCoTBench 为例,相比强 CoT 基线,LatentChem 取得了 59.88% 的非平局胜率优势,同时平均推理速度达到 10.84 倍加速。值得关注的是,在具有挑战性的阿尔茨海默病关键靶点(GSK3-β)的虚拟药物筛选任务中,LatentChem 的成功率达到 82%,相较于显式 CoT 的 67%,提升效果显著。

在更广泛的基准测试中,LatentChem 也表现出稳定优势,具体表现为:ChemCoTBench表达为59.88%,ChEBI-20则实现了85.26%,ChemLLMBench 达到 55.58%,而 Mol-Instructions 的基本持平达到 49.88%。


表丨化学基准测试的主要结果(来源:arXiv)

推理效率方面, LatentChem 将大量文本 token 推理,压缩为更紧凑的 latent steps,整体实现了 5.4 到 29.9 倍推理加速,打破了以往“思考越深、速度越慢”的认知。对于需要探索巨大化学空间的任务来说,这种效率提升意味着: AI 可以在更短时间内搜索更多候选分子。


(来源:arXiv)

AI科学家的“直觉”时代或正在到来

LatentChem 的意义不仅仅是一个新的化学模型,它更像是 AI 科学家系统的一块关键组件,为打破 CoT 推理范式、推动其向新方向发展提供了可行路径。

由于目前的系统未加任何限制,模型可能并非表现最优。未来,通过设计专用的方法,有望让它效率更高,以及在隐空间中思考和显式 CoT 之间的切换更准确。

目前,研究团队正在构建能够自动执行科学工作流的 AI 系统,包括:分子设计、文献分析、实验规划、假设生成以及结果验证。在这些复杂任务中,推理往往发生在结构化的连续空间,而不是自然语言中。

据介绍,LatentChem 最直接的应用是在制药领域,未来有望进一步拓展至材料设计、蛋白质折叠、气候模拟等领域。此外,他们还将进一步探索该技术范式的优化空间。

当然,这种“黑箱”式的推理也具有一定局限性。例如,当模型具体的思考推理过程不可见,对于需要严谨论证以及需要可解释性的科研场景来说,仍需要进一步权衡。

但 LatentChem 提出了一个值得思考的问题:显式 CoT 是否只是推理的一种外化形式,而不是推理本身?

该系统所展示的并不是“去掉推理”,而是把推理从文本表面,收回到模型内部。未来的 AI 科学家,或许不会把每一步思考写出来,但它们仍然在持续推理、探索和发现,只是这些推理发生在隐空间中。

LatentChem 为未来的 AI 设计展示了一种“双系统”新方向:一个高效的直觉系统,让 AI 在隐空间中完成科学推理,一个可解释的语言输出系统用于与人类沟通,有可能重塑科学发现的 AI 底层逻辑。

参考资料:

1.相关论文:https://arxiv.org/pdf/2602.07075

2.代码链接:https://github.com/xinwuye/LatentChem

来源:https://www.163.com/dy/article/KO33NL0805119734.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步
科技数码
EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步

这项由瑞士洛桑联邦理工学院(EPFL)、意大利卢加诺大学(USI)、韦斯利安大学、巴黎脑研究所(ICM)以及宾夕法尼亚州立大学联合开展的研究,以预印本形式发布于2026年4月,论文编号为arXiv:2604 03480。对这一交叉领域感兴趣的读者,可以通过该编号在arXiv平台上查阅完整原文。 一、

热心网友
04.22
摩尔线程完成智谱GLM-5.1适配
科技数码
摩尔线程完成智谱GLM-5.1适配

北京商报讯(记者 陶凤 王天逸) 人工智能领域又传来一条振奋人心的消息。4月8日,摩尔线程正式宣布,其旗舰级AI训推一体全功能GPU——MTT S5000,已经成功完成了对智谱新一代旗舰模型GLM-5 1的Day-0极速适配。这意味着,推理部署与训练复现的全部流程,现在都能在这条国产算力路径上获得支

热心网友
04.15
如何利用SQL进行推理
数据库
如何利用SQL进行推理

如何用SQL求解逻辑推理题:经典楼层分配谜题实战 今天我们来探讨一个非常有趣的技术应用:使用SQL来求解逻辑推理题。这听起来或许有些大材小用,但正是这种跨界应用,充分展现了SQL语言的强大灵活性以及开发者分析问题的思维能力。我们将以一个经典的五人楼层分配谜题作为案例,逐步拆解如何用纯粹的SQL找到答

热心网友
04.14
AI看图能力真伪探秘:它是否真是编出来的?
科技数码
AI看图能力真伪探秘:它是否真是编出来的?

一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回

热心网友
04.01
智谱CEO张鹏:追求推理极限,推动长效AI发展
科技数码
智谱CEO张鹏:追求推理极限,推动长效AI发展

雷递网 乐天 3月31日智谱CEO张鹏今日在智谱2025年年报沟通会上表示,智谱曾经历过质疑,经历过挫折,但无数事实反复验证了一个判断——智能上界的提升,是大模型AGI时代唯一的 "第一性 "。张鹏说,

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

66岁老制作人官宣“最后一作”!网友纷纷致敬惋惜
游戏评测
66岁老制作人官宣“最后一作”!网友纷纷致敬惋惜

一位传奇制作人的“最后一舞” 今天,游戏界一位耕耘了四十载的老兵,彼得·莫利纽兹,在社交平台上揭晓了他的“收官之作”——《阿尔比恩之主》。 争议与影响力并存的设计师 彼得·莫利纽兹这个名字,在英国乃至全球游戏史上,都意味着创新与争议的交织。他无疑是业界最具话题性、同时也最具影响力的设计师之一。 故事

热心网友
04.23
《识质存在》御三家画面对比:Switch2版也很能打!
游戏评测
《识质存在》御三家画面对比:Switch2版也很能打!

《识质存在》多平台画面对比:Switch 2的“巧劲”与“妥协” 抽5套《识质存在》steam激活码+北通鲲鹏70旗舰手柄 一场跨越平台的视觉较量 最近,油管上那个以“数毛”闻名的游戏测评频道ElAnalistaDeBits,发布了一则备受关注的对比视频。主角是谁?正是卡普空的新作《识质存在》。视频

热心网友
04.23
马斯克与狗狗币,一场玩笑引发的加密狂欢
web3.0
马斯克与狗狗币,一场玩笑引发的加密狂欢

当埃隆·马斯克敲下“Doge” 你猜怎么着?有时候,撬动数十亿美元市值,只需要一个简单的单词或表情包。当埃隆·马斯克在推特上敲出“Doge”或者发布那只柴犬的魔性表情时,一场围绕狗狗币的狂欢或震荡,往往就此拉开序幕。这个最初源于网络玩笑的加密货币,早已找到了它最重量级的“代言人”。马斯克的影响力,在

热心网友
04.23
《识质存在》小萝莉声优曝光:是个黑人妹子!
游戏评测
《识质存在》小萝莉声优曝光:是个黑人妹子!

《识质存在》好评如潮,配音阵容引关注 卡普空的新作《识质存在》最近正式发售了。市场反响相当热烈,目前本作在Steam平台上的总体好评率高达97%,开局堪称惊艳。 游戏热度之下,配音演员们也纷纷加入庆祝行列。男主角“休”的配音演员发文庆贺时,特别提到了为游戏中可爱角色“戴安娜”配音的演员——Grace

热心网友
04.23
反差拉满!祖国人竟是PS玩家 早年PS游戏广告被扒
游戏评测
反差拉满!祖国人竟是PS玩家 早年PS游戏广告被扒

从青涩玩家到经典反派:祖国人扮演者的形象蜕变 最近,社交媒体上流传的一段视频挺有意思。那是祖国人扮演者早年拍摄的一则Playstation广告,画面里的他一脸青涩,和如今那个深入人心的经典反派形象,简直判若两人。这种强烈的对比,恰恰印证了一个事实:祖国人这个角色,已经被大众公认为影视史上最具代表性的

热心网友
04.23