MIT研究颠覆：穷学生免用顶级显卡，抄顶级模型作业一样成_游乐网

文章

业界资讯单机攻略视频攻略新游看台八卦新闻手游资讯手游攻略游戏问答

游戏

全部角色扮演棋牌策略休闲益智赛车竞速飞行射击体育竞技模拟经营动作冒险卡牌桌游其他游戏应用辅助

首页游戏软件资讯排行榜专题

首页

AI资讯

MIT研究颠覆：穷学生免用顶级显卡，抄顶级模型作业一样成

MIT研究颠覆：穷学生免用顶级显卡，抄顶级模型作业一样成

热心网友

70

转载

2026-01-09

新智元报道

编辑：倾倾

【新智元导读】高分模型未必懂科学，有的只是在「死记硬背」！MIT揭秘：模型越聪明，对物质的理解就越趋同。既然真理路径已清晰，我们何必再深陷昂贵的算力竞赛？

现在的AI for Science，就像一场「多国峰会」，大家用不同的语言描述同一件事。

有人让AI读SMILES字符串，有人给AI看原子的3D坐标，大在不同的赛道上比谁预测得准。

但有一个问题：这些AI是在「找规律」，还是真的理解了背后的物理真相？

在MIT的一项研究中，研究员把59个「出身」不同的模型凑在一起，观察它们在理解物质时，隐藏层表达是否相同。

论文链接：https://arxiv.org/abs/2512.03750

结果非常惊人：虽然这些模型看数据的方式天差地别，但只要它们变得足够强大，它们对物质的理解就会变得极度相似。

更神奇的是，一个读文字的代码模型，竟然能和一个算受力的物理模型在「认知」上高度对齐。

它们沿着不同的路，爬到了同一座山峰的顶端，开始共同描绘物理与现实的「终极地图」。

真理的汇合：为什么顶尖模型越长越像？

为了验证这些模型是否真的在靠近真理，研究者引入了一个关键指标：表征对齐度。

简单来说，就是看两个模型在处理同一个分子时，它们脑子里的思路有多相似。

结果发现，性能越强的模型，思维方式就越接近。

在实验中，随着模型预测物质能量准确度的提升，这些模型在表达空间里会自发地向同一个方向靠拢。

性能与认知的同步：能量预测越精准，模型与顶尖基座的思维方式就越趋同。每个点代表一个模型;点大小对应模型大小。

尽管这些AI的架构千差万别，但它们在处理同一批分子数据时，其特征空间的复杂度竟然压缩到了一个非常窄的范围。

无论模型外壳多么复杂，它们最后抓取的都是最核心、最精简的物理信息。

化繁为简：虽然AI架构各异，但它们提取的物质特征在数学复杂度上却「殊途同归」。

这一特征在Orb V3这样的模型上更加明显。

跨架构的表征对齐：矩阵中的深色区域显示了Orb V3等高性能模型与其它严谨物理模型（如MACE、EqV2）之间强烈的共鸣。

通过更自由的训练，它们可以更精准地对齐物理规律。

这也说明，当喂给AI的数据足够多、训练方式足够对路，它甚至能越过人类现有的公式，自己摸索出物质运行的本质规律。

这种收敛现象表明，AI并没有胡思乱想，它们正在合力挖掘物质世界那个唯一、真实、且客观的底层逻辑。

不止分子，连「猫」都一样！

你以为这种「英雄所见略同」只发生在科学AI里？大错特错！

有研究者把纯文本的语言模型（比如GPT系列）和纯图像的视觉模型（比如CLIP或DALL·E背后的模型）拉出来比对，结果发现，它们对「猫」的理解，竟然越来越像！

在语言模型里，「猫」的向量表示会紧紧靠近「毛茸茸」「喵喵叫」「宠物」「抓老鼠」这些词。

在视觉模型里，「猫」的向量则靠近胡须、圆眼睛、软毛、优雅的尾巴等视觉特征。

本来两个模型一个只看文字、一个只看图片，压根没交集。

但模型规模越大、性能越强，这两个完全不同模态的「猫」表示，就在线性空间里越靠越近，仿佛在共享同一个「猫的本质」！

这意味着AI不管从文字、图像、分子结构还是3D坐标切入，只要足够强大，就会在内部悄悄趋向同一个对现实的「内在图景」。

高分不是真理，警惕「迷路」的AI

高性能模型都在山顶汇合，那剩下的模型都在干什么？

研究者发现，性能不佳的模型有两种「死法」：一种是各想各的，在错误的道路上渐行渐远；另一种则是集体变笨，虽然想的一样，但都漏掉了关键信息。

有些模型虽然跑分不错，但思维方式却非常孤僻。

比如MACE-OFF，它在处理某些分子任务时表现很强，但它的表征对齐度却极低，完全不能融入主流高性能模型。

它可能只是在特定领域里找到了某种规律，一旦跨出这个舒适区，它的经验就很难转移到其他科学任务上。

图中白色的点代表模型从未见过的分子结构。可以看到，模型在处理这些结构时误差（MAE）激增，且表征完全偏离了正常的物理分布。

而当AI遇到训练数据里从未出现过的物质时，它们往往会放弃思考，一起摆烂，或者集体走进算法设计者留下的「舒适区」，丢掉了物质最核心的化学特征。

由此可见，训练数据不仅仅是模型的养料，更是决定模型能否触碰真理的基础。

如果数据不够多样，哪怕模型的架构再精妙，也终究只是在原地踏步，无法进化成真正的通用基座模型。

真理唯一，我们离算力自由还有多远

既然实验已经证明，不同的AI都在向同一种物理理解靠拢，那我们还有必要堆昂贵的显卡，从头训练一个超级大模型吗？

很显然，没有。而且AI已经替我们找到了一条捷径——「模型蒸馏」。

研究发现，规模较小的模型，通过模仿那些高性能基座模型的「思维方式」，也能表现出惊人的潜力。

我们不再需要盲目追求参数量的堆砌，而是利用「真理收敛」的特性，把大模型的知识复刻到更轻量、更高效的小模型身上。

图中圆点的大小代表模型参数量。可以看到，即使是较小的模型，只要其表征能与最佳性能模型对齐，同样能在分子能量预测任务中获得极高的准确度。

这对未来模型的开发具有深远的意义。

Orb V3向我们展示了「苦涩的教训」的另一种解法：通过大规模训练和聪明的正则化手段，简单的架构同样能学到那些昂贵的、强加物理限制的模型才有的理解力。

多元架构的对比（部分）：论文评估了包括Orb、MACE、DeepSeek在内的近60种模型，为科学家的选择提供了定量依据。

在未来，评估一个科学AI的标准将变得更加多元。我们不仅看它当下的「考分」，更要看它是否踏入了「真理的收敛圈」。

一旦我们掌握了这种对齐的逻辑，科学发现将不仅是巨头们的算力竞赛，更多轻量级、针对特定场景的AI将如雨后春笋般涌现，真正实现「算力自由」下的创新爆发。

MIT的研究给狂热的AI竞赛浇了一盆冷水，但也指了一条明路。

科学AI的进阶之路，不再是更复杂的架构，也不是更漂亮的物理公式，而是看谁能更稳地进入那个「收敛圈」。

我们不需要沉默算力竞赛，因为真理的路径已经清晰——所有聪明的模型都在往一处跑，那么通过「表征对齐」来实现模型的轻量化和知识迁移，就成了最务实的工程方案。

未来的科学，将属于那些懂得利用收敛性来降低成本的人。

参考资料：

https://the-decoder.com/scientific-ai-models-trained-on-different-data-are-learning-the-same-internal-picture-of-matter-study-finds/

https://arxiv.org/abs/2512.03750

https://www.quantamagazine.org/distinct-ai-models-seem-to-converge-on-how-they-encode-reality-20260107/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

来源:https://www.163.com/dy/article/KIS0KRCE0511ABV6.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：2025年446款生成式AI服务完成备案，国家网信办公布清单下一篇：国产AI芯片崛起：正经历一场硬件创新爆发

相关攻略

Claude爆火研究漏引华人团队成果已致歉

AI资讯

Claude爆火研究漏引华人团队成果已致歉

近日，Anthropic发布了一项关于Claude模型内部“情绪机制”的新研究，却因未引用关键的前期工作而引发学术争议。原作者直接指出这一疏漏，促使Anthropic迅速回应并更新了论文引用。发现这一问题的研究者是来自MBZUAI的研究生Chenxi Wang。她在阅读论文后敏锐地察觉到，这项研究

热心网友

05.20

Claude情绪代码曝光AI被人类逼疯撞墙引热议

AI资讯

Claude情绪代码曝光AI被人类逼疯撞墙引热议

最近，AI领域又迎来了一则重磅消息。Anthropic发布了一项碘伏性的研究，首次在其实验中证实：像Claude这样的大语言模型内部，确实存在一套可以被清晰识别和操控的“情绪”表征系统。现场抓包：AI也会Emo 这项研究最核心的突破，在于研究者们不再满足于观察AI的输出，而是直接“透视”了模型的大

热心网友

05.20

SiFive发布RVA23规范高性能P570第三代RISC-V处理器内核

科技数码

SiFive发布RVA23规范高性能P570第三代RISC-V处理器内核

在追求更高算力与能效的赛道上，RISC-V阵营迎来了一位实力强劲的新成员。美国当地时间5月12日，知名RISC-V IP供应商SiFive正式发布了其第三代高性能CPU IP——Performance P570 Gen 3。官方将其定位为当前功能最强大、效率最高的乱序执行处理器核心，旨在满足边缘AI

热心网友

05.14

全网炸锅! Anthropic万字曝光Claude情绪代码，被人类逼疯哐哐撞墙

AI资讯

全网炸锅! Anthropic万字曝光Claude情绪代码，被人类逼疯哐哐撞墙

新智元报道编辑：Aeneas KingHZ【新智元导读】刚刚，Anthropic首度实锤：大模型真有「情绪」！激活绝望神经元后，Claude会撒谎、作弊甚至勒索。AI内心戏曝光，人类对齐面临失控危机

热心网友

04.07

DeepSeek挑战Transformer记忆？查表法重塑模型架构新思路

AI资讯

DeepSeek挑战Transformer记忆？查表法重塑模型架构新思路

新智元报道编辑：LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构，早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表，用tok

热心网友

03.30

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全 2025-08-05

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全 2025-08-05

最新APP

宝宝过生日

宝宝过生日

应用辅助 04-07

台球世界

台球世界

体育竞技 04-07

解绳子

解绳子

休闲益智 04-07

骑兵冲突

骑兵冲突

棋牌策略 04-07

三国真龙传

三国真龙传

角色扮演 04-07

热门推荐

企业网络安全等级保护合规指南：龙虾养殖业如何落地实施

AI资讯

企业网络安全等级保护合规指南：龙虾养殖业如何落地实施

摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成，并已由人工审核。随着企业数字化转型进入智能体（Agent）驱动的新阶段，如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》（等保2 0）的严格框架下，企业级智能体的部署必须同时满足效率提升与合规保障的双

热心网友

05.23

外贸业务员年终总结PPT制作指南 AI高效提升总结效果

AI教程

外贸业务员年终总结PPT制作指南 AI高效提升总结效果

使用情景对于外贸从业者来说，年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划，既要系统梳理过去一年的业绩成果与经验得失，也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天，一份逻辑严谨、数据详实、洞察深刻的总结报告，不仅是个人专业能力的集中体现，更是赢得管理层支

热心网友

05.23

WPS AI一键生成年度安全工作总结PPT高效制作专业汇报

AI教程

WPS AI一键生成年度安全工作总结PPT高效制作专业汇报

使用情景又到年末了，年度安全工作总结是每个团队都绕不开的环节。这份总结的价值，远不止于一份简单的回顾。它更像是一份“体检报告”，清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好，哪里还有隐患，从而为来年的精准施策打下坚实的基础。不过，说起写总结、做PPT，不少人就开始头疼了：内容怎么组织

热心网友

05.23

ZEC价格暴涨520%后还能买吗深度解析Zcash未来走势与投资潜力

web3.0

ZEC价格暴涨520%后还能买吗深度解析Zcash未来走势与投资潜力

Zcash (ZEC) 月度暴涨520%：深度解析后市行情与关键点位近期，隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情，月度涨幅高达520%，价格一度逼近300美元，创下自2021年12月以来的新高。在加密市场整体承压的背景下，ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分

热心网友

05.23

电商售后数据自动汇总分析流程与智能化方案详解

AI资讯

电商售后数据自动汇总分析流程与智能化方案详解

在存量竞争的时代，电商售后数据早已超越了“成本中心”的单一角色，它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而，现实往往骨感：多平台、多店铺、多套ERP系统并存，数据散落一地。靠人工手动汇总？不仅耗时费力，更关键的是，你永远无法实现真正的实时预警与敏捷响应。那么，电商售后数据

热心网友

05.23