首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
LeCun批评Hinton认可大语言模型是为退休找借口

LeCun批评Hinton认可大语言模型是为退休找借口

热心网友
97
转载
2026-05-19

近日,图灵奖得主、人工智能先驱杨立昆(Yann LeCun)在一场深度播客访谈中,系统阐述了他对下一代人工智能发展的独到见解。在这场信息量密集的对话中,他不仅重申了对“世界模型”与JEPA架构的坚定信念,更对当前以大语言模型(LLM)为主导的技术路线提出了根本性质疑,并分享了离开Meta、创立AMI(先进机器智能公司)背后的思考,以及与杰弗里·辛顿(Geoffrey Hinton)、约书亚·本吉奥(Yoshua Bengio)等AI领军人物观点分歧的根源。

大语言模型(LLM)为何不是通向通用人工智能(AGI)的路径

访谈从LeCun新创立的AMI公司开始。主持人指出,这与他当年押注神经网络时的情景相似——再次站在了主流趋势的对立面。LeCun首先澄清,他并非否定LLM的价值与实用性。LLM是许多优秀AI产品的基础,在处理语言任务上表现出色。然而,他尖锐地指出:“LLM并非通向人类水平智能,甚至动物水平智能的正确路径。”

他认为,语言是一种特殊、离散的信号,而现实世界是高维、连续、充满噪声和不确定性的。LLM擅长处理前者,却难以应对后者的复杂物理交互。AMI的目标正是开发能够理解并适应真实物理世界的AI,例如真正的家用服务机器人或L5级全自动驾驶系统。而Meta在全面投入LLM竞赛后,已不再是推进这类探索性基础研究的理想环境。

通往高级智能的关键:世界模型

那么,什么才是实现更高级智能的正确方向?LeCun的答案是构建“世界模型”。这个概念近来虽成热词,但LeCun对其有严格定义。

“本质上,世界模型让一个智能体能够预测自身行为将导致何种后果。”他解释道,“你无法想象一个不具备这种能力的智能系统。如果人类行动前不考虑后果,我们会被视为愚蠢。”拥有预测能力后,智能体便能通过规划、推理和搜索一系列行动来达成目标,而非像LLM那样仅通过自回归预测下一个词元(token)。因此,真正的智能行为需要三大支柱:预测行为后果的能力、通过优化进行规划的能力,以及一个能在抽象层面(而非像素级)进行预测的模型。这正是当前LLM所缺失的核心能力。

实现世界模型的架构:JEPA

如何构建这样的世界模型?LeCun提出了“联合嵌入预测架构”(JEPA)。这一架构的灵感部分源于认知科学中“系统二”的慢思考过程,但更关键的是来自实证研究的启发。

大约五年前,LeCun意识到,所有成功学习了优秀图像和视频表征的架构都是非生成式的。像变分自编码器(VAE)或去噪自编码器这类试图精确重建原始输入的方法效果有限。JEPA则另辟蹊径:它使用两个编码器分别处理原始图像及其经过“破坏”(如遮挡、噪声)的版本,然后训练一个预测器,从后者的抽象表征去预测前者的表征。这种方法放弃了对像素的精确复原,转而学习数据中更本质的抽象关系与潜在结构,为理解世界提供了更高效的框架。

当前具身智能与机器人技术的根本瓶颈

谈及当前火热的机器人领域,LeCun承认那些展示复杂操作的演示令人印象深刻,但他指出了根本性瓶颈:数据效率低下。

现有系统大多依赖模仿学习,需要为每一个新任务收集海量的演示数据,成本高昂且泛化能力弱。而一个拥有世界模型的系统,则有望实现“零样本”学习——面对全新任务,无需专门训练即可通过内部模拟和规划找到解决方案。他以学车为例:“一个青少年只需几十小时就能学会开车。而我们拥有数百万小时的驾驶数据,却仍未实现L5自动驾驶。这恰恰说明,依赖海量数据的模仿学习,连‘开车’这单一任务都未能彻底解决。”

行业现状:硅谷的“羊群效应”与创新惯性

既然新架构前景广阔,为何整个行业仍扎堆于LLM?LeCun将其归因于商业惯性与“羊群效应”。“如果你是OpenAI,你知道继续扩大模型和数据规模就能持续提升效果,从商业角度看,确实缺乏足够动力去探索数据效率更高的路径。”他分析道,“而其他公司也承受不起落后的代价。于是所有人都在深挖同一条战壕。”这正是他将AMI总部设在巴黎、美国办公室设在纽约而非硅谷的原因之一——为了保持独立思考、远离技术同质化的压力。

对于JEPA的发展时间表,他给出了一个大胆预测:“五年内,JEPA类的世界模型将占据主导地位。”他笑着补充这引用了林纳斯·托瓦兹(Linus Torvalds)关于Linux的豪言。但他坚信,JEPA代表了未来智能系统的蓝图,而LLM最终将主要作为语言接口存在。“到2027年初,这一点对所有人都会变得显而易见。”

构建开放生态:Tapestry项目

除了AMI,LeCun还在推动名为“Tapestry”的开放AI模型平台项目。他观察到,随着AI助手普及,全球信息获取可能被少数几家大公司的AI系统所中介,这对中美之外的国家和多样化的语言文化群体不利。

Tapestry旨在构建一个全球协作的开源AI平台,思路类似联邦学习:全球贡献者提供数据与算力,共同训练一个全局共识模型,作为全球知识与文化的数字存储库。参与者无需共享原始数据,只需交换模型参数。最终,任何人都可以基于这个开放的“基座模型”,针对特定语言和文化进行微调。LeCun相信,正如Linux最终成为互联网基础设施的基石,开源与开放协作的力量将在AI领域再次胜出。

历史类比:OpenAI会成为下一个Sun Microsystems吗?

“还记得1996年互联网基础设施的主要玩家吗?是Sun Microsystems、HP、Dell。”LeCun抛出一个历史类比,“那时的Unix系统比Windows可靠得多。但现在呢?整个互联网都运行在Linux上。”他断言,“今天的OpenAI、Anthropic,就像是昨天的Sun和HP-UX。”

这一判断基于他对LLM能力上限的评估。他认为,高质量公开文本数据即将耗尽,闭源模型通过私有数据和合成数据建立的壁垒,终将被开源社区跨越。LLM在数学和代码上的优异表现,恰恰因为语言本身就是这些领域推理的载体。但它缺乏真正的创造性,无法进行概念创新或复杂的系统设计。“它改变的是人类的角色——我们负责决定‘建造什么’,而具体的建造过程可以由LLM辅助完成。”

那么,LLM需要做到什么才能改变他的看法?答案是:实现零样本的智能体行为。即面对一个从未训练过的新任务,能自主理解、规划并完成。“除非这个系统具备预测行为后果并据此规划的能力,否则不可能实现。”而这正是JEPA架构旨在解决的核心问题。

与Hinton和Bengio的分歧根源

谈及与另两位图灵奖得主的分歧,LeCun直言:“不是我改变了主意,是他们的观点发生了变化。”

他回忆,Hinton在GPT-4发布后仿佛经历“顿悟”,认为这些系统已接近人类智能,甚至可能拥有主观体验。LeCun推测,Hinton可能进行了一种粗略的估算,比较了大脑皮层神经元数量与实现反向传播所需的“等效神经元”数量,得出了GPT-4已接近阈值的结论。“我完全不认同这个说法。”LeCun坦言,“我感觉他有点想‘宣布胜利,然后退休’的意味。”不过他也注意到,Hinton近来关于AI危险性的论调已有所缓和。

至于Bengio,LeCun认为其担忧更多在于社会伦理层面——如何确保AI的益处被广泛共享,而非加剧社会不平等。“这并非那种AI统治世界的末日场景,更多是关于‘技术被滥用’的问题。”

LLM的安全性质疑与“目标驱动AI”

LeCun对当前LLM的安全性持根本性质疑。“LLM无法被做到完全可靠,因为你无法从根本上阻止它们产生幻觉(胡言乱语)。”在代码生成等可验证输出的领域,LLM表现尚可,但一旦涉及现实世界的复杂任务,其缺乏常识和无法预测后果的缺陷便暴露无遗。

他举了一个经典例子:当你要求LLM规划“洗车时顺便取咖啡”,它可能会建议你步行前往,完全忽略了汽车是移动工具这一基本常识。虽然LLM后续可通过针对性训练“学会”回答此问题,但这并非真正的理解,只是记忆的体现。

他提出的“目标驱动AI”架构,则试图从系统设计上保障安全。该系统拥有一个世界模型来预测行动后果,并通过优化成本函数来规划行动序列。此外,可以叠加多个目标函数和约束条件,从结构上限制系统做出危险行为。“LLM做不到这一点。它总能找到被‘提示词工程’诱导的漏洞,其训练误差与测试误差之间的鸿沟始终存在。”

离开Meta:战略转向与创新环境的变迁

在Meta任职超过十年并创立FAIR(Facebook AI Research)的LeCun,最终选择了离开。回顾过往,他认为做对的是建立了一个顶级的研究实验室和开放的科研文化。但创新链条在从研究向工程转化的环节常常出现断裂。

他描述了FAIR的演变:早期的小型创新项目(如Llama 1)成功后,公司成立了Gen AI部门进行产品化,这带来了巨大的短期业绩压力,导致团队变得保守,并与研究部门(FAIR)逐渐脱节。当Meta战略全面转向追赶LLM竞赛时,专注于探索性研究(尤其是JEPA这类与公司核心业务直接关联度不高的方向)的环境便不复存在。

“到了2024年初,尤其是2025年,FAIR已经不符合我认为保持前沿创新、进行突破性研究所需的条件了。”他总结道,“很多优秀的人才都离开了。”当主持人追问Scale AI的收购是否是Meta全面聚焦LLM的催化剂时,LeCun给出了肯定的回答,并补充了一个观察:“扎克伯格可能在亚历山大王(Alexandr Wang, Scale AI CEO)身上看到了某种接班人的影子,一个更年轻版本的自己。”

对AI研究者的建议与未来展望

对于有志于AI研究的年轻人,LeCun的建议非常直接:“如果你在读博士,别只做LLM相关研究。没有太大意义,你很难做出独特贡献。”他认为,在学术界单纯研究LLM为何有效、有何局限,属于“描述性科学”,缺乏创造性,且学术界无法提供产业界规模的算力。

他分享了自己在Meta后期的工作重心:自2016年提出世界模型的愿景后,他于2020年左右形成了JEPA的核心想法,并在2024年发表了一篇详尽的愿景论文,公开了所有想法,希望吸引更多人加入这一方向。这一策略确实在FAIR内部凝聚起一个团队。

然而,随着公司战略转向,机器人研究组被裁撤,JEPA的许多应用场景(如工业制造)并非Meta的兴趣所在,FAIR也越来越被要求去支持LLM项目。最终,他感到环境已不再适合推进这项雄心勃勃的基础研究。

整场访谈中,LeCun观点犀利,金句频出。从技术路径的争论,到行业趋势的批判,再到个人职业生涯的抉择,他勾勒出一幅与当前主流叙事截然不同的AI未来图景。其核心信息明确而坚定:LLM虽是目前成功的应用范式,但并非通往通用人工智能的终极答案;真正的智能,源于对世界因果关系的深度理解、模拟与规划。这场关于AI发展方向的“一个人的战争”,他显然已做好了长期探索与奋斗的准备。

来源:https://36kr.com/p/3814630505422597
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

统信UOS关闭开机磁盘自检与跳过扫描方法
系统平台
统信UOS关闭开机磁盘自检与跳过扫描方法

统信UOS开机卡在磁盘扫描界面怎么办?许多用户都遇到过启动时长时间停留在“Checking filesystem…”或fsck阶段的困扰。这通常并非UOS系统本身的问题,而是由于异常关机导致根分区被标记、双系统环境下的兼容性冲突,或文件系统配置不当所引发。本文将提供一套完整的解决方案,帮助您快速跳过

热心网友
05.18
Safari浏览器开启不跟踪功能详细步骤
iphone
Safari浏览器开启不跟踪功能详细步骤

在Safari浏览器中启用“不跟踪”功能,可向广告商表明用户不希望被追踪。iPhone iPad用户需在设置中开启该选项,Mac用户需在偏好设置的“隐私”标签中勾选。此外,阻止Cookie和定期清理缓存也能减少追踪并提升性能。

热心网友
05.18
四种最佳方法帮你找回忘记的Wi-Fi密码
iphone
四种最佳方法帮你找回忘记的Wi-Fi密码

忘记Wi-Fi密码时,可通过不同设备找回。iPhone或iPad需借助电脑端专业工具扫描并导出密码。安卓设备可利用ES文件浏览器访问系统文件查看。Windows电脑在网络设置的无线属性中勾选显示字符即可。Mac电脑则通过系统自带的钥匙串访问应用查看已保存密码。

热心网友
05.18
归环契约使灵系统玩法攻略 新手入门指南
游戏资讯
归环契约使灵系统玩法攻略 新手入门指南

在《归环契约》的奇幻旅程中,一支精心打造的使灵队伍是每位冒险者探索世界的核心资本。掌握从组建到培养,再到实战部署的全流程策略,是提升游戏体验与战斗效率的关键。本文将系统性地为你解析使灵的获取途径、深度培养方案以及高效的阵容搭配艺术。 使灵获取:多渠道构建你的核心班底 打造强力阵容的第一步,在于如何高

热心网友
05.18
2026北京车展iCAR V23白武士版与ROBOX概念车亮相
AI
2026北京车展iCAR V23白武士版与ROBOX概念车亮相

2026北京国际车展的聚光灯下,iCAR品牌的两款新车无疑是展台焦点。一款是彰显个性态度的定制之作,另一款则揭示了品牌未来量产车型的设计与技术方向,共同勾勒出iCAR在新能源与智能化浪潮下的独特思考。 首先吸引目光的,是这台iCAR V23白武士版。需要明确的是,它目前是一款定制展示车型,旨在为个性

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026年新手Vlog相机选购指南 五大机型满足旅行美妆日常拍摄
业界动态
2026年新手Vlog相机选购指南 五大机型满足旅行美妆日常拍摄

刚接触Vlog创作,挑选设备是不是比拍摄本身更让人头疼?既渴望手机般的轻便易携,又向往相机的卓越画质;期待操作简单、直出好看,还要求性能稳定、避免画面模糊——这些心声,你是否也感同身受? 别担心,今天我们抛开复杂的参数,从最实用的角度切入——综合考量画质表现、防抖性能、对焦速度以及人像直出效果这些核

热心网友
05.19
维信诺投资50亿扩产穿戴显示屏全球份额占四分之一
业界动态
维信诺投资50亿扩产穿戴显示屏全球份额占四分之一

2026年4月28日,显示技术领域迎来重要进展:维信诺总投资额高达50亿元的昆山全球新型显示产业创新中心,顺利完成主厂房封顶。这一项目不仅是维信诺“2+3+X”发展战略的核心组成部分,更是其布局下一代显示技术、构筑长期竞争优势的关键举措。 该项目于2025年正式签约落地,此次主体结构封顶标志着项目建

热心网友
05.19
影石创新2026年Q1财报:营收24.81亿元同比增长83%
业界动态
影石创新2026年Q1财报:营收24.81亿元同比增长83%

4月28日,影石创新(Insta360)发布了2025年度及2026年第一季度财报,业绩表现极为亮眼,实现强势开门红。数据显示,公司2025年全年营收高达97 41亿元,同比大幅增长74 76%;2026年第一季度营收延续高增长态势,达到24 81亿元,同比增长83 11%。纵观近三年发展,影石创新

热心网友
05.19
一加Ace 6至尊版正式发布 首发价格3499元起
业界动态
一加Ace 6至尊版正式发布 首发价格3499元起

备受期待的一加 Ace 6 至尊版于今日正式发布。这款性能旗舰不仅搭载了顶级的天玑 9500 处理器,更创新性地推出了可搭配使用的“枪神游戏手柄”专属外设,为移动游戏体验带来全新可能。新机起售价为 3499 元,极具市场竞争力。 一加 Ace 6 至尊版提供了“王牌觉醒”与“金属风暴”两款潮流配色。

热心网友
05.19
一加Ace 6至尊版GPU性能解析 手机游戏体验媲美主机
业界动态
一加Ace 6至尊版GPU性能解析 手机游戏体验媲美主机

备受期待的一加Ace 6至尊版于今晚正式发布。这款性能旗舰的核心亮点,无疑是搭载了联发科当前顶级的旗舰处理器——天玑9500。该芯片在制程工艺与能效表现上的全面升级,为手机的整体流畅体验奠定了坚实的硬件基础。 天玑9500率先采用了台积电先进的第三代3纳米制程,并创新性地采用了全大核CPU架构设计。

热心网友
05.19