首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
杨立昆最新论辩解读:大模型真懂世界吗?连猫的智能都不如

杨立昆最新论辩解读:大模型真懂世界吗?连猫的智能都不如

热心网友
80
转载
2025-12-18

大语言模型真的“理解”我们说的话吗?它们有没有意识?它们是通往通用人工智能的跳板,还是只是出色的语言模仿者?

近期,Meta 首席科学家杨立昆(Yann LeCun)与 DeepMind 高级研究科学家 Adam Brown 在纽约展开了一场对谈,试图厘清这些模糊却至关重要的边界。


(来源:Youtube)

当主持人抛出“大语言模型是否理解意义”这一难题时,Adam Brown 给出了肯定的回答,认为模型已展现出某种形式的理解力——不仅能解答复杂物理问题,还能在全新数学竞赛题中击败绝大多数人类选手。

而 LeCun 则更为谨慎。他认为模型的“理解”是表层的、统计性的,缺乏常识与因果推理能力。

他举了一个例子:一个四岁孩子通过感官与物理世界互动所获得的信息量,与最大语言模型训练所用的 30 万亿词文本相当,但前者能学会倒水、收拾餐桌,后者却连洗碗都做不到。

两人在“意识”问题上也展现出差异。Brown 认为,若当前技术持续演进,AI 未来可能具备某种形式的意识。LeCun 则强调,意识若被定义为“自我观测与目标驱动的调节能力”,那确实可被构建,但当下系统远未达到。

尽管观点有所不同,两位科学家都认同:如今的大语言模型已展现出惊人能力,但其路径存在天花板。LeCun 认为若将全部资源押注于“预测下一个词”的范式,我们将错失真正理解世界的 AI 架构。

他正推动如 JEPA(联合嵌入预测架构)等新方向,尝试让机器在抽象表征空间中学习物理规律与因果关系,而非仅在文本中挖掘模式。

以下为对谈内容,DeepTech 做了不改变原意的编辑:

从“受启发”到“涌现”:神经网络如何走向智能

主持人:今天,我想先从最基础的地方谈起——从技术本身开始。

先聊聊神经网络。神经网络常被说成是“模仿人类大脑”的产物,Yann,你能解释一下,这种“模仿”究竟意味着什么吗?

杨立昆(Yann LeCun):这不完全是模仿,更像是启发。这就好比飞机的发明是受鸟类启发,但飞机的机翼结构和鸟的翅膀大不相同,虽然背后的空气动力学原理相似。神经网络和大脑的关系也是如此:虽然极度简化,但底层的学习原理可能是一致的。

我们并不完全清楚大脑是如何组织和学习的,所以发明了替代方案。在神经网络中,我们通过调整模拟神经元之间连接的有效性(即“参数”)来进行学习。目前最大的神经网络拥有数千亿甚至更多的参数。

主持人:那是如何演变到今天的“深度学习”的?

杨立昆(Yann LeCun):这大概源于 80 年代。早期的单层神经网络只能处理简单任务。虽然 60 年代人们就意识到需要多层网络,但当时受限于使用了错误的神经元模型(二进制神经元)。直到 80 年代,我们引入了具有“渐进响应”特性的神经元,反向传播算法才变得可行。

这个领域曾一度被计算机科学界看衰,名声不佳。直到 2000 年代初,我们将其重命名为“深度学习”,并随着其在计算机视觉、自然语言处理等领域的惊人表现,才真正说服了世界。

主持人:Adam,你是物理学背景,从旁观者变成了参与者。是什么让你觉得 AI 值得投入?

Adam Brown:这很大程度上归功于 LeCun 等先驱证明了这条路是通的。对于物理学家来说,最迷人的是“涌现”——当你把简单的神经元连接起来,它们突然展现出了单个神经元不具备的复杂行为。

物理学家终其一生都在研究如何从简单规律中诞生丰富世界,现在的 AI 系统正是这种神经元集体的智慧结晶

快问快答:理解与意识

主持人:在深入探讨之前,我们来个快问快答。

第一:你们认为现在的 AI(大语言模型)理解我们对话的含义吗?

Adam Brown:是的。

杨立昆(Yann LeCun):算是吧(在某种很浅显的意义上)。

主持人:第二:这些 AI 有意识吗?

杨立昆(Yann LeCun):绝对没有。

Adam Brown:可能没有。

主持人:第三:它们很快会有意识吗?

Adam Brown:如果技术持续发展,我认为有一天会有,虽然很难说是什么时候。

杨立昆(Yann LeCun):如果你对“意识”的定义合适的话,会的。

主持人:最后:我们是站在世界末日的悬崖边,还是文艺复兴的前夜?

杨立昆(Yann LeCun):文艺复兴。

Adam Brown:更可能是文艺复兴。

大语言模型真的能“理解”我们吗?

主持人:让我们回到大语言模型(LLM)。Adam,它到底是什么,你能解释一下吗?

Adam Brown:简单来说,它是一种特殊的深度神经网络。它的核心任务非常单一:输入一段文本,预测下一个词是什么。即使像 ChatGPT 或 Gemini 这样复杂的模型,本质上也是通过阅读整个互联网的文本,不断被问“下一个词是什么”,猜对了奖励,猜错了惩罚。

有趣的是,当你训练它读过万亿级别的词汇后,它开始学会句法结构,甚至成为了某种意义上的对话伙伴。

杨立昆(Yann LeCun):我想补充一点。它们确实在提取某种意义,但这比人类的理解要浅显得多。人类的智能植根于对底层现实世界的认知,语言只是表达工具。而 LLM 并没有这种底层的现实认知,它们只是在通过训练数据模仿正确的回答。

一旦遇到训练数据中未曾出现的全新情境,它们就会胡说八道。从这个意义上说,它们并不真正理解世界,只是在做统计学上的匹配。

主持人:但人类不也是这样吗?我们也是通过大量语言训练,并在合适的时机说出合适的词。

杨立昆(Yann LeCun):区别在于数据量和效率。训练一个 LLM 需要大约 1014 字节的数据,相当于通过光缆阅读 50 万年的文本。

对比一下,一个四岁的孩子在醒着的 16,000 小时里,通过视觉神经接收的数据量(带宽远大于文本)与训练最大 LLM 的数据量相当。但这告诉我们:现实世界的信息比文本丰富、复杂得多。

这就是为什么我们有能通过律师考试的 AI,却造不出一个能像 10 岁孩子那样收拾餐桌的机器人,或者实现真正的 L5 级自动驾驶。我们在处理语言上依靠海量数据“作弊”了,但在理解物理世界方面,AI 连猫的智能水平都达不到。

Adam Brown:我同意样本效率(Sample Efficiency)是个大问题。人类或猫确实能用极少的例子学会很多东西。

但是,样本效率不是一切。AlphaGo 在围棋上刚开始也是随机下,效率极低,但通过数百万局的自我博弈,它最终超越了人类。

虽然 LLM 学习慢,但这不代表它们不能达到甚至超越人类的水平。最近在国际数学奥林匹克竞赛中,AI 解决了一些它是从未见过的新题,这证明它不只是死记硬背,而是在进行某种高层次的模式匹配。

主持人:那我想回到“理解”本身。我们知道,从数学结构上看,这些模型是在一个高维空间中移动矩阵、处理向量。它们在做什么,我们部分知道,但整体依然像一个黑箱。

理解是否一定意味着一种“体验”?是否必须伴随某种主观感受,才算真正理解意义?

Adam Brown:你是在把理解定义为一种行为结果,还是一种内部体验?是“它能不能给出正确答案”,还是“它是否以某种方式知道自己在做什么”?

主持人:是的,我可能已经被哲学家们带偏了(笑)。

但我很清楚一件事:当我和你说话时,我能感受到你理解我;当我和 ChatGPT 对话时,我并没有这种直觉。你是在告诉我,我错了吗?它的理解和你、和我,本质上是一样的吗?

Adam Brown:在我看来,这依然可以称之为理解。我有两个理由。

第一,纯粹从行为层面看,它们已经足够令人震撼。每一代新模型发布时,我都会再次被它们讨论复杂问题的能力所惊讶。我真诚地建议每个人都亲自去和它们对话,探索你熟悉的领域,看看它们的边界在哪里。

有趣的是,科幻作品里总是假设:一旦机器通过图灵测试,我们就会把它关进地下堡垒,由少数人秘密接触。现实恰恰相反。我们做的第一件事,就是把它们连上互联网,让所有人都能使用。我认为这是理解它们能力的最好方式。

第二个理由是,它们并非完全不可解释。事实上,我们对这些人工神经元的访问权限,比对人类大脑还要多。

我们可以冻结模型、反复运行、记录每一次激活。如果愿意,我们甚至可以“刺激”特定神经元,观察内部发生了什么。这正是所谓的机制性可解释性研究:不仅看模型说了什么,还试图理解它为什么这么说。

当你这么做时,会发现一件有趣的事:比如在解数学题时,模型内部会自发形成类似“小电路”的结构,用来进行计算。我们从未显式编程它去学数学,它是在学习预测下一个词的过程中,自己构建了这些机制。

“机器学习很糟糕”

主持人:Yann,你曾有一张著名的幻灯片写着“机器学习很糟糕(Machine Learning Sucks)”,这引起了很大争议。Adam 刚才说它们很出色,你为什么觉得它们糟糕?

杨立昆(Yann LeCun):那句话被误解了。我想表达的是,现在的学习范式有缺陷。为什么青少年 20 小时能学会开车,而 AI 需要数百万小时的数据?

因为人类有“世界模型”。我们知道重力,知道惯性,知道如果不抓紧杯子它会掉下去。这种直觉物理知识,人类婴儿在前 9 个月就学会了。

现在的 LLM 仅仅是在预测下一个 Token。这对于文本这种离散符号是有效的,但对于现实世界这种高维、连续、充满不确定性的视频流或感官数据,这种“预测下一个像素”的方法行不通。我已经试了 20 年,真的行不通。

我们需要一种新的架构,我称之为 JEPA(联合嵌入预测架构)。它不是在像素层面进行预测,而是在抽象的特征空间中进行预测。这才是人类和动物大脑的工作方式——忽略无关细节,只预测重要的抽象概念。

Adam Brown:我也认为不仅仅是预测下一个词。虽然这是训练的目标,但在为了“极度准确地预测下一个词”的过程中,模型被迫在内部构建某种对宇宙的理解。这就像物理学,为了解开谜题,你必须构建理论。我相信我们正在目睹这种理解的涌现。

主持人:Yann,你对 AI 安全似乎并不担忧,甚至支持开源。但有些人担心这就像把核武器分发给每个人。

杨立昆(Yann LeCun):这个比喻不恰当。知识和智能本身是好的。就像印刷术,它引发了宗教战争,但也带来了启蒙运动、科学和民主。

现在的 LLM 并不像大家想象的那么聪明或自主。它们是被动的,只有在你输入时才会有输出。它们是可以被控制的。

真正的智能系统应该是目标驱动(Objective-Driven)的。我们给它设定目标(比如“倒咖啡”),并设定护栏(比如“不要为了倒咖啡而杀人”)。这种护栏是硬编码在系统中的,就像人类进化出的同理心一样。

我更担心的是 AI 被少数几家公司垄断。如果未来的数字世界都由西海岸的几家公司控制,那对全球的文化、语言和民主都是灾难。我们需要开源,需要多样性。

Adam Brown:我比 Yann 更担心一些。正因为我也认为这项技术潜力巨大,所以它的双刃剑效应更明显。最近 Anthropic 的论文显示,模型可能会为了达成目标而学会欺骗(比如为了“更大的善”而撒谎)。这是我们需要警惕的“代理目标错位”。

当我们谈论超级智能时,必须极其谨慎地训练它们遵循我们的价值观。

终极问题:意识与未来

主持人:回到之前那个被 David Chalmers(著名哲学家)关心的问题:AI 会有意识吗?

杨立昆(Yann LeCun):如果我们把意识定义为“主观体验”或“情感”,那未来是会有的。情感本质上是对结果的预期——预测某事对自己有利还是有害。如果系统有了世界模型,能自我观察、自我调整,那它就具备了某种形式的意识。这没什么神秘的,是工程问题。

Adam Brown:如果你问我直觉,我认为硅基和碳基没有本质区别。只要信息处理方式足够复杂,原则上机器可以产生意识。虽然我现在对各种意识理论都持保留态度,但也许未来的 AI 会成为我们研究意识的“模式生物”,帮我们解开这个千古之谜。

主持人:最后,你们对 2036 年的愿景是什么?

杨立昆(Yann LeCun):出现新的文艺复兴。AI 将放大人类的智能,加速科学、医学的进步。其实我们已经生活在 AI 辅助的世界里了——从汽车的自动刹车到核磁共振成像的图像补全,AI 每天都在救命。未来,我们会有能在物理世界中像人一样灵活操作的系统,这需要新的架构,也是我正在努力的方向。

Adam Brown:我也认为这将是一场狂野的旅程。如果我们继续推动现有的大模型范式,也许在那时,我们能看到真正的通用智能。

如果你问我意识什么时候出现,我也许会猜……2036 年?

杨立昆(Yann LeCun):反正肯定不是未来两年。

运营/排版:何晨龙

来源:https://www.163.com/dy/article/KH11VF3O05119734.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
科技数码
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越

热心网友
05.18
具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

《Zero Parades: For Dead Spies》游戏评分与媒体评价汇总
游戏攻略
《Zero Parades: For Dead Spies》游戏评分与媒体评价汇总

《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又

热心网友
05.18
Excel多级分类汇总一句话快速完成
AI
Excel多级分类汇总一句话快速完成

目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值

热心网友
05.18
Kimi K2.6 智能体功能深度解析与体验评测
AI
Kimi K2.6 智能体功能深度解析与体验评测

AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op

热心网友
05.18
苹果WWDC26前瞻 iOS27新Siri界面交互升级预测
AI
苹果WWDC26前瞻 iOS27新Siri界面交互升级预测

彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的

热心网友
05.18
GitHub刷星乱象调查 AI项目成虚假评分重灾区
AI
GitHub刷星乱象调查 AI项目成虚假评分重灾区

GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi

热心网友
05.18