杨立昆泼冷水:世界模型或是AI突破口,人形机器人智能不足
在麻省理工学院生成式AI影响力联盟的研讨会上,Meta首席AI科学家、纽约大学教授Yann LeCun再次抛出争议性观点。这位2018年图灵奖得主直言,当前主流的大语言模型技术实属“死胡同”,并坦言“这类系统永远无法达到人类水平的智能”。与此同时,他给人形机器人领域的热潮泼了盆冷水:“行业最大的秘密是,没有公司真正知道如何让机器人具备足够的通用智能。”
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
回溯至1987年,当AI学术界沉迷于专家系统研究时,年轻的LeCun在巴黎完成了关于“连接主义学习模型”的博士论文。这项奠定神经网络反向传播算法基础的研究,在当时显得格格不入。“或许是因为天真或无知,”他回忆道,“本科时我就被自组织系统的概念吸引——自然界中的生命都具备适应能力,而拥有神经系统的生物都能学习。”这种信念支撑他在不受主流认可的领域坚持研究,直到遇见导师Maurice Milgram后才正式开启学术生涯。
2016年NeurIPS大会上,LeCun提出的“蛋糕理论”引发学界震动。他将人工智能体系比作三层蛋糕:自监督学习构成主体,监督学习是糖霜,强化学习仅作点缀。“当时DeepMind等机构全力投入强化学习,但我始终认为这种路径效率低下。”他指出,强化学习需要海量试错次数,而理想系统应通过观察世界自主构建认知模型。这种理念在十年前就已萌芽,团队尝试用未标注数据训练系统预测视频内容,却发现视频预测的复杂性远超文本处理。
“给会议室拍摄视频并平移镜头后,系统根本无法预测每个人的长相或房间细节,”LeCun举例说明,“有些信息本质上是不可预测的,强行要求系统完成这类预测只会扼杀其发展。”经过五年探索,团队意识到必须突破传统框架。2024年ChatGPT引发的技术革命中,Meta推出的Llama模型虽取得商业成功,但LeCun强调自己未参与技术核心开发,称其最初只是巴黎团队的“海盗项目”。
面对行业巨头今年在AI基础设施上投入的3230亿美元,LeCun用数据对比揭示现存局限:以Llama 3为例,其训练使用的30万亿token总量,相当于人类阅读40万年才能完成的文本量。而四岁儿童在清醒的16000小时内,通过视觉神经接收的数据量就已达到同等规模。“这暴露出关键缺失——AI系统需要从视频等高带宽感官数据中学习,仅靠文本训练永远无法企及人类智能。”他直言,当前系统最多只能成为“反刍训练内容的工具”,连家猫的认知能力都难以超越。
在学界普遍追逐生成式模型的背景下,LeCun团队过去五年专注开发JEPA架构。这种联合嵌入预测架构通过编码器将视频转化为表征空间,在保留可预测信息的同时消除不可预测细节。“关键在于诱导系统在表征中承载足够信息,同时过滤无关细节。”他透露,Meta实验室的对比实验显示,非生成式架构在图像任务上的表现已超越监督模型,这为自然感官数据处理提供了新范式。
具体应用方面,巴黎团队开发的Dino系统已展现出通用视觉编码器的潜力,被广泛应用于医学图像、生物分析和天文学领域。更值得关注的是V-JEPA项目,研究者用相当于一个世纪的视频量训练系统,使其能识别视频中的异常事件。“当物体突然消失或变形时,预测误差会显著上升,这是系统获得常识的初步迹象。”在机器人领域,基于世界模型的系统已实现零样本任务完成,无需针对特定场景进行强化学习训练。
对于AI安全议题,LeCun提出与主流观点截然不同的解决方案。他主张构建“目标驱动”的架构,通过硬编码护栏确保行为可控。“就像为家用机器人设定底层规则:当周围有人且手持刀具时,禁止挥动手臂。”他将这种设计类比于人类法律体系,“我们数千年来都在通过规则引导行为,设计安全护栏的难度并不超过制造喷气式飞机。”
当被问及对年轻研究者的建议时,LeCun强调应关注具有持久价值的理论基础。“在移动应用编程和量子力学之间,即便你是计算机专业学生,也应该选择后者。”他解释道,量子力学培养的路径积分抽象思维,对语音识别解码等现实问题具有普适价值。“未来博士生将拥有AI虚拟助手团队,人类需要提升认知层级,把底层工作交给机器。”
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





