首页 游戏 软件 资讯 排行榜 专题
首页
AI
1500万参数模型实现物理交互 具身智能迎来新突破

1500万参数模型实现物理交互 具身智能迎来新突破

热心网友
18
转载
2026-05-18

当AI忙于预测下一个词,或是生成下一个像素时,海量的计算资源其实被消耗在了对表面细节的复刻上。模型更像是在记忆统计规律,而非真正理解现实世界的内在逻辑。

现在看来,Yann LeCun的观点或许一直是对的。

过去三年,整个行业似乎只遵循一个简单的逻辑:把模型做得更大。参数规模从千亿迈向万亿,背后的算力投入更是以千亿美元计。这背后的信念近乎一种“暴力美学”——只要模型足够庞大,它终将“理解”世界。

但LeCun对此持有根本性的不同意见。他反复强调,生成式AI的路径从本质上讲是低效的。它耗费巨大算力去填补细节,却未必触及世界的核心运作机制。

为此,他提出了另一条道路:JEPA(联合嵌入预测架构)。

JEPA的核心思路是让AI在一种压缩后的“思维空间”里进行预测,关注的是抽象概念和状态变化,而非具体到每一个像素的细节。这听起来更高效,也更接近人类的推理方式。

然而,JEPA长期面临一个棘手的难题:表征崩塌。

由于模型被允许对现实进行抽象和简化,它很容易“偷懒”和“作弊”。为了最小化预测误差,它可能将万事万物都压缩成极度相似的内部表示。最终,在它眼中,狗、汽车和人可能变得难以区分——这显然背离了学习的初衷。

为了解决这个问题,以往的研究不得不引入一系列复杂的工程补丁:冻结部分编码器、采用指数移动平均技术、调整多达六七个超参数……每一个补丁都带来了额外的计算成本和调试复杂度。

直到最近,这个难题迎来了一个优雅的解决方案。

Yann LeCun团队的最新论文提出了名为LeWorldModel的新模型,它从根本上解决了表征崩塌的问题。

图片

这篇论文的核心创新点在于,它用一个简洁的数学正则化项,取代了以往所有复杂的工程技巧。

这个名为SIGReg的正则化项,强制要求模型内部的隐式表示符合标准高斯分布。这一约束如同给模型戴上了“紧箍咒”,让它无法再将所有信息压缩成无意义的单一表征。模型被迫去学习并区分现实世界中不同的物理状态和概念,才能做出准确的预测。

如此一来,训练过程变得干净利落。整个系统可以端到端地、直接从原始像素数据稳定地进行训练。超参数的数量从原来的六七个锐减到几乎只有一个(主要是一个权重系数λ,大约设为0.1)。

这项改进彻底改写了AI模型的经济账。

LeWorldModel的参数量仅有1500万。这意味着在一块消费级GPU上,几个小时就能完成训练。它不需要复杂的奖励信号设计,只需要带有动作标签的离线视频数据。

但其规划效率却高得惊人。相比大型的基础世界模型,它的规划速度快了48倍。以往需要47秒才能完成的规划序列,现在仅需1秒。秘诀在于它将每一帧图像编码成一个192维的隐向量,这比其他方法减少了近200倍的token处理量。

研究团队在多项机器人控制任务上进行了验证,包括推方块、机械臂操作、双房间导航和三维物体抓取。结果显示,在大多数任务中,这个小巧的模型性能持平甚至超越了那些庞大得多的基础模型方案。更值得注意的是,它从头开始学习,无需任何预训练的视觉特征作为“拐杖”。

它的内部表示也不再是难以解读的“黑箱”。通过简单的线性探针,就能从中可靠地解码出物体的位置、速度等物理量。当视频中间出现违反物理规律的事件(比如物体瞬间移动)时,模型能够稳定地检测到这种“异常”。

当然,论文也坦诚地指出了当前的局限性:模型目前只验证了大约5步的短程规划;所有实验均在模拟环境中进行,尚未在真实机器人上部署;此外,在那些内在维度极低的简单场景中,高斯先验假设可能不那么适用,模型表现会稍打折扣。

写在最后

这并不意味着生成式AI的道路走到了尽头。但LeCun的这项研究确实提供了一个清晰、可复现的范本,让他倡导多年的世界模型路线,特别是在机器人与物理交互领域,变得前所未有的切实可行。

行业已经投入了数千亿美元,让庞大的服务器集群去学习和记忆互联网上的所有数据。

而现在,一个在单张显卡上仅需训练数小时的小模型,正在向我们展示另一种可能:如何让AI真正学会理解现实世界的运作方式。

具身智能的实质性突破,或许就在未来的一两年内。无论如何,未来的技术图景,正因此变得更加值得期待。

来源:https://www.51cto.com/article/841524.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

芯桥半导体张鑫解析具身智能算力工厂从单点智能到群体协同
AI
芯桥半导体张鑫解析具身智能算力工厂从单点智能到群体协同

2026年4月21日至22日,以“奔赴AGI 重塑未来”为主题的2026中国生成式AI大会(北京站)成功举办并圆满落幕。本次盛会汇聚了73位来自人工智能产业、顶尖学术机构、前沿研究领域及投资界的重磅嘉宾,通过1场主论坛开幕式、3场深度专题论坛和6场聚焦的技术研讨会,对AI产业的宏观发展脉络、创新商业

热心网友
05.17
追觅Z1洗护机器人亮相 俞浩称苹果联合创始人感兴趣
AI
追觅Z1洗护机器人亮相 俞浩称苹果联合创始人感兴趣

4月30日,追觅科技创始人兼CEO俞浩在社交媒体上分享了一个引人注目的动态:苹果公司联合创始人史蒂夫·沃兹尼亚克,对追觅最新发布的全AI具身智能洗护机器人Z1产生了浓厚兴趣。这款产品能够吸引这位科技界传奇人物的关注,核心在于其实现的技术飞跃——它创新性地集成了多模态感知系统,能够精准识别衣物材质与状

热心网友
05.17
理想L9正式交付两款车型售价4598万元起
AI
理想L9正式交付两款车型售价4598万元起

全新理想L9已正式启动用户交付,首批交付在常州与杭州进行,并计划自5月17日起向更多城市扩展。该车型于2026年5月15日上市,是理想汽车推出的首款具身智能旗舰SUV,全国530家门店已有展车。新车提供Livis和Ultra两款配置,售价分别为45 98万元和50 98万元,为消费者提供了不同的高端

热心网友
05.17
杭州率先为具身智能机器人立法 今日正式实施
AI
杭州率先为具身智能机器人立法 今日正式实施

5月1日,杭州市发布了一项具有里程碑意义的产业新政,为国内人工智能领域注入了强劲动力:全国首部聚焦具身智能机器人产业发展的专项地方性法规——《杭州市促进具身智能机器人产业发展条例》,于今日起正式施行。此举不仅标志着政策层面的重大创新,更依托于杭州雄厚的产业根基。据统计,杭州市已集聚超过700家机器人

热心网友
05.17
具身智能仿真框架:高吞吐并行与高保真渲染驱动规模化训练
AI
具身智能仿真框架:高吞吐并行与高保真渲染驱动规模化训练

在具身人工智能(Embodied AI)快速发展的今天,视觉感知正成为机器人理解与交互物理世界的核心入口。作为信息最丰富、最符合人类直觉的交互模态,视觉是解锁通用机器人智能、实现从虚拟仿真到真实物理世界无缝迁移的关键技术路径。 然而,构建以视觉为中心的机器人仿真训练平台面临巨大挑战:追求高保真视觉渲

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

斯柯达晶锐Fabia Motorsport特别版车型正式发布
业界动态
斯柯达晶锐Fabia Motorsport特别版车型正式发布

为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘

热心网友
05.18
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元
web3.0
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元

Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,

热心网友
05.18
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾
业界动态
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾

劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲

热心网友
05.18
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台
游戏资讯
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台

新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。

热心网友
05.18
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录
业界动态
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录

当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID

热心网友
05.18