VLA与世界模型:互补共存,赋能通用人工智能
一段时间以来,围绕VLA(Vision-Language-Action,视觉-语言-行动)模型、WMA(World-Model–Action,“世界模型+动作策略”)模型两条路线的讨论,是具身智能领域里的热点话题。现在,大家似乎不约而同地决定放下争议,协同前行。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
日前,智元机器人启动了一项机器人赛事AGIBOT WORLD CHALLENGE @ ICRA 2026(以下简称 ICRA 2026),两大核心赛道即为Reasoning to Action(推理-操作)和World Model(世界模型)。前者包括线上仿真与线下真机两个阶段,后者则聚焦具身智能中的生成与预测能力,采用线上竞赛方式。
3月25日,智元Genie业务部生态及解决方案总监沈咏剑在接受包括澎湃科技(www.thepaper.cn)在内的媒体采访时表示,从长期趋势看,世界模型与VLA并不一定是替代关系,未来存在结合的可能。“从解决问题的层面上来说,有可能会有一些融合或者说合作的状态,二者不算是替代和被替代的关系。”
VLA曾一度被视为具身智能的重要主流路径,即让机器人基于视觉输入和语言指令,直接完成动作生成与执行。但随着机器人开始进入更复杂、更长链条的任务场景,仅仅“看懂指令并做出动作”已不够。机器人还需要理解任务目标、拆解步骤、推演环境变化,并在执行过程中持续调整策略。
沈咏剑介绍,此次赛事中设置的世界模型赛道考察的是模型根据机器人动作建模物理环境动态的能力。参赛者需要基于真实机器人观测与动作信号,训练视频生成模型,生成机器人在多个真实任务场景中的交互视频。

推理-操作赛道。来源:智元
另一条“推理-操作”赛道,同样考核的是机器人去理解-执行任务这一具体过程。沈咏剑提到,去年的比赛更多是“叠衣服”这类相对明确、固定的任务,机器人基本是“让它做什么,它就做什么”;而今年则加入了更多需要机器人先理解任务、再进行拆解和执行的场景,例如“整理桌面”这类任务,机器人不仅要完成动作,还要先理解什么算整洁、先做什么后做什么,再完成整套流程。

世界模型赛道。 来源:智元
沈咏剑认为,当前世界模型的定义还未收敛,其核心可以概括为一种对未来状态的预测与推演能力:系统基于当前可见的多模态信息,判断下一时刻可能发生什么,或者在接收到任务指令后,推演机器人自身及周围环境接下来会发生怎样的变化。在他看来,这与当前VLA的范式并不完全相同,是相对独立的一条技术路线。
从智元近一年的公开布局看,该公司本身也并未只围绕单一路线推进。智元在2024年底推出了AgiBot World,包含超过100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集。2025年3月,智元发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。今年1月,智元又发布了Genie Sim 3.0仿真平台,该平台基于NVIDIA Isaac Sim构建,融合三维重建与视觉生成技术,可实现数字孪生级高保真环境。与此同时,围绕推理与操作融合、全身控制等方向,2026年1月,智元具身研究中心宣布推出第二代一体化具身大小脑系统GenieReasoner。
沈咏剑表示,当前整个具身智能行业的人才仍处于稀缺状态,特别是高素质、顶尖的算法人才,他们希望通过赛事吸引更多优秀人才进入这一领域。
相关攻略
新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王
脑机接口技术正处于从实验室迈向产业化应用的关键转折点,其发展离不开数据创新的驱动、检测服务的支撑与产业集群的聚合。3月27日,脑机接口创新发展论坛在中关村国际创新中心举行,本次论坛以 "创新集聚·脑智
来源:环球网【环球网科技报道 记者 李文瑶】当AI技术从技术验证走向实际应用,算力供给的结构性调整正成为业界关注的焦点。3月26日,中关村论坛年会现场,中科曙光发布世界首个无线缆箱式超节点——sca
1两年前横空出世的Sora,曾给AI业界和全球网民带来巨大的震撼。到2026年,它突然退场,没能再掀起那样大的波澜。从商业决策的角度看,这其实早就是意料之中的事。极高的视频生成成本、少得可怜的付费用
人工智能(ai)大模型正加速融入医疗健康生态,但其背后的法律责任、伦理边界与风险分担问题仍缺乏明晰框架。如何让ai在守住安全与伦理底线的前提下健康发展?笔者认为,要明确ai辅助诊疗责任,构建一个安全
热门专题
热门推荐
3月28日消息,中国联通近日发布2025年度业绩报告,在网络建设领域交出亮眼答卷。中国联通表示,公司持续落实信号升格、宽带升级相关举措,目前近九成宽带已具备千兆接入能力,万兆光网更在全国100多个城
163邮箱个人版登录入口为https: mail 163 com,支持网页及手机浏览器直接访问,提供手机号、邮箱账号、扫码三种登录方式,界面简洁,功能齐全,适配多终端使用。163
在冒泡社区中,设置键盘能为用户带来更便捷、舒适的操作体验。以下是详细的设置方法。首先,打开冒泡社区应用程序。进入社区主界面后,找到屏幕上的设置选项。这通常可以在界面的某个角落,以一
一场谎言的终幕是崩坏星穹铁道中4 1版本的新光锥之一,其属性可以提高装备的暴击率,下面小编就为大家带来《崩坏:星穹铁道》一场谎言的终幕光锥效果一览,不清楚的一起来看看吧。《崩坏:星
2026年3月28日中午12时整,由腾讯视频全网独播的古装奇幻剧《白日提灯》准时上线。该剧开播前预约人数高达674万人次,被平台力推为“年度古偶扛鼎之作”,然而仅播出六小时后,口碑便急速崩塌,引发全





