蚂蚁灵波开源具身世界模型LingBot-VA，复杂任务成功率超Pi0.5两成_AI热点日报

蚂蚁灵波开源具身世界模型LingBot-VA，复杂任务成功率超Pi0.5两成

类型：热点整理2026-01-30

1 月 30 日，继空间感知模型、具身大模型与世界模型“三连发”后，蚂蚁灵波科技今日宣布开源具身世界模型 LingBot-VA。 1 月 30 日，继空间感知模型、具身大模型与世界模型“三连发”后，

1月30日，蚂蚁灵波科技在接连开源空间感知模型、具身大模型与世界模型三大核心成果后，再次宣布开源全新的具身世界模型 LingBot-VA。

这一模型首次提出了自回归视频-动作世界建模框架，巧妙地将大规模视频生成模型与机器人控制技术深度融合。模型在预测“下一步世界状态”的同时，能直接推演并输出相应的动作序列，使机器人能够像人类一样实现“边推演、边行动”的智能行为模式。

在真机测评中，LingBot-VA展现出了对复杂物理交互的出色适应能力。面对长时序任务、高精度操作以及柔性与关节物体操控这三大类共六项高难度挑战，模型仅需30至50条真机演示数据即可快速完成适配，其任务成功率相比业界强基线Pi0.5平均提升了20%。

真机测评数据显示，LingBot-VA在多项高难度操作任务上的性能已超越行业标杆Pi0.5。

在仿真测评中，LingBot-VA同样表现卓越。在高难度双臂协同操作基准RoboTwin 2.0上，它首次将任务成功率提升至超过90%；在长时序终身学习基准LIBERO上，其平均成功率达到了98.5%，双双刷新了行业纪录。

LingBot-VA在LIBERO与RoboTwin 2.0仿真基准测试中均刷新了现有最佳性能。

据悉，LingBot-VA采用了混合专家（MoT）架构，实现了视觉处理与动作控制的跨模态高效融合。通过其独特的闭环推演机制，模型在每一步生成时都会纳入真实世界的实时反馈，确保持续生成的画面与动作始终贴合物理现实，从而精确控制机器人完成各类高难度复杂任务。

为了突破大规模视频世界模型在机器人端侧部署的计算瓶颈，LingBot-VA设计了异步推理流水线，将动作预测与电机执行并行化处理；同时引入了基于记忆缓存的持久化机制与噪声历史增强策略，使得推理时只需更少的生成步骤即可输出稳定、精准的动作指令。这一系列优化让LingBot-VA在兼备大模型深度理解能力的同时，也具备了真机端低延迟控制所需的快速响应速度。

蚂蚁灵波表示，LingBot-VA与此前开源发布的模拟环境、智能基座和空间感知模型一脉相承，共同探索出一条“世界模型赋能具身操作”的全新路径。蚂蚁集团将持续依托InclusionAI社区进行开源开放，携手行业共建具身智能基础能力，加速构建一个深度融合开源开放技术、并服务于真实产业场景的通用人工智能生态。

目前，LingBot-VA的模型权重与推理代码已面向社区全面开源。

来源：https://www.51cto.com/article/835431.html

蚂蚁灵波科技世界模型

延伸阅读

补充最近整理过的热点入口。

蚂蚁灵波开源具身世界模型LingBot-VA，复杂任务成功率超Pi0.5两成

相关热点

延伸阅读