首页 游戏 软件 资讯 排行榜 专题
首页
AI
蚂蚁灵波开源具身世界模型LingBot-VA,复杂任务成功率超Pi0.5两成

蚂蚁灵波开源具身世界模型LingBot-VA,复杂任务成功率超Pi0.5两成

热心网友
34
转载
2026-01-30

1月30日,蚂蚁灵波科技在接连开源空间感知模型、具身大模型与世界模型三大核心成果后,再次宣布开源全新的具身世界模型 LingBot-VA。

这一模型首次提出了自回归视频-动作世界建模框架,巧妙地将大规模视频生成模型与机器人控制技术深度融合。模型在预测“下一步世界状态”的同时,能直接推演并输出相应的动作序列,使机器人能够像人类一样实现“边推演、边行动”的智能行为模式。

在真机测评中,LingBot-VA展现出了对复杂物理交互的出色适应能力。面对长时序任务、高精度操作以及柔性与关节物体操控这三大类共六项高难度挑战,模型仅需30至50条真机演示数据即可快速完成适配,其任务成功率相比业界强基线Pi0.5平均提升了20%。

真机测评数据显示,LingBot-VA在多项高难度操作任务上的性能已超越行业标杆Pi0.5。

在仿真测评中,LingBot-VA同样表现卓越。在高难度双臂协同操作基准RoboTwin 2.0上,它首次将任务成功率提升至超过90%;在长时序终身学习基准LIBERO上,其平均成功率达到了98.5%,双双刷新了行业纪录。

LingBot-VA在LIBERO与RoboTwin 2.0仿真基准测试中均刷新了现有最佳性能。

据悉,LingBot-VA采用了混合专家(MoT)架构,实现了视觉处理与动作控制的跨模态高效融合。通过其独特的闭环推演机制,模型在每一步生成时都会纳入真实世界的实时反馈,确保持续生成的画面与动作始终贴合物理现实,从而精确控制机器人完成各类高难度复杂任务。

为了突破大规模视频世界模型在机器人端侧部署的计算瓶颈,LingBot-VA设计了异步推理流水线,将动作预测与电机执行并行化处理;同时引入了基于记忆缓存的持久化机制与噪声历史增强策略,使得推理时只需更少的生成步骤即可输出稳定、精准的动作指令。这一系列优化让LingBot-VA在兼备大模型深度理解能力的同时,也具备了真机端低延迟控制所需的快速响应速度。

蚂蚁灵波表示,LingBot-VA与此前开源发布的模拟环境、智能基座和空间感知模型一脉相承,共同探索出一条“世界模型赋能具身操作”的全新路径。蚂蚁集团将持续依托InclusionAI社区进行开源开放,携手行业共建具身智能基础能力,加速构建一个深度融合开源开放技术、并服务于真实产业场景的通用人工智能生态。

目前,LingBot-VA的模型权重与推理代码已面向社区全面开源。

来源:https://www.51cto.com/article/835431.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

蚂蚁灵波科技开源四款具身智能模型,探索能力上限与社区入驻
科技数码
蚂蚁灵波科技开源四款具身智能模型,探索能力上限与社区入驻

2026年被业界视为具身智能元年,但在机器人真正融入现实应用的过程中,仍面临着具身智能模型泛化能力与部署效率的双重挑战。真正的 "具身智能 ",应是能够全面自主决策与行动的通用机器人,其基础在于对物理

热心网友
02.03
蚂蚁灵波开源具身世界模型LingBot-VA,复杂任务成功率超Pi0.5两成
AI
蚂蚁灵波开源具身世界模型LingBot-VA,复杂任务成功率超Pi0.5两成

1 月 30 日,继空间感知模型、具身大模型与世界模型“三连发”后,蚂蚁灵波科技今日宣布开源具身世界模型 LingBot-VA。 1 月 30 日,继空间感知模型、具身大模型与世界模型“三连发”后,

热心网友
01.30

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

算力时代电力价值重估 能源如何支撑数字经济
AI
算力时代电力价值重估 能源如何支撑数字经济

近日,国家能源局联合发改委、工信部、国家数据局正式印发《关于促进人工智能与能源双向赋能的行动方案》。这份重磅文件的核心思路非常清晰:一方面,以坚实的能源基础支撑人工智能(AI)的快速发展;另一方面,利用AI技术赋能能源行业转型升级。其核心目标是推动能源、算力、应用场景、数据与算法模型五大关键要素深度

热心网友
05.20
智谱清影与Runway Gen3视频生成模型对比评测
AI
智谱清影与Runway Gen3视频生成模型对比评测

在挑选文生视频工具时,若您正在智谱清影与Runway Gen-3之间权衡,那么了解两者在生成效果上的具体差异,将有助于您做出更明智的选择。本文将从画质清晰度、细节纹理、运动自然度与视频连贯性等核心维度,通过实测对比为您详细解析。 一、画质与分辨率表现 首先对比硬性指标。智谱清影基于CogVideoX

热心网友
05.20
通义万象制作数据可视化科技背景的实用教程
AI
通义万象制作数据可视化科技背景的实用教程

想用通义万相生成一张科技感十足的数据可视化背景,但出来的画面总觉得少了点“内味儿”?数字界面、粒子流、电路纹理这些关键元素一个不见,画面平平无奇?这通常不是工具的问题,而是提示词没有精准锚定科技可视化的核心要素,或者模型参数没调到最佳状态。别急,下面这几种方法,能帮你把想法精准地“翻译”成画面。 一

热心网友
05.20
Vidu视频慢动作与快进效果制作教程
AI
Vidu视频慢动作与快进效果制作教程

想要在Vidu生成的视频中实现流畅的慢动作或快进效果?虽然模型界面没有提供直接调整播放速度的滑块,但通过巧妙的提示词设计、利用内置功能,或结合后期处理工具,你完全可以精准掌控视频的节奏与时间感。本文将为你详细解析四种实用方法,从生成前到生成后,全方位满足你的创作需求。 一、通过精准提示词引导运动节奏

热心网友
05.20
海螺AI学术论文查重降重功能实测与效果分析
AI
海螺AI学术论文查重降重功能实测与效果分析

当您使用海螺AI生成的英文论文在提交查重时遭遇高重复率或AIGC检测异常,请不要急于归咎于工具本身。核心原因在于,尽管AI生成的文本格式标准、语法地道,但其语言模式和常见短语组合,并未针对知网、维普、万方等中文查重数据库的语义比对逻辑进行专门优化。换言之,机器认为流畅自然的表达,在查重系统的算法看来

热心网友
05.20