蚂蚁集团旗下具身智能公司灵波科技今日发布重要开源成果:正式开放其具身基座模型 LingBot-VLA 的真机后训练工具链。这意味着,开发者现在可以利用这套完整的工具包,结合自有数据,快速将 LingBot-VLA 模型适配至特定机器人硬件与任务场景,大幅降低部署门槛。
当前,具身智能领域的开源模型日益丰富,但将通用模型成功部署至真实机器人仍面临显著挑战。核心难点在于,不同机器人在机械结构、关节构型、末端执行器、传感器配置及控制接口等方面存在巨大差异。完成真机适配通常需要大量工程化工作,而完整的工程链路一直是各团队的核心技术积累,较少对外公开。
灵波科技此次开源正是针对真机适配中的关键痛点。工具链覆盖四大核心环节:首先,数据处理工具支持融合多种 LeRobot 格式数据集,并对关节维度进行标准化映射;其次,提供面向真机场景优化的训练配置方案;第三,包含用于性能评估的离线评测工具;最后,集成支持编译加速的真机部署模块。为适应不同应用需求,模型还提供了包含深度信息与不含深度信息的两个版本,方便开发团队灵活选用。
作为一款基座模型,LingBot-VLA 具备坚实的底层能力。其基于超过2万小时的真实机器人数据进行预训练,覆盖9种主流双臂机器人构型,因此在跨本体、跨任务泛化性能上表现优异。官方测试数据显示,无论在真机验证还是仿真环境中,LingBot-VLA 的性能均优于行业基准模型 π0.5。目前,该模型已与乐聚、松灵、星海图等多家机器人厂商完成多机型适配验证,具备良好的落地基础。
更值得关注的是其高效的学习能力。据悉,LingBot-VLA 仅需约150条演示数据即可实现高质量的任务迁移。这得益于其底层代码库的深度优化——训练效率达到 StarVLA、OpenPI 等主流框架的1.5至2.8倍。这直接帮助开发者在模型适配过程中有效控制数据采集成本与算力消耗。
目前,LingBot-VLA 的完整代码库已在 GitHub 开源,模型权重同步发布于 Hugging Face 与 ModelScope 平台。对于正在推进具身智能应用落地的研发团队而言,这提供了一个高效、可靠的开发起点,有望加速机器人智能化部署进程。
