5月13日,蚂蚁集团旗下专注具身智能的灵波科技宣布了一项关键开源成果:正式发布其具身基座模型 LingBot-VLA 的真机后训练完整工具链。这一举措意味着,开发者和研究团队现在能够利用这套标准化工具,结合自身采集的机器人数据,高效地将 LingBot-VLA 模型适配到特定的机器人硬件与复杂的任务场景中,加速从模型到真机部署的进程。

当前,具身智能领域的开源模型生态日益丰富,但“最后一公里”的工程落地挑战依然显著——如何将训练好的模型高效、稳定地部署到真实的机器人平台上?不同机器人在机械臂构型、末端执行器设计、传感器配置以及底层控制接口等方面存在巨大差异,开发团队往往需要投入大量资源进行繁琐的工程适配与调试。这套核心的适配链路,过去通常被视为各家的技术壁垒,很少完整地向社区开放。
灵波科技此次开源,精准瞄准了真机适配过程中的核心痛点。其工具链系统性地覆盖了四个关键环节:首先是高效的数据处理工具,支持合并多种符合 LeRobot 格式的数据集,并对关节维度映射进行统一标准化处理;其次是专门为真机场景优化的训练配置方案,提升了训练的稳定性和效果;再者是全面的离线评测工具,便于在部署前评估模型性能;最后是支持编译加速的真机部署模块,确保模型在硬件上的运行效率。为满足不同团队的需求,工具链还提供了包含深度信息与不含深度信息的两个模型版本,增强了适用性。
那么,作为基座的 LingBot-VLA 模型本身性能如何?该模型基于超过2万小时的真实机器人操作数据进行预训练,广泛覆盖了9种主流双臂机器人构型,因此在跨不同机器人本体和跨多样化任务的泛化能力上表现卓越。根据官方公布的评测数据,无论是在真实机器人测试还是在仿真模拟环境中,LingBot-VLA 的性能指标均显著优于行业广泛认可的基准模型 π0.5。目前,该模型已成功与乐聚机器人、松灵机器人、星海图科技等多家领先的机器人厂商完成了多机型、多场景的联合验证,证明了其强大的实用性和可靠性。
更值得关注的是其在数据与算力效率方面的优势。据悉,LingBot-VLA 仅需大约150条高质量的任务演示数据,即可实现对新任务的高质量迁移学习。这背后得益于其底层代码库的深度优化,其训练效率达到了 StarVLA、OpenPI 等主流开源框架的1.5到2.8倍,这极大地降低了模型定制化适配所需的数据收集成本和高昂的算力开销,为中小团队提供了可行的落地路径。
目前,LingBot-VLA 模型的完整代码、训练工具链及详细文档已在 GitHub 平台全面开源,模型权重也已同步发布于 Hugging Face 和 ModelScope 两大主流AI模型社区。对于正在积极探索具身智能技术落地与机器人应用开发的团队而言,这无疑是一个值得深入研究和评估的高效解决方案。
