首先明确核心趋势:具身智能浪潮正从单打独斗转向体系化竞争。近期,逐际动力与阿里云联合推出FluxVLA Engine工程底座,并在阿里云PAI平台正式上线,全面开源。与此同时,逐际动力旗下多款机器人也已接入千问Omni模型,实现了物理世界中的全模态实时交互。

当前行业竞争焦点已从单一模型精度转向支撑模型持续训练、快速迭代与稳定部署的工程基础设施。然而,长期以来VLA(视觉-语言-动作)和WAM(世界动作模型)在工程化落地中面临一个关键痛点:训练、仿真与真机之间的数据规范不统一,模型架构与训练框架高度耦合,Sim2Real迁移时存在巨大落差。这些问题直接导致开发者将大量时间耗费在底层适配与调试上,真正用于模型创新的精力被严重挤占。
逐际动力的解决方案十分明确:他们打造了一个名为FluxVLA Engine的标准化工程底座。通过统一配置体系、标准化接口和模块化架构,将数据处理、模型训练、仿真评测、真机部署全部纳入同一套工程规范。这样一来,原本需要数天完成的模型配置工作,现在仅需半小时左右即可搞定。这正是降低开发门槛的核心举措。
在阿里云PAI平台上,FluxVLA Engine与逐际动力自主研发的双臂机器人平台TRON 2实现了深度协同。近期,FluxVLA Engine更成为首个支持人形机器人全身移动操作与真机部署的开源VLA/WAM代码库。换句话说,开发者不仅能够基于它完成机械臂、人形上半身的VLA和WAM模型训练,还能直接上手人形机器人全身移动操作的训练、仿真验证和真机部署。
除了工程平台上的合作,逐际动力在对不同形态机器人的打磨过程中,也全面引入了阿里云全栈AI技术。
具身智能的VLA模型以及负责运动控制的“小脑”模型,训练时均需要海量多模态数据。如此规模的数据对训练吞吐量、存储等底层基础设施提出了极高要求。目前,逐际动力的训练数据规模已达1.5PB,训练高峰瞬时吞吐量可达上百TB。依托阿里云PAI平台和CPFS并行存储,他们构建了跨场景、跨模态的大规模训练平台。同时,借助阿里云ACK容器服务和边缘计算能力,逐际动力将多类强化学习环境统一封装为云上仿真平台,使“小脑”能够在云端进行大批量并行训练,再无缝迁移到真机。这一方法直接将原本以周为单位的环境调试时间压缩到了小时级别。
在本体交互层面,LimX Luna、LimX Oli和TRON 2在接入千问Omni后,获得了全模态实时互动能力。Qwen-Omni支持文本、图像、音频、视频的多模态实时输入输出,覆盖19种语言和多种音色,同时具备工具调用能力。接入后,机器人不仅能“看懂、听懂、说出来”,还能根据现场环境调用外部工具完成任务。
逐际动力联合创始人谌骅表示,与阿里云合作的目标是让具身模型从训练到部署全流程无难度,通过在千行百业构建垂直大模型生产系统,让更多人能够参与到具身智能革命中来。未来,双方计划继续围绕模型训练、仿真平台、大模型等方向推进全栈AI合作,进一步完善FluxVLA Engine的能力,降低研发门槛,推动技术真正走向产业落地。
