当具身智能成为人工智能赛道的新高地,算力底座的自主可控便成为无法回避的核心议题。近日,摩尔线程与北京智源人工智能研究院完成了一项关键性验证——基于FlagOS-Robo框架与MTT S5000千卡集群,成功运行了智源具身大脑模型RoboBrain 2.5的全流程训练任务。

这不仅是业内首次利用国产算力集群完成具身智能大模型训练,更在“能训”的基础上实现了“训得稳健、训得高效”。通过面向多元芯片的统一AI系统软件栈FlagOS与MTT S5000硬件集群的深度协同,该方案向外界释放出清晰信号:国产AI基础设施在处理复杂多模态任务上,已迈出从实验室迈向产业化的关键一步。
RoboBrain是智源专为真实物理场景量身打造的通用具身大脑,依托统一的视觉-语言多模态架构,为机器人的感知、认知、推理与决策提供系统性支撑。升级后的RoboBrain 2.5,在原有能力之上,新增了对动作时序的价值评估能力,以及对三维空间结构的理解与推理能力。换言之,机器人已不再仅仅满足于“看见”与“听懂”,而是开始理解“如何行动更为合理”,这对下游任务执行成功率的提升是显而易见的。
FlagOS-Robo框架脱胎于开源开放的多芯片AI软件栈FlagOS,专为具身智能的训练与推理场景设计。它支持从端侧到云侧的多场景部署,兼容多种芯片,能够同时支撑大脑模型(VLM)与小脑模型(VLA)的协同训练与推理。更重要的是,该框架打通了从数据采集到真机评测的全链路,涵盖数据加载、模型训练、推理计算以及具身评测,极大地降低了开发者的上手门槛。多芯片统一管理、自动调优、一键跨本体部署等能力汇聚在一起,为具身智能的前沿探索和产业落地构筑了一座坚实可靠的算力底座。
多维评测验证,指标全面对齐
效果究竟如何?智源团队在多个权威评测数据集上进行了验证,涵盖2D/3D空间感知推理榜单、时序价值评估榜单等。结果显示,基于MTT S5000国产千卡集群训练出的RoboBrain-2.5模型,在多项关键指标上与国际主流GPU训练的模型表现一致。特别是在CrossPoint、Q-Spatial、VABench-V等任务中,算法效果甚至更为优异。这种全面对齐的评测结果,意味着FlagOS-Robo框架与MTT S5000算力协同训练出的“具身大脑”,在理解、规划与执行能力上,已跻身行业一流水准。
Loss完美对齐,误差小于0.62%
在模型精度方面,基于MTT S5000的夸娥智算集群展现出极高的稳定性。训练曲线显示,MTT S5000千卡集群的Loss走势与国际主流GPU训练结果高度吻合,相对误差控制在0.62%以内。这一数字意味着什么?意味着国产算力的训练精度已具备与国际主流方案同台竞技的实力。与此同时,智源FlagOS-Robo框架成功实现了跨平台的无损迁移,开发者在更换硬件时无需担心模型性能下降,真正达到了“代码不改、精度不降”的平滑适配效果。
极致线性扩展,千卡加速比超90%
大规模集群训练最怕扩卡不增效,而本次数据表现十分抢眼:从64卡扩展至1024卡,系统实现了90%以上的线性扩展效率。扩展曲线呈现出极佳的线性增长趋势,算力资源增加的同时,训练速度几乎同步翻倍。这不仅验证了国产集群在大规模并行计算与通信调度方面的成熟度,也为支撑万卡级训练奠定了坚实基础。
此次深度合作为具身智能从实验室走向产业落地提供了一个可复制的国产算力范式。自主、开放、高效——这三个关键词,或许正是中国具身智能产业未来最需要的核心驱动力。
