S5000千卡集群与FlagOS驱动RoboBrain2.5具身大脑模型训练

时间：2026-06-18 12:15

基于FlagOS-Robo框架和MTTS5000千卡集群，首次用国产算力完成了RoboBrain2 5具身大脑模型全流程训练。损失误差小于0 62%，千卡线性扩展效率超90%，多项指标与国际主流GPU训练模型对齐，为具身智能产业落地提供了自主可控的算力范式。

当具身智能成为人工智能赛道的新高地，算力底座的自主可控便成为无法回避的核心议题。近日，摩尔线程与北京智源人工智能研究院完成了一项关键性验证——基于FlagOS-Robo框架与MTT S5000千卡集群，成功运行了智源具身大脑模型RoboBrain 2.5的全流程训练任务。

S5000千卡集群+FlagOS驱动RoboBrain2.5具身大脑模型训练

这不仅是业内首次利用国产算力集群完成具身智能大模型训练，更在“能训”的基础上实现了“训得稳健、训得高效”。通过面向多元芯片的统一AI系统软件栈FlagOS与MTT S5000硬件集群的深度协同，该方案向外界释放出清晰信号：国产AI基础设施在处理复杂多模态任务上，已迈出从实验室迈向产业化的关键一步。

RoboBrain是智源专为真实物理场景量身打造的通用具身大脑，依托统一的视觉-语言多模态架构，为机器人的感知、认知、推理与决策提供系统性支撑。升级后的RoboBrain 2.5，在原有能力之上，新增了对动作时序的价值评估能力，以及对三维空间结构的理解与推理能力。换言之，机器人已不再仅仅满足于“看见”与“听懂”，而是开始理解“如何行动更为合理”，这对下游任务执行成功率的提升是显而易见的。

FlagOS-Robo框架脱胎于开源开放的多芯片AI软件栈FlagOS，专为具身智能的训练与推理场景设计。它支持从端侧到云侧的多场景部署，兼容多种芯片，能够同时支撑大脑模型（VLM）与小脑模型（VLA）的协同训练与推理。更重要的是，该框架打通了从数据采集到真机评测的全链路，涵盖数据加载、模型训练、推理计算以及具身评测，极大地降低了开发者的上手门槛。多芯片统一管理、自动调优、一键跨本体部署等能力汇聚在一起，为具身智能的前沿探索和产业落地构筑了一座坚实可靠的算力底座。

多维评测验证，指标全面对齐

效果究竟如何？智源团队在多个权威评测数据集上进行了验证，涵盖2D/3D空间感知推理榜单、时序价值评估榜单等。结果显示，基于MTT S5000国产千卡集群训练出的RoboBrain-2.5模型，在多项关键指标上与国际主流GPU训练的模型表现一致。特别是在CrossPoint、Q-Spatial、VABench-V等任务中，算法效果甚至更为优异。这种全面对齐的评测结果，意味着FlagOS-Robo框架与MTT S5000算力协同训练出的“具身大脑”，在理解、规划与执行能力上，已跻身行业一流水准。

Loss完美对齐，误差小于0.62%

在模型精度方面，基于MTT S5000的夸娥智算集群展现出极高的稳定性。训练曲线显示，MTT S5000千卡集群的Loss走势与国际主流GPU训练结果高度吻合，相对误差控制在0.62%以内。这一数字意味着什么？意味着国产算力的训练精度已具备与国际主流方案同台竞技的实力。与此同时，智源FlagOS-Robo框架成功实现了跨平台的无损迁移，开发者在更换硬件时无需担心模型性能下降，真正达到了“代码不改、精度不降”的平滑适配效果。