在具身智能从实验室迈向产业化的关键阶段,一个核心挑战日益凸显:机器人训练亟需海量、高质量的具身智能数据。2025年6月1日,诺亦腾机器人正式发布ModalityNet.com数据平台,一次性推出HiPHI-MOV、HiPHI-OM与ITW三大核心数据集。这套基础设施本质上就是为具身智能模型——无论是企业研发还是学术探索——量身打造的“数据粮仓”,为机器人训练数据需求提供坚实支撑。

那么,为什么具身智能需要一套全新的数据基础设施?如果大语言模型学习的是人类语言与知识体系,具身智能学习的则是人类与物理世界交互的实践经验。支撑其发展的机器人训练数据,不能仅仅依赖视频或文本——动作轨迹、视觉感知、力/触觉反馈、深度信息、物体状态、场景结构,再加上环境上下文,这些多维度信息必须深度融合,才能形成完整的“经验包”,满足高质量数据集的标准。
长期以来,人工智能领域最稀缺的就是这类高质量数据,尤其是那些带有物理对齐信息的多模态数据,更是不可多得的资源。这在很大程度上制约了整个具身智能赛道的前进步伐,凸显了数据基础设施建设的重要性。
针对这一痛点,诺亦腾机器人推出了面向机器人学习与具身智能研究的四层数据金字塔框架。该框架的逻辑清晰:从底层到顶层,数据的具身特异性逐步降低,但多样性和对真实物理世界的泛化能力持续增强。换句话说,越往上层,数据越“通用”,越能应对真实世界的复杂场景与动态变化,从而提升具身智能模型的训练效果。
具体到数据产能,ModalityNet.com平台给出的数字相当可观:HiPHI-OM数据集预计每年产出5万小时高质量数据,HiPHI-MOV更达到10万小时。而在受控环境之外的ITW数据集,年产能直接飙升至30万小时。这些海量数据覆盖了不同场景与交互方式,为具身智能训练提供了丰富多样的“养料”,助力机器人数据生态的快速发展。
