2026年6月3日,智元重磅开源AGIBOT WORLD 2026数据集第二期,主题定为“多样交互”(Rich Interaction)。这并非一次寻常的数据集更新——作为行业首个聚焦物理交互的开源具身数据集,它直接服务于世界模型、神经仿真器、物理感知与表征学习等前沿研究。简而言之,此次发布不只是教机器人“如何正确操作”,更要让它深刻领悟“真实世界对动作的实时反馈机制”。
该数据集现已于Hugging Face平台开放下载。许多开发者还记忆犹新,智元此前刚发布了以“模仿学习”为主题的第一期数据集,当时重点集中于专家示范与成功轨迹。第二期的转变则十分显著:数据构建从“标准剧本”演进至更复杂、更不确定、更贴近物理世界本质的交互学习阶段。其背后的核心理念是什么?——如果机器人始终只学习成功案例,那么它将永远只能在温室中成长。
长期以来,具身智能数据集主要围绕标准任务、专家示范与成功案例进行构建。然而,真实世界绝非理想、稳定、可控的实验环境。机器人一旦步入真实场景,便会面临抓取失败、物体滑落、意外碰撞、液体飞溅、布料变形等挑战——这些对人类而言不过是日常习以为常的现象,对机器人而言却是理解接触、摩擦、重心、形变与反馈等物理规律的绝佳学习机会。遗憾的是,过去这些“意外”常被作为无效数据丢弃。
这一次,智元选择了逆向思考。AGIBOT WORLD 2026第二期“多样交互”数据集,正是为补齐世界模型训练中长期缺失的真实物理交互拼图而生。与传统数据集仅关注“成功示范”的采集逻辑不同,此次智元主动保留并突显非理想行为的研究价值。该数据集基于100%真实场景采集,系统性地记录了机器人与不同材质、形态与结构物体之间的丰富物理互动——成功与失败、预期与意外、稳定与混沌,尽数收录。其目标十分明确:为世界模型提供更贴近真实世界运行规律的数据基础,推动机器人从“学会如何完成任务”向“理解动作如何改变世界”跃迁。
这些过去常被视作“失败”或“噪声”的数据,如今正成为世界模型研究中不可多得的宝贵资产。道理并不复杂:若训练数据仅包含标准动作与成功示范,模型极易陷入对成功状态的机械拟合。一旦面临罕见动作、复杂接触或非理想情况,模型往往难以准确预测真实世界中的失败分布与物理演化。唯有通过足够丰富的成功与失败过程训练,模型才能更逼真地模拟未来场景,减少违背物理规律的离谱预测。
智元在实验中证实,基于其世界模型仿真器Genie Envisioner-Sim 2.0,多样交互数据与失败数据对提升Action-Conditioned World Model的建模能力具有显著价值。与仅依赖成功示范训练的模型相比,纳入更丰富的动作分布、接触过程及非理想交互结果,能够帮助模型更精准地理解“动作如何改变世界”,同时提升未来状态预测的物理一致性。
此次数据集的发布,标志着具身智能数据建设正迈入全新阶段。过去,机器人更多是在学习“如何成功执行动作”;如今,它需要进一步掌握对世界的建模能力——“真实世界如何回应动作”。从成功到失败,从动作到反馈,从任务完成到世界理解,AGIBOT WORLD 2026正在为下一代世界模型、机器人学习与物理智能研究构建更完善的底层基础设施。可以预见,随着更多研究者加入探索,这些真实交互数据将加速整个领域的演进。
