近日,具身智能领域传来重要动态——世界模型权威排行榜WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果正式揭晓。一支中国科研团队自主研发的世界模型Genie Envisioner-Sim 2.0,以68.26分的优异成绩斩获榜首,紧随其后的是BMW-FAST与SparkWorld,分别位列第二和第三,BetaBMW则排名第四。

这支团队来自中国智元,其自主研发的Genie Envisioner-Sim 2.0,是在原生世界模型GE 2.0的基础上,利用榜单数据进行底层微调而成。从技术维度来看,该世界模型具备多项关键能力:长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别。换言之,它不仅能实现视觉感知与逻辑推理,还能对机器人的行为进行质量评估与判别。
更值得关注的是其长时序推演能力。随着推理时间的延长,画面质量并不会像行业基线方案那样迅速退化。在多项任务测试中,模型输出与真实世界的相关性保持高度一致,这意味着它能够在闭环评测的rollout过程中智能筛选有效数据,进而将高质量内容精准反馈给策略模型。这相当于为机器人的“大脑”持续提供高品质的“想象素材”,使其学习效率更高、准确性更强。
2026年被业界普遍视为具身智能从实验室迈向真实场景的“部署态”元年。人形机器人开始规模化落地,真正承担生产力角色,这对算法的性能提出了前所未有的挑战。

回到赛道本身。“世界模型感知与动作响应”评测聚焦于具身智能最核心的“认知与行动”能力。该评测从通用人形机器人智能化水平的根本出发,通过视觉质量、运动质量、内容一致性、物理遵循度、3D准确性及可控性等多个维度进行综合评估。本届榜单的结果,充分体现了世界模型技术路线在具身智能领域的巨大潜力。
正如业内分析所言,中国团队持续迭代世界模拟器技术体系,正逐步打通具身智能的完整技术闭环。让世界模型真正融入真实场景,为人形机器人的规模化落地筑牢底层技术基础——这一目标已展现出实质性进展。
