


近日,具身智能领域权威评测榜单WorldArena Track1(世界模型感知与动作响应赛道)揭晓最新排名。智元自主研发的通用世界模型Genie Envisioner-Sim 2.0(简称GE 2.0),凭借综合能力的显著优势,成功摘得该赛道综合排名桂冠。
在评估人形机器人智能化水平时,本次评测重点考察模型的环境感知、逻辑认知与动作响应等基础核心能力。值得关注的是,智元采用的原生版本GE 2.0模型,未针对评测题目进行任何专项定制优化,仅基于公开数据完成基础微调。在通用状态下取得如此成绩,充分验证了模型的通用性与适配能力。当前行业技术迭代加速,赛道热度持续攀升,而智元坚持深耕底层技术积累,稳步打磨具身世界模型的基础能力——此次榜单成绩,正是长期专注基础研发的阶段性成果体现。
根据技术报告,相较于上一代产品,GE 2.0不仅实现了单点性能提升,更重要的是完成了整体能力体系的系统性升级。它构建了功能完备、稳定性更强的世界模拟能力,能够生成动态、可迭代的虚拟仿真场景,支持机器人在虚拟环境中自主推演、试错学习与经验积累。这使得真实场景的调试成本显著降低,算法迭代效率大幅提升,最终实现了从基础感知预测到仿真推演、再到自主决策的完整技术闭环。
在功能体系建设上,GE 2.0补齐了多项关键能力,全面覆盖长时序内容生成、多视角场景构建、本体状态模拟、近实时推理、奖励判别等核心模块,形成完整的世界模拟器技术闭环,能够适配多种机器人训练与仿真需求。
长时序推演一直是行业技术难题,新版模型在此方面稳定性显著提升。在数十秒级的连续推演任务中,画面与场景逻辑的衰减程度远优于行业基准方案。即便持续推演40至50秒,整体生成效果依然优于基线模型短时间推演的表现。这意味着GE 2.0能够更好地支撑机器人连续作业、长周期决策等应用场景。
为验证仿真效果的真实性,研发团队进行了多维度闭环对比评测。大量实验数据表明,GE 2.0模拟的场景与真实物理世界高度相关。评测不仅在宏观维度进行效果对标,还通过逐案例对比、混淆矩阵量化分析,进一步确认了模型仿真结果的可靠性。可以说,它能够客观、精准地支撑机器人策略评测与算法验证工作。
此外,模型还建立了完整的数据回流优化机制。借助奖励模型能力,GE 2.0能够自动筛选仿真推演过程中的高质量有效数据,反向赋能策略模型迭代优化。相关实验结果显示,这套数据闭环机制可以持续提升算法性能,为模型不断进化与能力迭代提供稳定支持。
业内普遍认为,2026年将成为具身智能规模化落地的起步之年。机器人技术正从实验室研发迈向真实场景大规模应用,对算法的稳定性、实用性、落地性提出了更高要求。智元当前聚焦底层技术攻坚与场景价值落地,致力于打通具身智能技术闭环,推动世界模型真正走入真实场景,为人形机器人规模化落地筑牢核心底座。
