智元世界模型登顶全球权威榜单，仿真大脑进入关键期

时间：2026-05-30 17:29

最新动态：全球具身智能领域的权威评测平台WorldArena，近日发布了最新一轮评测结果。如果用一句话形容此次夺冠——那就是“意料之外，情理之中”。智元机器人自主研发的世界模型Genie Envisioner-Sim 2 0（以下简称GE 2 0），在Track1（世界模型感知与动作响应赛道）中一举

最新动态：全球具身智能领域的权威评测平台WorldArena，近日发布了最新一轮评测结果。如果用一句话形容此次夺冠——那就是“意料之外，情理之中”。智元机器人自主研发的世界模型Genie Envisioner-Sim 2.0（以下简称GE 2.0），在Track1（世界模型感知与动作响应赛道）中一举夺得总分第一，成功超越BWM-Fast、SparkWorld等国内外知名团队。

从行业视角分析，这不仅标志着智元在“机器人大脑”核心技术上的重要突破，更释放出一个清晰信号：具身智能正从实验室的“演示阶段”加速迈向真实场景的“大规模落地应用”。

先来了解WorldArena的背景。它由清华大学联合普林斯顿大学、北京大学、新加坡国立大学等8所全球顶尖学术机构共同研发，专门用于对“具身世界模型”进行评分与排名——可以将其理解为具身智能领域最具含金量的“考试”或“奥林匹克赛场”。

榜单主要分为两个赛道：一个是评估生成视频真实度的“视频感知质量”赛道；另一个是直接考核模型在真实机器人任务中实用性的“具身任务功能性”赛道。智元夺冠的Track1，聚焦于具身智能最核心的“认知与行动”闭环——这被业界视为衡量通用人形机器人智能化水平的“关键标尺”。

值得关注的是，此次夺冠的GE-Sim 2.0并未针对赛题进行特殊优化，仅基于榜单数据做了基础微调。这种“轻装上阵”却能拔得头筹的结果，恰恰证明其技术基础具备强大的通用适配能力。

那么，GE 2.0究竟实现了哪些突破？核心在于它完成了从“感知预测”到“仿真进化、自主决策”的闭环升级。技术报告指出，模型在长时序推演、多视角生成、本体状态建模等多个环节构建了完整的能力矩阵：例如在连续40到50秒的长视频推演中，画面质量衰减远低于行业基准——这意味着它构建了一个极其逼真且稳定的虚拟环境。更重要的是，通过闭环评测验证，模型与真实世界的任务成功率保持了极强的相关性，其混淆矩阵分析进一步证明了它作为策略评测器的可靠性。

简而言之，GE 2.0不仅能生成“看起来真实”的虚拟场景，更能让机器人在这个“数字训练场”中放心大胆地试错与迭代。实验数据表明，模型通过奖励机制筛选出的有效数据，已帮助策略模型在多项任务中实现了性能的显著提升——这为机器人从虚拟仿真到物理落地的“最后一公里”提供了坚实的技术支撑。

回到行业层面，未来的竞争核心恐怕不再是单一模态的性能参数比拼，而是技术闭环的完整度以及产业落地的适配性。智元在WorldArena的胜出，本质上是其“全功能世界模拟器”技术路线的胜利——当机器人能在虚拟世界完成经验积累与动态试错时，真实场景的规模化部署才真正具备经济上的可行性。

来源：https://www.163.com/dy/article/KU6FA4RP05129QAF.html

世界模型