游乐游手机版
首页/科技数码/文章详情

20亿参数小模型超越英伟达旗舰,上海世界模型裸考登顶国际榜单

时间:2026-05-31 13:46
智元机器人自研世界模型GE2 0在全球评测基准WorldArena“感知与动作响应”赛道夺冠。仅20亿参数即超越英伟达等旗舰模型,且未专门优化。其长时序推演能力显著,模拟结果与真实世界高度一致,具备自我进化机制。



AI领域又迎来一个令人瞩目的新动向。

5月30日,智元机器人正式发布重大成果——其自研世界模型GE 2.0,在全球世界模型评测基准World Arena的“感知与动作响应”榜单中,一举夺得榜首位置。

先来聊聊世界模型到底是什么。通俗来说,它就是能够理解物理世界运行规律的大模型。举个例子,如果机器人掌握了这项能力,它会知道杯子掉落会破碎、水总会往低处流动、积木堆叠太高会倒塌——这些都是非常基础的常识性认知。

这个World Arena评测体系来头颇大。由清华大学联合普林斯顿大学、香港大学、北京大学等8所全球顶尖高校共同打造,专门用于评估世界模型的综合能力。它设有“感知与动作响应”和“数据引擎”两大赛道,通过16项细致指标和3类实操任务,考核具身智能体对物理规律、三维空间感知、动作预判等方面的理解水平。其学术公信力和产业参考价值都相当突出。

本次智元GE 2.0参与的是“感知与动作响应”赛道,同台竞技的对手包括英伟达的最新模型DreamDojo、清华大学与斯坦福大学联合的Ctrl-World团队等——都是国内外AI领域的顶尖力量。最终,GE 2.0直接拿下冠军。


GE 2.0在多项评测指标上均处于领先位置。

从公开的技术文档来看,有几个关键点特别值得关注。GE 2.0仅使用了20亿参数(即2B规模),但其表现竟然超越了英伟达、微软等公司那些超大参数的旗舰模型。这再次印证了一个事实:在人形机器人应用领域,轻量化模型完全具备与超大参数模型抗衡的实力,甚至在适配性方面更具优势。

更令人意外的是,智元团队并未针对本次比赛进行任何专门优化。他们只是将通用版本的模型稍作调整就送上了赛场——用通俗的话讲,这就是“裸考”拿到冠军。这也充分说明GE 2.0本身具备极为强大的泛化能力。

那么,GE 2.0的核心优势究竟体现在哪里?关键在于,机器人可以在自己的“大脑”中构建一个虚拟场景,并在其中反复尝试各种动作行为,即便出错也不会对真实物品造成损坏。等到技能训练成熟后,再迁移到现实世界中应用。这就像一个既安全又节省成本的模拟训练场,能够显著加快学习速度。

技术文档中还列出了GE 2.0的几项关键升级:长时序推演能力迈上了新台阶、引入了数据回流反哺机制、与真实世界的一致性得到了大幅提升。


智元GE 2.0的技术架构示意图。

很多世界模型都存在一个老问题——预测时间一长,画面就开始变得模糊、变形,就像人做梦一样,时间越久越偏离现实。GE 2.0虽然也无法完全杜绝这一现象,但其画面清晰度下降的速度远低于同类模型。凭借长时序推演能力的突破,GE 2.0预测到50秒的场景时,画质甚至比不少模型前10秒的效果还要出色。

研发团队还进行了大量的对比测试,结果显示:GE 2.0模拟出的结果与真实世界中的表现高度吻合。不仅是整体成功率能够对应得上,团队还逐一案例进行详细比对,并通过数据图表严格验证了这一结论。这意味着什么?机器人在虚拟世界中学会的技能,拿到现实环境中大概率可以直接使用。

此外,GE 2.0内部还内置了一个“裁判”系统,能够自动判断每一次虚拟练习的质量高低,然后将优质经验筛选出来,反馈给机器人的“行动大脑”,帮助它学得更快。实验数据表明,这种“自我进化”机制确实让机器人处理多重任务的能力得到了进一步增强。

话说回来,GE 2.0并非孤立存在的技术。它实际上是智元从具身数据到智能体平台的全栈自研体系中的一环。

4月中旬,智元上线了全球首个覆盖具身智能全域研究的真实场景数据集AGIBOT WORLD 2026,100%采集自商业空间、酒店、商超等真实环境。随后,Genie Sim 3.0仿真平台发布,只需一句话即可生成虚拟世界,环境构建速度从小时级直接缩短到分钟级。再结合VLA基座大模型GO-2和世界模型GE 2.0,一个可交互、可训练、可评估的虚拟物理世界就此搭建完成。

在数据和仿真的基础打好之后,智元又推出了零代码应用平台Genie Studio Agent——精灵工作室智能体。这个平台将视觉感知、运动控制、导航规划、视觉语言行动模型、强化学习工具链等复杂能力,全部封装成开箱即用的解决方案。

基于这套全栈自研系统,普通用户只需在该平台上进行简单的拖拽操作,就能搭建出属于自己的机器人应用。

来源:https://www.163.com/dy/article/KU75RG95055040N3.html
上一篇苹果新Beats头戴耳机曝光 亚马尔率先佩戴 下一篇5月与1-5月ETF资金榜图解
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
经典燃油马自达MX-5终章将至,纯电能否续写操控传奇
科技数码 · 2026-07-01

经典燃油马自达MX-5终章将至,纯电能否续写操控传奇

在SUV持续升温与电动化转型的双重冲击下,马自达MX-5依然保持着旺盛的生命力。然而,这款经典双座敞篷跑车的燃油时代即将迎来终局。根据马自达澳大利亚分公司负责人维内什·宾迪透露,公司高层已确认全新一代MX-5正处于研发阶段,但这极有可能成为马自达品牌旗下最后一款搭载内燃机的跑车。 现款ND世代MX-

燃油马自达MX-5最后一代纯粹驾驶乐趣即将停产
科技数码 · 2026-07-01

燃油马自达MX-5最后一代纯粹驾驶乐趣即将停产

在跑车市场遭遇SUV热潮与电动化转型的双重冲击下,马自达MX-5这款经典敞篷跑车正站在一个关键的十字路口。据马自达澳大利亚分公司负责人维内什·宾迪透露,公司高层已确认全新一代MX-5正在研发中。但一个令人既期待又感慨的信号是——这很可能成为该系列最后一代搭载内燃机的车型。 现款ND世代MX-5自20

中车大连公司亮相第四届链博会彰显硬核实力
科技数码 · 2026-07-01

中车大连公司亮相第四届链博会彰显硬核实力

近期,一则引发社会广泛关注的新闻事件吸引了各界目光。其中,半岛晨报与39度视频的报道尤为突出,首席记者赵晖深入一线,为公众带来了第一手的现场实况。 事件发生在城市核心繁华区域,涉及多方利益,局面较为复杂。赵晖接到采访任务后,迅速抵达现场,与各方进行了深入交流与采访。凭借敏锐的新闻洞察力和扎实的采编能

全新宝马X5外观大改 取消分段式尾门 创新还是遗憾
科技数码 · 2026-07-01

全新宝马X5外观大改 取消分段式尾门 创新还是遗憾

宝马近期在美国纳什维尔举办了一场备受瞩目的经销商新品品鉴会,一次性展示了宝马、MINI、劳斯莱斯三大品牌的十余款重磅新车。其中,全新一代X5和X7的实车首次向经销商公开亮相,迅速引发了业内对下一代设计语言的热烈讨论。 据现场消息称,新款宝马X5的设计几乎属于推倒重来。车头部分直接移植了与第二代iX3

Syntec Optics获美军下一代AR眼镜光学订单
科技数码 · 2026-07-01

Syntec Optics获美军下一代AR眼镜光学订单

据6月30日消息,高精度光学器件制造商Syntec Optics近日获得一批美军采购订单,具体金额未对外公开。该公司计划对今年年初推出的防弹光学产品线进行模块化升级与产能扩充,目标是为下一代军用AR可穿戴设备提供定制化的光学解决方案。 此次定制的光学镜片,不仅要保护内部精密光学元件免受战场环境损伤,