2026年6月5日,全球机器人领域的顶级盛会——ICRA(国际机器人与自动化会议)在奥地利维也纳圆满落幕。在这场备受瞩目的学术会议之外,由智元机器人主办的“2026智元世界挑战赛”也同期收官。不同于传统的实验室环境,本次挑战赛的实战考场直接设在了维也纳的酒店和商超之中。
这场机器人大赛吸引了来自27个国家和地区的526支队伍同台竞技。在“推理—操作”、“世界模型”、“全身控制”这三大技术赛道中,中国参赛团队凭借过硬实力,一举包揽了所有项目的冠军。值得关注的是,这是ICRA体系下最具权威性的具身智能国际赛事之一,而本次比赛的“出题方”首次由一家上海企业来担任——这意味着,比赛的规则与评判标准,全部由中国企业制定。智元合伙人、高级副总裁姚卯青明确表示:希望通过这场挑战赛,推动整个行业形成更多的技术共识与统一标准。
中国队摘得全部桂冠
作为机器人领域公认的顶级学术会议,ICRA今年首次将“智元世界挑战赛”纳入体系,并创新性地采用了“线上自动化测评+线下真机决赛”的组合模式。参赛阵容堪称全明星级别:中国科学院、清华大学、中国科学技术大学等国内一线科研团队悉数登场,同时还有加州大学圣迭戈分校、俄罗斯Sber机器人研究中心等海外知名机构,以及阿里巴巴、高德、vivo、小米等产业界队伍同场竞技。最终,超过100支参赛队伍成功突破了最新设定的技术基准线。

精灵G2是本次挑战赛的指定参赛机器人。
三条赛道分别对应了当前具身智能领域最具挑战性的三大核心技术方向。
第一条“推理—操作”赛道,主要考察机器人能否理解一句开放式指令,并在此基础上自主规划步骤、动手完成任务。在维也纳的线下决赛中,参赛队伍利用各自编写的代码驱动智元自研的“精灵G2”人形机器人,在真实场景中依次完成四个任务。最终,vivo旗下团队凭借绝对优势摘得冠军,上海萝博派对获得亚军,俄罗斯的GreenVLA团队位列季军。
第二条是世界模型赛道。世界模型可视为机器人的“物理直觉系统”——例如,它能预判一个杯子被推动后是否会倾倒,或是在抓取物体落空时会如何反应。在该赛道上,中科院自动化所与高德联合团队夺得冠军,中科院工业人工智能研究院团队与中国科学技术大学团队分获亚军与季军。
第三条为全身控制赛道,由智元与原力灵机联合打造,是行业首个面向真实商超场景的全链路决策评测项目。面对高低错落的货架与随意摆放的商品,机器人需要自主完成导航、取货、行走及上架等步骤,全程一气呵成。最终,小米机器人团队以99.2的综合得分和高达94%的任务成功率捧得冠军。为此,雷军还亲自在社交平台上表达了祝贺。
打破“唯分数论”的桎梏
回顾过去几年,具身智能领域一直受到“刷分打榜”现象的困扰。各家机构各自为战,使用不同的仿真平台、自行设计的任务以及差异化的评分标准,使得外界很难客观比较不同算法的真实优劣。
“传统的校园赛和纯仿真赛往往缺少真机验证环节,其评测结果与产业实际部署的相关性十分有限。”智元精灵业务部生态及解决方案总监沈咏剑指出,智元世界挑战赛另辟蹊径,通过“线上自动化测评+线下真机决赛”的两段式赛制来打破困局。线上阶段依托智元自研的EWMBench和Genie Sim Benchmark两套评测基准,实现了流程自动化、指标标准化以及结果的可复现性。线下阶段则将所有参赛团队汇集到维也纳,使用同一台精灵G2人形机器人,在同一套真实场景中进行验证,最大限度地排除了硬件差异带来的干扰。

国产机器人亮相维也纳街头。
考题的难度也随之显著提升。以“推理—操作”赛道为例,以往多数比赛仅考查“机器人能否精准完成某个动作”,而今年的比赛则细化为“环境理解—任务规划—动作执行”的完整链条。这要求机器人在面对从未见过的物品和从未演练过的环境时,依然能够稳定完成复杂的操作任务。
“传统世界模型评测习惯于使用理想化的仿真数据,轨迹整齐、物理环境规整。本次挑战赛却特意加入了‘空抓’‘碰抓’‘掉落’等真实操作中常见的失败动作。”沈咏剑向记者解释,现实世界中的机器人必然会犯错,关键在于让机器人在不完美的数据中依然能“看懂”物理规律,将世界模型测评真正拉回到贴近现实的环境中来。
相比之下,“全身控制”赛道的评测方式更为直接:直接把真实的商超场景搬到考场,采用远程直连模式,完全依靠参赛团队的代码驱动机器人完成实测,全程由机器人独立自主地完成移动、取货与放置操作,彻底告别了传统的“单一抓取”测试模式。
综合来看这些规则设计,不难发现智元挑战赛正努力打破“唯分数论”的旧有格局。姚卯青表示:“我们希望借助赛事的力量,推动行业形成‘可验证、可落地’的技术共识,让具身智能技术能真正走进现实世界。”
率先搭建评测参照系
值得特别注意的是,作为赛事的主办方,智元并未下场参赛。它扮演的角色是纯粹的“出题人”。
在本届挑战赛中,智元同步推出了Genie Sim 3.0仿真平台与“智元世界开源数据集”。这些资源结合统一的真机硬件平台,共同构成了“数据集+仿真平台+硬件真机”的全链路技术体系。以“智元世界开源数据集”为例,其内置了由10个不同任务组成的训练集,涵盖超过3万条真实轨迹,覆盖抓取、放置、推、拉等多种机器人与环境交互的类型。测试集中不仅包含专家轨迹,也包含了空抓、碰抓、掉落等不完美动作轨迹,使评测更贴近真实应用场景。

智元成为挑战赛的“出卷人”。
“一场大赛的标准能否被行业广泛采纳,取决于几个关键条件:标准本身能否随场景复杂度的提升而持续迭代,能否吸引更多独立机构基于此标准开展研究,以及产业方是否认为其评测结果对实际部署决策具有参考价值。”业内人士向记者分析,本次挑战赛传递出一个积极信号——阿里巴巴、高德、vivo等产业方纷纷组队参赛,说明这套评测框架被认为与实际业务场景存在紧密关联,而不仅仅是停留在学术考核层面。
产业界有一句通俗的说法:三流企业做产品,二流企业做品牌,一流企业做标准。从本届赛事来看,智元机器人正积极争夺具身智能评测标准的话语权。通过ICRA这一顶级学术会议的国际背书,智元推出了两套自研评测基准,而ICRA的学术权威性也确保了这些标准在国际研究社区中具备较高的认可度。
目前,具身智能评测的标准化工作仍处于早期阶段,国际上也有其他团队在推进各自的标准化方案。沈咏剑表示,智元通过这场挑战赛率先搭建了一个国际评测参照系,未来有望通过更多独立机构的验证和反馈,逐步发展成为行业的通用尺度。
原标题:《机器人挑战赛维也纳揭榜,中国团队包揽冠军,上海机器人首次成为“出卷人”》
栏目主编:李晔
