具身智能全球竞逐 RoboChallenge打造顶尖模型竞技平台
全球首个大规模具身智能真机评测平台RoboChallenge,通过数万次标准化真机测试与权威评测,已获得行业广泛认可,成为衡量具身智能模型物理实操能力的核心标准。
近日,该平台迎来新一轮生态扩容。星动纪元、极佳视界、地平线、光轮智能、生数科技、中移杭研、长虹、算力自由等8家领先企业正式入驻,覆盖从底层算力、仿真环境到机器人硬件、核心算法的全产业链。此举标志着一个开放协同的标准化具身智能产业生态正在加速形成。
同时,平台核心评测任务集也完成重要升级。今年3月推出的Table30 V2版本,更加聚焦真实世界应用场景,全面提升了任务复杂度与评测标准,旨在以更高要求推动具身智能技术的实际落地与快速迭代。

破解实验室困境:RoboChallenge构筑真实物理世界评测场
具身智能要实现实质性突破,仅靠模型能力提升远远不够。统一的评测基准、高质量的数据集以及真实物理环境的闭环验证,才是技术成熟的关键。过去,行业常面临精心剪辑的“演示视频”与难以复现的技术展示,而标准化真机测试环境的缺失,严重阻碍了技术的规模化应用。
为打破这一僵局,由Dexmal原力灵机与Hugging Face联合发起的RoboChallenge应运而生。作为一个开放式基准测试平台,RoboChallenge集成了UR5、Franka Panda、Aloha、ARX-5等多款主流机器人本体,首创了大规模远程真机评测机制。其最初发布的Table 30任务集,精心设计了30个日常物品操作任务,为众多视觉语言动作模型提供了统一的性能“试金石”。
经过持续运行,该平台的规模与影响力已显著提升。最新数据显示,平台累计完成的真机测试次数已突破4万次。从任务提交、真机调度、日志记录到结果发布,已形成完整的自动化评测闭环,为深度技术分析与模型优化奠定了坚实的数据基础。不仅吸引了大量国内开发者,来自美国、新加坡、日本、阿联酋等国家的顶尖科研团队也纷纷加入,RoboChallenge的国际化开发者社区正日益活跃。
平台的生态扩张早有布局。早在2025年11月,RoboChallenge便携手Hugging Face、智源研究院、智元机器人等首批顶尖机构成立了联合组委会。此次8家新伙伴的加入,将从评测标准、仿真基建、算力硬件三大核心维度,为这座“真实世界考场”注入更强大的基础设施能力。
夯实基础:构建行业“标尺”与强化算力硬件双引擎
在具身智能赋能千行百业的前夕,两项工作至关重要:一是建立公正、权威的行业评测标准;二是提供充沛、可靠的底层算力与机器人硬件支持。
在机器人本体与端到端算法协同方面,星动纪元与生数科技将提供关键支持。星动纪元表示,将提供其领先的灵巧手及机器人整机方案,并共同参与评测体系设计,目标是共建一个公允的具身智能能力评估框架,为技术演进提供清晰指引。
生数科技计划向RoboChallenge线下实验室捐赠机器人硬件与计算资源,并贡献其在三维视觉理解、场景重建、世界模型与端到端控制算法方面的前沿研究成果。其开源的世界模型Motus,在关键指标上相较于国际先进模型实现了约40%的成功率提升。借助RoboChallenge提供的多任务真实物理环境,生数科技旨在加速其技术从研究向实际应用转化。
同样聚焦基础设施建设的还有算力自由。该公司正式加入生态,核心目标是为社区内的企业及开发者提供稳定、高性能的算力资源,全面加速仿真训练、策略学习与大模型训练等关键研发流程,从而显著提升整个领域的创新效率。
跨越仿真到现实鸿沟:定义下一代仿真评测基准
如何让仿真环境无限逼近真实物理世界的复杂性,是降低测试成本、实现技术快速规模化验证的核心挑战。此次入驻的企业中,便有专注于攻克此难题的关键力量。
作为全球具身智能数据领域的领先者,光轮智能宣布将联合平台打造基于RoboFinals的Table 30高保真仿真评测基准。其核心是依托其首创的“求解-测量-生成”三位一体仿真技术,构建数据与仿真的底层基础设施。具体而言,光轮智能将交付一套完整、可复用的Table 30仿真套件,包含高物理真实度的数字孪生资产、参数化任务生成系统及自动化评测工具,旨在为行业建立泛化性强、一致性高的仿真评测基线。
顺应技术演进:持续推动测试基准创新与拓展
评测基准本身也必须紧跟技术发展趋势。地平线机器人实验室具身操作团队负责人林天威指出,当前许多基准测试对自然语言指令的响应评估较弱,难以全面衡量模型的指令理解与跟随能力。为此,地平线计划于2026年6月在RoboChallenge平台上线发布AnyMove仿真基准及其配套数据集,旨在更系统、更精细地评估视觉语言动作模型的复杂指令跟随与灵巧操作能力。
而长期深耕世界模型技术的极佳视界,则提出了一条颇具创新性的评测路径。其首席科学家朱政表示,他们计划推动RoboChallenge基准持续进化,创造性地将“世界模型”作为智能评估者引入评测体系。这种方法有望部分替代耗时的真机测试,开辟出介于传统仿真与纯物理测试之间的第三条高效评测路径,加速模型迭代。
深耕复杂场景:从单一任务演示走向长程真实服务
具身智能要真正服务于人类社会,必须走出“桌面操作”的局限,勇敢挑战复杂的家庭与商业服务场景。
针对家庭服务机器人数据稀缺的痛点,由长虹牵头建设的四川省具身智能机器人训练场正式加入。其研发负责人贾澜鹏介绍,他们将联合设计并发布居家场景基准测试集。该项目将1:1复刻真实住宅样板间,搭建包含客厅、厨房、卧室的实景物理环境及高还原度虚拟仿真环境。计划在2026年底前,产出高达数百小时的真机操作示范数据,覆盖家电操控、衣物整理等多样化日常任务,为平台贡献一个大规模、高价值的家庭场景基准体系。
中移(杭州)信息技术有限公司则将焦点对准商业潜力巨大的无人化餐饮场景。其技术负责人赵永生表示,中移杭研不仅将于今年6月开源一个能兼容多种模型与异构机器人的异步推理软件框架,还计划在7月发布面向餐厅场景的基准测试集Star-Chef v1.0,包含烤制面包、倾倒饮品等任务,旨在助力算法团队攻克长时序任务规划与执行的难题。
生态共荣:协同突破具身智能落地“最后一公里”
RoboChallenge组委会的持续扩容,清晰地揭示出具身智能产业发展的新范式:当技术探索进入深水区,单点突破的时代已经过去,产业链上下游的开放协同与生态共建,才是通向规模化应用的必经之路。
一个权威、公正的评测体系,本质上扮演了产业的“连接器”与“公共基础设施”。它向下整合了底层算力与机器人本体,向上滋养了前沿算法模型与广大开发者社区,向外则直接对接未来家庭、商业、工业等海量真实应用需求。从初期的数十个桌面任务,到如今涵盖高保真仿真、长程家庭服务乃至无人商业操作的庞大任务矩阵,RoboChallenge正快速构建起支撑整个具身智能领域向前发展的“基石”。
正如平台组委会所强调,第二批生态伙伴的加入仅是开端。其终极愿景是与全球社区携手,通过维护这个真实、严谨且开放的“竞技场”,持续降低技术验证与迭代的门槛,让每一次算法在物理世界中的尝试——无论成功与否——都转化为推动工程进步的阶梯。唯有通过这样的集体努力,才能共同推动具身智能突破从演示到实用、从实验室到真实世界的“最后一公里”,最终在物理世界中创造切实、普惠的价值。
相关攻略
全球首个大规模具身智能真机评测平台RoboChallenge,通过数万次标准化真机测试与权威评测,已获得行业广泛认可,成为衡量具身智能模型物理实操能力的核心标准。 近日,该平台迎来新一轮生态扩容。星动纪元、极佳视界、地平线、光轮智能、生数科技、中移杭研、长虹、算力自由等8家领先企业正式入驻,覆盖从底
机器人领域迎来重大突破。高德地图正式宣布,将其自主研发的ABot-M0模型全量开源。根据官方定义,这是全球首个基于统一架构的机器人具身操作基座模型。其核心目标,是构建一个能够适配多种形态机器人硬件的“通用大脑”,从而推动机器人智能化迈入新阶段。 这一构想如何落地?从公开的基准测试成绩来看,ABot-
今天凌晨,机器人领域传来一声惊雷。由Physical Intelligence公司发布的全新VLA模型π0 7,以一种意想不到的方式,为“世界模型”的叙事敲下了一记重锤。 它的突破点在于,首次在机器人领域实证了组合泛化能力。简单来说,当面对一个全新任务时,这个模型能够像搭积木一样,组合运用过去学过的
继一个月前宣布将建成全球最大具身数据采集中心、助力万亿机器人产业生态后,京东在具身智能领域再有重磅进展。4月16日,在京东具身智能生态发布会上,京东全球首次推出覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施体系,自研的超高清采集终端JoyEgoCam、具身大模型JoyAI-RA以及具
在过去的两年中,AI行业普遍信奉一个增长公式:更多的数据、更大的模型,便能带来更强的能力。这套逻辑在语言模型领域取得了显著成效。然而,当人工智能从数字世界迈向物理现实,当机器人需要实际执行抓取、操作等任务时,一个根本性的前提问题凸显出来——如果训练数据所基于的物理规律本身就不准确,那么盲目地扩大数据
热门专题
热门推荐
人工智能的浪潮正席卷每个角落,智能办公工具无疑是其中备受瞩目的弄潮儿。以自然语言处理和机器学习为内核的AI文档助手,承诺用高效与精准重塑我们的文字工作。但一个值得玩味的问题随之浮现:它究竟是一场碘伏传统的革命性创新,还是更像一位得力的职业伙伴? AI文档助手的革命性创新 不得不说,AI文档助手的出现
2026年5月13日至14日,备受瞩目的Create 2026百度AI开发者大会将在北京隆重举行。本届大会以“万物一体”为核心主题,并实现了一项重要升级:首次将“Create百度AI开发者大会”与“云智大会”全面合并。此次整合旨在为参会者提供一站式、全景式的洞察体验,无论是关注AI基础设施的企业决策
雷蛇与《鸣潮》联名的达妮娅主题外设系列将于2026年5月20日推出,涵盖无线鼠标、机械键盘、电竞椅和超大鼠标垫四款产品。系列兼顾轻量化设计、高性能硬件与角色主题元素,致力于为玩家打造兼具操作性能与沉浸氛围的全方位游戏体验。
《极限竞速:地平线6》登陆Xbox与PC平台,首次将舞台设定于日本。本作画质显著提升,以丰富细节呈现东京霓虹、樱花林与山间晨雾。玩法上重构开局身份,玩家需从普通访客逐步成长为传奇车手,并引入庄园系统与探索乐趣。游戏对硬件性能要求较高,但借助DLSS4等技术可实现画质与流畅度的平衡。
人工智能正改变传统表格制作方式,通过自然语言指令自动生成表格与图表,显著提升工作效率。人机协作虽带来便利,确保数据准确性仍是关键。未来更智能的预测功能值得期待,但使用者仍需掌握数据分析基本功,以充分释放数据价值。





