具身智能全球竞逐 RoboChallenge打造顶尖模型竞技平台_AI热点日报

具身智能全球竞逐 RoboChallenge打造顶尖模型竞技平台

类型：热点整理2026-05-20

全球首个大规模具身智能真机评测平台RoboChallenge，通过数万次标准化真机测试与权威评测，已获得行业广泛认可，成为衡量具身智能模型物理实操能力的核心标准。近日，该平台迎来新一轮生态扩容。星动纪元、极佳视界、地平线、光轮智能、生数科技、中移杭研、长虹、算力自由等8家领先企业正式入驻，覆盖从底

全球首个大规模具身智能真机评测平台RoboChallenge，通过数万次标准化真机测试与权威评测，已获得行业广泛认可，成为衡量具身智能模型物理实操能力的核心标准。

近日，该平台迎来新一轮生态扩容。星动纪元、极佳视界、地平线、光轮智能、生数科技、中移杭研、长虹、算力自由等8家领先企业正式入驻，覆盖从底层算力、仿真环境到机器人硬件、核心算法的全产业链。此举标志着一个开放协同的标准化具身智能产业生态正在加速形成。

同时，平台核心评测任务集也完成重要升级。今年3月推出的Table30 V2版本，更加聚焦真实世界应用场景，全面提升了任务复杂度与评测标准，旨在以更高要求推动具身智能技术的实际落地与快速迭代。

18家具身顶尖势力集结，RoboChallenge 打造全球最大具身模型竞技场

破解实验室困境：RoboChallenge构筑真实物理世界评测场

具身智能要实现实质性突破，仅靠模型能力提升远远不够。统一的评测基准、高质量的数据集以及真实物理环境的闭环验证，才是技术成熟的关键。过去，行业常面临精心剪辑的“演示视频”与难以复现的技术展示，而标准化真机测试环境的缺失，严重阻碍了技术的规模化应用。

为打破这一僵局，由Dexmal原力灵机与Hugging Face联合发起的RoboChallenge应运而生。作为一个开放式基准测试平台，RoboChallenge集成了UR5、Franka Panda、Aloha、ARX-5等多款主流机器人本体，首创了大规模远程真机评测机制。其最初发布的Table 30任务集，精心设计了30个日常物品操作任务，为众多视觉语言动作模型提供了统一的性能“试金石”。

经过持续运行，该平台的规模与影响力已显著提升。最新数据显示，平台累计完成的真机测试次数已突破4万次。从任务提交、真机调度、日志记录到结果发布，已形成完整的自动化评测闭环，为深度技术分析与模型优化奠定了坚实的数据基础。不仅吸引了大量国内开发者，来自美国、新加坡、日本、阿联酋等国家的顶尖科研团队也纷纷加入，RoboChallenge的国际化开发者社区正日益活跃。

平台的生态扩张早有布局。早在2025年11月，RoboChallenge便携手Hugging Face、智源研究院、智元机器人等首批顶尖机构成立了联合组委会。此次8家新伙伴的加入，将从评测标准、仿真基建、算力硬件三大核心维度，为这座“真实世界考场”注入更强大的基础设施能力。

夯实基础：构建行业“标尺”与强化算力硬件双引擎

在具身智能赋能千行百业的前夕，两项工作至关重要：一是建立公正、权威的行业评测标准；二是提供充沛、可靠的底层算力与机器人硬件支持。

在机器人本体与端到端算法协同方面，星动纪元与生数科技将提供关键支持。星动纪元表示，将提供其领先的灵巧手及机器人整机方案，并共同参与评测体系设计，目标是共建一个公允的具身智能能力评估框架，为技术演进提供清晰指引。

生数科技计划向RoboChallenge线下实验室捐赠机器人硬件与计算资源，并贡献其在三维视觉理解、场景重建、世界模型与端到端控制算法方面的前沿研究成果。其开源的世界模型Motus，在关键指标上相较于国际先进模型实现了约40%的成功率提升。借助RoboChallenge提供的多任务真实物理环境，生数科技旨在加速其技术从研究向实际应用转化。

同样聚焦基础设施建设的还有算力自由。该公司正式加入生态，核心目标是为社区内的企业及开发者提供稳定、高性能的算力资源，全面加速仿真训练、策略学习与大模型训练等关键研发流程，从而显著提升整个领域的创新效率。

跨越仿真到现实鸿沟：定义下一代仿真评测基准

如何让仿真环境无限逼近真实物理世界的复杂性，是降低测试成本、实现技术快速规模化验证的核心挑战。此次入驻的企业中，便有专注于攻克此难题的关键力量。

作为全球具身智能数据领域的领先者，光轮智能宣布将联合平台打造基于RoboFinals的Table 30高保真仿真评测基准。其核心是依托其首创的“求解-测量-生成”三位一体仿真技术，构建数据与仿真的底层基础设施。具体而言，光轮智能将交付一套完整、可复用的Table 30仿真套件，包含高物理真实度的数字孪生资产、参数化任务生成系统及自动化评测工具，旨在为行业建立泛化性强、一致性高的仿真评测基线。

顺应技术演进：持续推动测试基准创新与拓展

评测基准本身也必须紧跟技术发展趋势。地平线机器人实验室具身操作团队负责人林天威指出，当前许多基准测试对自然语言指令的响应评估较弱，难以全面衡量模型的指令理解与跟随能力。为此，地平线计划于2026年6月在RoboChallenge平台上线发布AnyMove仿真基准及其配套数据集，旨在更系统、更精细地评估视觉语言动作模型的复杂指令跟随与灵巧操作能力。

而长期深耕世界模型技术的极佳视界，则提出了一条颇具创新性的评测路径。其首席科学家朱政表示，他们计划推动RoboChallenge基准持续进化，创造性地将“世界模型”作为智能评估者引入评测体系。这种方法有望部分替代耗时的真机测试，开辟出介于传统仿真与纯物理测试之间的第三条高效评测路径，加速模型迭代。

深耕复杂场景：从单一任务演示走向长程真实服务

具身智能要真正服务于人类社会，必须走出“桌面操作”的局限，勇敢挑战复杂的家庭与商业服务场景。

针对家庭服务机器人数据稀缺的痛点，由长虹牵头建设的四川省具身智能机器人训练场正式加入。其研发负责人贾澜鹏介绍，他们将联合设计并发布居家场景基准测试集。该项目将1:1复刻真实住宅样板间，搭建包含客厅、厨房、卧室的实景物理环境及高还原度虚拟仿真环境。计划在2026年底前，产出高达数百小时的真机操作示范数据，覆盖家电操控、衣物整理等多样化日常任务，为平台贡献一个大规模、高价值的家庭场景基准体系。

中移（杭州）信息技术有限公司则将焦点对准商业潜力巨大的无人化餐饮场景。其技术负责人赵永生表示，中移杭研不仅将于今年6月开源一个能兼容多种模型与异构机器人的异步推理软件框架，还计划在7月发布面向餐厅场景的基准测试集Star-Chef v1.0，包含烤制面包、倾倒饮品等任务，旨在助力算法团队攻克长时序任务规划与执行的难题。

生态共荣：协同突破具身智能落地“最后一公里”

RoboChallenge组委会的持续扩容，清晰地揭示出具身智能产业发展的新范式：当技术探索进入深水区，单点突破的时代已经过去，产业链上下游的开放协同与生态共建，才是通向规模化应用的必经之路。

一个权威、公正的评测体系，本质上扮演了产业的“连接器”与“公共基础设施”。它向下整合了底层算力与机器人本体，向上滋养了前沿算法模型与广大开发者社区，向外则直接对接未来家庭、商业、工业等海量真实应用需求。从初期的数十个桌面任务，到如今涵盖高保真仿真、长程家庭服务乃至无人商业操作的庞大任务矩阵，RoboChallenge正快速构建起支撑整个具身智能领域向前发展的“基石”。

正如平台组委会所强调，第二批生态伙伴的加入仅是开端。其终极愿景是与全球社区携手，通过维护这个真实、严谨且开放的“竞技场”，持续降低技术验证与迭代的门槛，让每一次算法在物理世界中的尝试——无论成功与否——都转化为推动工程进步的阶梯。唯有通过这样的集体努力，才能共同推动具身智能突破从演示到实用、从实验室到真实世界的“最后一公里”，最终在物理世界中创造切实、普惠的价值。

来源：https://www.qbitai.com/2026/04/402186.html

具身智能原力灵机

延伸阅读

补充最近整理过的热点入口。