2026年6月1日至5日,全球机器人技术与自动化领域最具影响力的国际会议之一——ICRA 2026,将在奥地利维也纳盛大举行。在这场汇聚顶尖科研机构、前沿开发者及产业生态伙伴的盛会上,一个值得关注的现象正逐渐明朗:具身智能的落地路径,正从“展示技术实力”转向“真正解决实际问题”。
今年,艾欧智能将再次亮相ICRA 2026(展位号Booth#106),并作为第二届WBCD(What Bimanuals Can Do)挑战赛的合作支持方,为赛事提供关键的数据支撑与生态协作。
WBCD挑战赛:从跨国遥操作迈向真实任务数据开放
WBCD赛事是什么?
WBCD,全称为“What Bimanuals Can Do”,是基于ICRA平台打造的双臂机器人挑战赛。赛事的定义非常明确:
“Real Tasks. Real Robots. Real Benchmarks.” —— 真实任务、真实机器人、真实基准。
这绝不是一场纯粹的炫技表演。比赛围绕真实世界中的机器人操作场景展开,涵盖物流分拣、实验室操作、柔性物体处理等多个领域,同时支持VR、外骨骼、UMI等多样化的交互与数据采集方式。
第二届WBCD设置了四个细分赛道,其中Track 1聚焦基于Unitree G1的物流分拣任务。其背后的设计理念值得关注:不是让机器人按照预设脚本表演,而是要求它在真实任务场景中“动真格”。

回顾2025年首届WBCD,有一幕令人印象深刻:艾欧智能基于TeleXperience系统,成功完成了跨越大洋的远程遥操作实验。操作员位于中国深圳,远程控制远在美国赛场的机器人,执行了一个多步骤的生命科学实验操作任务,并斩获最佳应用奖。这一过程面临时延、通信、控制精度等多重挑战,但充分验证了远程遥操作在真实研究场景中的可行性。

到了今年,事情更进一步。针对WBCD Track 1,艾欧智能提供了与比赛任务场景高度相关的SenseXperience UMI类型数据,供参赛团队使用与测试。这好比下围棋,光记谱没有用,关键时刻能落子才算数。
Task-Relevant Data:数据不在多,在于“对路”
针对Track 1的物流分拣任务,此次提供的数据集并非随机采集的通用演示数据,而是围绕真实比赛任务进行精准采集,覆盖目标物体操作、分拣流程、第一视角操作过程等环节,更贴近实际任务中的操作逻辑与流程。简而言之,这些数据是在“实战语境”下产生的,而非实验室中的摆拍结果。


除了数据,硬件方面也有配套动作。针对Unitree G1平台,艾欧智能提供了可快速安装的执行器夹爪方案,并开放了对应的SDK用于夹爪控制与开发。目的很明确:降低参赛团队在任务搭建与数据验证中的适配成本,让大家将更多精力集中在算法与策略上。
一个核心判断是:对于具身智能而言,真正关键的并非“获得更多数据”,而是“获得与目标任务强相关的数据”。相比泛化的demonstration数据,task-relevant data往往能更有效地支持机器人在真实任务中的学习与执行。这句话值得反复品味——数据堆砌式的研究,正在让位于目标驱动的精准数据策略。
开源SenseXperience UMI数据集:让社区直接上手
为了支持WBCD参赛团队以及更广泛的社区开发者,艾欧智能已在Hugging Face上开源了SenseXperience UMI数据集。该数据集围绕Unitree G1物流分拣任务采集,由SenseXperience人类数据采集系统完成,包含真实任务场景中的第一视角操作数据与UMI类型demonstration data。
开发者可直接访问:
https://huggingface.co/datasets/ICRA-WBCD/IO-AI-SenseXperience-UMI
开放不仅意味着提供资源,更是向社区释放信号:数据共享正在加速,从“开放数据”走向“任务导向的数据开放”。
从数据到研究探索:辅助遥操作的少样本泛化
除了数据开放,艾欧智能在辅助遥操作、shared control与demonstration understanding等方向持续输出研究成果。今年,他们与吉林大学合作完成了一项重要工作:
《Adaptor: Advancing Assistive Teleoperation with Few-Shot Learning and Cross-Operator Generalization》
这项研究已作为ICRA相关研究工作公开发表。论文聚焦辅助遥操作中的少样本适应与跨操作者泛化问题——这在真实场景中是一个颇为棘手的痛点。
辅助遥操作虽然可以通过shared control提高效率,但不同操作者的习惯、熟练程度和动作风格会导致轨迹分布差异显著,进而影响系统对人类意图的判断。Adaptor提出的解决方案是:一个少样本意图识别与动作生成框架。它通过噪声注入合成trajectory perturbations,并使用geometry-aware keyframe extraction提取关键轨迹信息;随后用Intention Expert编码人类意图,并结合VLM context条件化Action Expert生成动作。
相比传统“针对单一操作者进行动作补全”的方案,Adaptor更进一步地探索了“面向多操作者的意图理解和泛化辅助”。这一点,对于遥操作从实验室走向工厂、医疗等实际环境,至关重要。
论文地址:
https://arxiv.org/abs/2604.09462
整体来看,从跨国遥操作演示,到开源真实任务数据集,再到少样本泛化研究,这些行动串联起一条清晰的路线:让机器人真正学会干活,而不仅仅是学会表演。ICRA 2026,值得期待。
