在机器人技术加速融入实体经济的背景下,能够稳定执行复杂物理操作的智能模型正成为行业焦点。近日,一款名为ACE-Ego的“一脑多型”具身操作视觉语言动作模型(VLA模型)正式宣布开源。该模型在国际权威基准测试中斩获领先成绩,并已具备处理零售环节多项实际任务的能力。

据官方发布的信息,ACE-Ego模型在人形机器人操作基准RoboCasa GR1 TableTop上取得了72.8%的平均成功率,刷新了该榜单的最高纪录。这一成绩大幅超越了英伟达GR00T、PI π₀.₅等多个主流模型。同时,在高难度的双臂操作基准RoboTwin 2.0强域随机化测试中,其成功率更是达到了90.62%,远超行业平均水平,展现出强大的泛化能力与鲁棒性。
模型已能稳定执行零售场景复杂操作
技术突破的最终目的应服务于实际应用。目前,ACE-Ego模型已经能够稳定完成塑料袋打包、鞋子装入鞋盒等操作。这类任务具有长周期、强接触的特点,正是线下零售中商品整理与打包履约环节的典型挑战。该模型成功应用,意味着机器人执行此类精细化、流程化工作的可靠性得到了显著提升。
此次开源由大晓机器人联合香港中文大学多媒体实验室共同推动,开源内容包含项目主页与技术报告,旨在降低行业研发门槛,促进具身智能技术的协同发展。随着此类高性能模型开放,预计将加速智能机器人在物流、零售、家政等更多需要精细操作的场景中落地,为相关行业的自动化升级提供新的技术选项。
