9月23日,智元机器人正式宣布其开源计划系列的最新进展——继年初AgiBot World具身智能百万级真机数据开放后,通用具身基座大模型GO-1(Genie Operator-1)现已全面登陆GitHub并开放下载。
该公司表示,这是全球首个基于Vision-Language-Latent-Action(ViLLA)架构的开源具身智能模型,免费向全球开发者开放将显著降低行业技术门槛,加速具身智能的商业化进程。
01、技术创新:ViLLA架构开创具身智能新时代
GO-1采用的ViLLA架构在传统VLA(Vision-Language-Action)基础上进行了突破性改进。通过引入隐式动作标记机制,该架构有效解决了视觉-语言输入与机器人动作执行之间的语义断层问题,大幅提升了机器人对人类指令的理解和执行精度。
ViLLA架构采用三层模块化设计:基于InternVL-2B构建的多模态理解层(VLM)负责处理视觉图像、力觉信号等多维度输入;隐式规划器通过预测潜变量动作实现复杂任务的自动分解;而基于扩散模型的动作专家模块则负责生成精确的连续动作序列,确保执行端的高精度控制。

02、开发支持:Genie Studio赋能全周期开发
智元机器人推出的Genie Studio开发平台为具身智能应用提供全生命周期支持,涵盖从数据采集、模型训练到仿真验证、实战部署的全流程工具链。该平台内置GO-1基础模型,集成视频训练方案和统一训练框架,提供一键式编译部署功能,大幅提升开发效率。
官网入口
https://genie.agibot.com/geniestudio
商务咨询
https://www.zhiyuan-robot.com/Contact/Business

03、生态构建:跨平台验证成果显著
虽然GO-1主要基于AgiBot G1数据集训练,但其在松灵机器人、方舟机器人等异构平台上均表现出优异的迁移性能。多项仿真测试显示,在Genie Sim和Libero等主流仿真环境中,GO-1的综合评分均领先同类产品。
GenieSim仿真评测结果:

Libero仿真评测结果:

在实际部署环节,GO-1特别兼容LeRobot通用数据格式,支持各类机器人平台的快速适配。在Genie G1真机测试中,其表现优于当前主流SOTA模型。

04、即刻体验:开启智能化开发之旅
开发者现可通过以下平台获取GO-1模型资源,无论您是资深研究员还是初学者,GO-1都将为您提供强大的技术支持。
GitHub仓库:
https://github.com/OpenDriveLab/AgiBot-World
Huggingface模型库:
https://huggingface.co/agibot-world/GO-1
技术论文:
https://arxiv.org/abs/2503.06669
