
2025年9月23日,智元机器人宣布其通用具身基座大模型GO-1(Genie Operator-1)已在GitHub平台正式开源,成为全球首个采用视觉-语言-隐变量-动作(ViLLA)架构的通用具身智能模型。该模型的发布标志着具身智能领域在架构设计与任务执行能力上的重要进展。
ViLLA架构通过引入隐式动作标记机制,有效解决了图像与文本输入到机器人实际动作输出之间的语义断层问题,显著增强了机器人对复杂指令的理解与执行精度。此次开源向全球开发者免费开放,旨在降低具身智能技术的应用门槛,推动行业协同发展。
GO-1模型采用多模态理解、隐式规划与动作生成三层次协同架构,能够融合处理多视角视觉信息、力觉反馈信号以及自然语言指令,实现更精准的任务推理与动作控制。其设计兼顾灵活性与扩展性,已在多种机器人硬件平台上完成验证,展现出良好的跨平台移植能力与仿真环境下的稳定表现。
为加速模型的实际应用,智元同步推出Genie Studio一站式开发平台,集成数据采集、模型训练、仿真测试及真机部署等核心环节,帮助开发者高效完成从算法研发到实体部署的全流程工作。
此外,智元近期启动了Genie Trailblazer全球招募计划,面向全球具身智能研究团队,重点围绕通用具身智能模型、具身世界模型构建以及高级遥操作技术三大方向,推动前沿技术探索与生态共建。
