在第八届虹桥国际经济论坛“人形机器人创新发展合作”分论坛上,宇树科技创始人兼CEO王兴兴围绕具身智能与机器人模型的发展前景分享了深刻洞见。他指出,通过对比技术演进路径可以看出,当前机器人模型所处的发展阶段,正类似于ChatGPT问世前1至3年的探索期——行业技术方向已然明确,但距离实现突破性应用仍存在显著瓶颈。
王兴兴分析称,尽管生成式AI在语言理解和视觉识别领域取得显著突破,但机器人要实现真正的“具身智能”仍面临多重挑战。他强调,真正的具身智能要求机器人在物理世界中具备环境感知、精准运动控制以及理解人类交互意图的综合能力,这涉及机械设计、传感技术、算法优化等多维度的系统创新。
关于如何判定“具身智能的ChatGPT时刻”,王兴兴提出了明确量化指标:当机器人能在未经训练的陌生场景中,仅通过语音或文字指令完成80%以上的任务时,方可视为技术成熟的关键节点。他以家庭服务场景为例说明,机器人需要同时理解“把水果从厨房拿到客厅”这类指令背后的空间关系、物体识别和路径规划需求。
在技术实现路径上,王兴兴特别指出,单纯依赖大模型的推理生成能力远不足以支撑具身智能发展。他提出三大核心支撑要素:构建高精度的物理世界数字模型、建立实时数据反馈闭环系统,以及开发能够动态调整策略的强化学习框架。这些要素共同构成机器人适应复杂环境的“认知-行动”循环机制。
针对行业普遍关注的落地周期问题,王兴兴坦言技术突破需要跨学科协同创新。他透露,宇树科技正在研发具备多模态感知能力的下一代机器人平台,通过融合视觉、触觉、力觉传感器,结合动态环境建模算法,尝试突破现有运动控制与场景理解的技术局限。
