企查查APP信息显示,优必选(09880.HK)近日公布了一项名为“机器人控制模型的训练方法、装置、电子设备及存储介质”的专利申请。
根据专利摘要描述,这项技术涵盖以下关键步骤:首先基于第一总奖励函数对初始运动控制模型进行训练处理,获得第一运动控制模型;随后依据第二总奖励函数对初始导航控制模型进行训练处理,得到第一导航控制模型;在保持第一导航控制模型参数不变的前提下,结合第一导航控制模型输出的第一预测速度、第二子奖励函数以及第一总奖励函数,对第一运动控制模型进行训练,得到第二运动控制模型;最后通过对第二运动控制模型及第一导航控制模型的参数进行微调处理,最终获得用于控制机器人规避障碍物的完整模型。这项专利的提出,实现了通过导航控制模型与运动控制模型之间的强化学习机制,有效提升机器人运动控制的精准度与执行效率。

