首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
NVIDIA技术如何优化机器人移动与全身控制能力

NVIDIA技术如何优化机器人移动与全身控制能力

热心网友
96
转载
2026-05-27

欢迎关注首期“NVIDIA机器人研究与开发摘要(R²D²)”。本系列技术博客旨在为开发者和研究人员提供一个窗口,深入洞察NVIDIA各研究实验室在物理AI与机器人领域的最新突破。我们希望通过分享这些前沿探索,与全球社区共同拓展机器人技术的可能性。

构建真正智能、鲁棒的机器人系统,始终面临多重核心挑战。行业普遍存在三大痛点:首先是数据匮乏——获取大规模、高质量、多样化的真实世界训练数据成本极高;其次是泛化能力不足——如何让算法方案适应不同机器人形态与动态变化的环境;最后是系统集成复杂——如何将移动、操作、控制与高级认知能力无缝融合,形成完整解决方案。

NVIDIA的应对策略,是将尖端人工智能研究与工程化实践深度结合,并依托其强大的AI与机器人平台(如OmniverseCosmosIsaac SimIsaac Lab)进行持续验证与迭代。最终产出的模型、策略及数据集,旨在为全球研究者和开发者社区提供可复用、可定制的基础,从而加速各类机器人项目的开发进程。本期内容,我们将聚焦于机器人移动与全身控制这一关键领域,详细解读几个核心工作流及AI模型,揭示它们如何协同攻克智能导航、灵巧移动与精准控制中的难题。

NVIDIA机器人移动工作流与AI模型解析

从人形机器人、四足机器狗到自主移动机器人(AMR),各类移动机器人正加速渗透至物流、制造、服务等多个行业。这对机器人导航系统提出了前所未有的高要求:它们不仅需要在已知或未知环境中实现安全运行,还必须具备动态避障、路径优化能力,以最大化运行效率并减少停机。然而,传统导航软件往往存在“适应性”短板——针对不同机器人平台的算法差异巨大,环境变化即需大量重新调试,导致工程复杂度高、可扩展性受限。

NVIDIA研究团队的核心思路是:通过开发由AI驱动的端到端基础模型、高效可扩展的合成数据生成流程,以及支持零样本(Zero-Shot)现实部署的训练框架,系统性解决上述挑战。其终极目标是让机器人即使在仅配备基础传感器、面对杂乱未知空间时,也能实现稳健的自主导航。

图1. 机器人移动工作流涵盖三大核心环节:合成数据生成、模型训练与微调、以及零样本部署前的仿真验证。

MobilityGen:高效合成数据生成方案

数据是训练AI模型的基石,但对机器人领域而言,采集真实世界的高质量运动数据耗时耗力且成本高昂。MobilityGen工作流应运而生,它借助NVIDIA Isaac Sim仿真平台,能够为包括人形、四足和轮式机器人在内的多种形态,快速生成大规模、多样化的合成运动数据。这套方案能显著降低数据获取成本,有效缓解机器人AI训练中的数据稀缺问题。

MobilityGen如何提升数据集的价值与多样性?它主要通过多种技术手段实现:在仿真环境中引入动态障碍物、丰富机器人的动作库、结合人类远程操控演示数据,并对光照、纹理等视觉条件进行增强。其输出的数据格式全面,包括占据地图、机器人位姿、速度信息、RGB图像、深度图、语义分割图,以及可定制的动作序列与渲染数据。数据采集方式灵活,支持通过键盘/手柄远程操控、自动随机动作探索或基于自定义路径规划进行录制。

可以说,MobilityGen为机器人感知与移动算法的研发夯实了数据基础。它生成的高保真合成数据,能够高效用于训练和验证各类移动模型及环境感知算法。

图2. 机器人移动合成数据生成的四个标准化步骤:环境构建与导入、机器人模型配置、仿真运动与轨迹记录、多模态数据渲染与输出。

视频2. MobilityGen用户使用Isaac Sim进行合成数据生成

COMPASS:跨机器人形态的通用移动策略

拥有高质量数据后,下一步是训练具备强大泛化能力的策略模型。COMPASS工作流的核心使命,正是开发能够跨越不同机器人形态的通用移动策略。它提供了一套完整的端到端工作流与预训练模型,致力于实现从仿真到现实的“零样本”迁移部署,从而解决因机器人平台各异导致的开发周期长、难以规模化复制的行业难题。

COMPASS的先进性在于其融合训练方法:它将基于视觉的端到端模仿学习(IL),与在Isaac Lab中利用X-Mobility进行的残差强化学习(RL)及策略蒸馏技术相结合。尽管其模仿学习部分基于特定形态数据预训练,但最终通过蒸馏得到的通用策略,在不同形态机器人上的导航成功率可提升高达5倍。这意味着,形态各异的机器人有望共享同一套高性能“导航大脑”,在复杂环境中高效穿行,同时保留了针对特定平台或任务进行快速微调的灵活性。

图3. COMPASS工作流的三阶段设计架构。

具体而言,第一阶段通过模仿学习构建基础世界模型,让策略掌握关于移动的“物理常识”,例如理解环境结构、动态障碍物感知与规避、可行路径规划。第二阶段利用残差强化学习,将这些常识具体化为执行特定导航任务的专家策略。第三阶段则通过策略蒸馏技术,将多位“专家”的知识融合压缩到一个统一的、轻量化的跨形态模型中。这套流程最终能支持零样本下的多机器人协同交互,并可连接移动操作控制器,以执行取放、开门等更复杂的复合任务。

视频3. 搭载COMPASS策略的人形机器人演示

COMPASS通过攻克跨形态通用性难题,显著增强了集成式机器人软件栈的移动能力基础。

HOVER:人形机器人全身协调控制框架

让机器人移动到目标位置仅是第一步。对于像人形机器人这样拥有多自由度的高维系统,稳健的运动表现离不开精妙的平衡控制与全身关节的协调。HOVER工作流的目标,正是为此提供一个统一的、高性能的全身控制参考解决方案。

传统方法中,人形机器人常需为不同任务切换不同控制模式,例如导航时采用速度追踪模式,进行桌面操作时则需切换至上身关节位置追踪模式。HOVER在Isaac Lab中训练,旨在将这些分散的控制模式整合进一个统一的神经全身控制器中。对于采用其他移动工作流的机器人,也可用其对应的控制器模块替代HOVER。

HOVER本质上是一个多模式策略蒸馏框架。它首先通过强化学习训练多个专注于特定技能的专家策略,并融合人类运动数据先验,最后将这些专家的能力蒸馏到一个通用策略中,从而实现不同控制模式间的平滑、无缝过渡。其开源代码库提供了在Unitree H1等真实人形机器人上的部署示例,展示了出色的运动柔顺性与稳定性。

图4. HOVER策略在Isaac Lab中训练、在MuJoCo中测试并最终部署到真实机器人上;(左)仿真测试,(右)真实部署

图5. HOVER策略在执行复杂手臂动作的同时保持全身动态平衡

ReMEmbR:赋予机器人推理与记忆能力

当数据、移动、控制能力均已具备,要实现完全自主、具备交互智能的移动机器人,还需要最后的关键能力:环境理解、推理与长期记忆。机器人如何记住在环境中的历史观察,并根据用户的自然语言指令或提问进行推理并采取行动?

ReMEmbR工作流正是为此而设计。它创新性地将大语言模型(LLM)、视觉语言模型(VLM)与检索增强生成(RAG)技术相结合,为具身机器人构建了一个强大的“长期记忆”与推理系统。这使得机器人能够基于过往的环境观察进行逻辑推理、回答用户关于环境的问题,并在大范围、复杂的空间内执行基于语义的导航任务。

图6. ReMEmbR工作流示意图,展示其如何整合多模态感知与记忆。

ReMEmbR可以作为其他工作流的“智能决策中枢”,提供高级指令。例如,它将MobilityGen、COMPASS和HOVER串联起来,形成一个从环境感知、记忆构建到智能导航与控制的完整问题解决闭环。为了推动该领域的研究与评估,NVIDIA还发布了NaVQA数据集,其中包含了大量涉及空间关系、时间逻辑和物体描述的多轮问答示例。

图7. MobilityGen、ReMEmbR、COMPASS和HOVER四个工作流协同工作的整合视图,构成完整机器人智能系统。

通过引入大模型强大的语义理解与推理能力,ReMEmbR从根本上提升了AI机器人系统的认知水平与环境适应能力。

生态系统应用与合作伙伴案例

这些前沿研究并非仅停留在实验室阶段。在全球人形机器人、仓储自动化及高端自主系统领域,已有多家领先的机构与公司开始采用NVIDIA的机器人研究工作流,以加速其产品开发进程并实现技术突破。

例如,机器人公司Under Control Robotics成功集成了X-Mobility模块,引导其机器人“Moby”在复杂场景中流畅完成自主导航任务。这套模块化系统已展现出灵活适配多种工业场景的潜力,包括现场数据采集、物料精准搬运以及高风险作业自动化等。

另一方面,研华科技、威刚科技与Ubitus的合作项目,则展示了ReMEmbR技术的实际应用前景。它们利用该技术使服务机器人能够依据对环境的长期观察进行推理并自主采取行动,向着构建真正具备对话式智能、可长期运行的自主机器人系统迈出了关键一步。

来源:https://m.elecfans.com/article/6574241.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

NVIDIA技术如何优化机器人移动与全身控制能力
AI资讯
NVIDIA技术如何优化机器人移动与全身控制能力

欢迎关注首期“NVIDIA机器人研究与开发摘要(R²D²)”。本系列技术博客旨在为开发者和研究人员提供一个窗口,深入洞察NVIDIA各研究实验室在物理AI与机器人领域的最新突破。我们希望通过分享这些前沿探索,与全球社区共同拓展机器人技术的可能性。 构建真正智能、鲁棒的机器人系统,始终面临多重核心挑战

热心网友
05.27
罗氏携手英伟达深化合作加速新药研发进程
AI资讯
罗氏携手英伟达深化合作加速新药研发进程

罗氏在全球部署超过3500块NVIDIABlackwellGPU,构建大规模AI计算基础设施,以加速药物研发与诊断创新。该算力平台支持从生物建模、药物发现到生产数字孪生的全链条应用,显著提升研发效率。同时,AI技术已深入实验室自动化、分子设计及病理分析等领域,旨在缩短研发周期,推动精准医疗发展。

热心网友
05.27
台积电盈利大增却削减奖金引员工不满 NVIDIA进军CPU市场
AI资讯
台积电盈利大增却削减奖金引员工不满 NVIDIA进军CPU市场

神舟二十三号载人飞船成功发射并与空间站会师,首次有香港航天员参与。NVIDIA将推出Arm架构CPU进军数据中心市场。长安汽车内幕交易案中5名员工被罚没1669万元。台积电盈利大增但传闻削减奖金引发员工不满。“死了么”App更名为“在么在么”,用于独居老人安全监测。AI生成文章数量已超过人类创作,一季度国内。

热心网友
05.25
联想发布首款基于NVIDIA DRIVE Thor的舱驾智算平台Auto AI Box
业界动态
联想发布首款基于NVIDIA DRIVE Thor的舱驾智算平台Auto AI Box

在2026年北京国际车展上,联想车计算正式推出了其创新的舱驾智算平台——Auto AI Box。该平台核心搭载了NVIDIA DRIVE AGX Thor芯片,这标志着联想在中高端智能驾驶与智能座舱AI计算解决方案领域取得了重要进展,进一步拓展了车端人工智能计算的应用场景与能力边界。 想象一下这样的

热心网友
05.25
NVIDIA Vera CPU亮相Computex 2026 进军高性能服务器市场
业界动态
NVIDIA Vera CPU亮相Computex 2026 进军高性能服务器市场

2026年的Computex展会,看来要上演一场芯片巨头的“分道扬镳”。根据GF证券分析师的最新研判,NVIDIA将在这次展会上,正式亮出它的新王牌——基于Arm架构的Vera CPU。这可不是小打小闹,据称其计算性能预计将达到当前主流x86处理器的1 5倍。此举意味着,NVIDIA不再满足于GPU

热心网友
05.24

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

NeuroStream视觉数据底座实测报告发布性能与应用解析
科技数码
NeuroStream视觉数据底座实测报告发布性能与应用解析

随着人工智能大模型与机器视觉技术的深度融合与产业升级,一个根本性的挑战愈发关键:底层视觉数据基础设施的能效水平,直接决定了上层AI应用的成本边界与识别精度的上限。近期,Robo ai (NASDAQ: AIIO) 旗下专注于AI基础设施的Neurovia AI,在第九届国际安全与国家风险防范展(IS

热心网友
05.27
安全出币技巧指南:掌握高效交易与资金保障的关键
web3.0
安全出币技巧指南:掌握高效交易与资金保障的关键

数字货币成功变现需掌握关键技巧:理解市场动态与主流币种联动,选择安全高流动性平台,制定明确风险目标和交易策略,严格执行止损与分散投资。市场持续变化,保持学习与适应能力是长期稳健交易的基础。

热心网友
05.27
华硕电竞显示器618选购指南 高性价比双子星推荐
科技数码
华硕电竞显示器618选购指南 高性价比双子星推荐

618购物节是电竞玩家升级装备的良机。华硕TUFGaming系列的战杀27与小金刚显示器凭借FastIPS面板、高刷新率、精准色彩及丰富电竞功能,以高性价比满足不同玩家对帧率与画质的追求,成为热门选择。

热心网友
05.27
2026年二战飞行游戏推荐:空战模拟与对战佳作盘点
游戏资讯
2026年二战飞行游戏推荐:空战模拟与对战佳作盘点

移动端二战空战游戏以机械浪漫与硬核操作吸引玩家。多款作品各具特色:或精细还原战机与基地经营,或重现太平洋战场任务,或融合弹幕射击与昼夜战术,或侧重战机收集养成,或提供割草式爽快体验。它们以历史氛围带玩家重返决定历史的天空。

热心网友
05.27
和平精英安V收车币如何革新游戏经济与玩家交易生态
web3.0
和平精英安V收车币如何革新游戏经济与玩家交易生态

《和平精英》中,“安V收车币”作为一种新兴交易方式,为玩家获取稀有车辆皮肤提供了安全便捷的渠道。它满足了玩家个性化需求,提升了游戏体验与沉浸感。参与交易需选择正规平台,合理规划消费并遵守官方规定,以保障自身权益。这一模式活跃了游戏经济,丰富了玩家的资源选择。

热心网友
05.27