MolmoAct2开源机器人模型集成LeRobot 基于DGX Spark全链路开箱即用

时间：2026-05-31 10:41

来了！具身智能（Embodied AI）领域再次迎来一位重磅选手——艾伦人工智能研究所（Ai2）推出的开源机器人动作推理模型 MolmoAct2 已正式登陆 Hugging Face 的 LeRobot 机器人学习框架。这意味着开发者如今能够在真实环境中更便捷地训练、评估和部署这款前沿的机器人控制模

来了！具身智能（Embodied AI）领域再次迎来一位重磅选手——艾伦人工智能研究所（Ai2）推出的开源机器人动作推理模型 MolmoAct2 已正式登陆 Hugging Face 的 LeRobot 机器人学习框架。这意味着开发者如今能够在真实环境中更便捷地训练、评估和部署这款前沿的机器人控制模型，开箱即用的体验终于从口号变为现实。

基于 DGX Spark 的高效推理！开源机器人模型 MolmoAct2 完美集成 LeRobot，全链路开箱即用

什么是 MolmoAct2？

简而言之，MolmoAct2 是 Ai2 专为真实世界机器人控制而设计的开源动作推理模型（Action Reasoning Model）。它巧妙地将两大核心技术融为一体：一是强大的视觉语言骨干网络（Molmo2-ER），赋予机器人“火眼金睛”——精准的空间感知与指令理解能力；二是流匹配连续动作专家（Flow-Matching Continuous Action Expert），确保机器人的动作一气呵成、丝滑流畅。正是凭借这种“看得懂+动得准”的组合，MolmoAct2 能够理解复杂环境与人类指令，并直接转化为机器人小车、机械臂等硬件的实际动作。

LeRobot 生态的完美集成

MolmoAct2 接入 LeRobot 后，开发者将享受到全流程的“开箱即用”体验。此次集成带来了多项硬核功能：原生策略支持——LeRobot 现已原生支持 molmoact2 策略（Policy）；全链路覆盖——从训练（Training）、评估（Evaluation）到部署（Deployment），再搭配详尽的官方文档，全套一步到位；双重动作模式——推理时，通过流匹配动作专家支持连续动作推理（Continuous Action Inference）；训练时，则支持离散动作 Token（Discrete Action Tokens），让模型训练更高效、更稳定。

性能强劲，上手极简

MolmoAct2 的开箱即用性能表现相当出色。无论你是想直接体验其基准能力，还是计划针对特定机器人任务进行微调（Fine-tune），LeRobot 框架已将门槛降至最低。值得一提的是，基于 NVIDIA DGX Spark 算力平台运行的物体抓取与投放（Pick-and-place）推理测试结果优异，充分证明了该模型在实际工业与研究场景中的巨大潜力。

开发者实战：连续折毛巾任务大获成功！

MolmoAct2 的强悍实力并非停留在纸面。在近期一项高难度机器人挑战中，开发团队让机器人使用基于扩散（Diffusion）或流匹配（Flow-matching）的策略，连续完成两次毛巾折叠（Two consecutive towel folds）——这堪称柔性物体控制中的硬骨头。最终任务圆满成功，不仅验证了 MolmoAct2 非常适合处理这类带形变、高精度要求的柔性物体控制任务，也展示了 Hugging Face 硬件生态与 NVIDIA 算力支持为机器人学习带来的无限可能。

如果你正在寻找一个强大、灵活且开源的机器人控制方案，不妨前往 LeRobot 社区亲自体验 MolmoAct2 的魅力。

官方文档：https://huggingface.co/docs/lerobot/main/en/molmoact2

来源：https://cloud.tencent.com.cn/developer/article/2676377

DGX Spark

上一篇公关部项目报告撰写工作总结与提示词 下一篇免费AI公文写作软件推荐这几款实用神器不容错过

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-18

Interview Coder 基于人工智能的Leetcode算法面试备战高效在线工具

技术面试的竞争日益激烈，尤其在 Leetcode 风格的编码环节中，考察难度不断提升。近期一款名为 Interview Coder 的 AI 工具引发了广泛关注。本质上，它是一款桌面应用程序，专为求职者提供实时编码辅助，旨在屏幕共享面试场景中实现“隐形”支持，避免被面试官察觉。 Interview

AI教程 · 2026-07-18

国内直连ChatGPT官网，开启高效沟通新体验

「ChatGPT官网国内直连」是什么先聊一个很多人关心的问题——国内用户到底怎么才能顺畅地用上ChatGPT官网？其实，所谓“ChatGPT官网国内直连”，说白了就是一种专门为国内用户优化的访问方式。以往大家想访问官网，总得绕来绕去，不是被限制就是网络不稳定，挺折腾的。而直连这种方式，就是把这些障

AI教程 · 2026-07-18

Fellow AI会议助手，高效提升会议效率

会议效率低是许多团队日常面临的真实痛点——动辄一小时的站会、无休止的评审会、结论模糊的董事会。真正有价值的工作时间往往被冗长的讨论和反复的沟通所消耗。针对这一普遍困境，Fellow + AI 提供了一套轻量却实用的解决方案，从会议记录、内容提炼到行动追踪，全面覆盖会议的全生命周期，帮助团队高效管理每

AI教程 · 2026-07-18

Text2Go AI智能改写工具

AI重写工具早已不是什么新鲜事物，但真正能有效去除“AI痕迹”的却寥寥无几。Text2Go正是瞄准这一用户痛点——它不仅局限于替换词汇，而是从上下文语境出发，让机器生成的内容读起来更像人类自然书写。什么是Text2Go？简单来说，Text2Go是一款专注于“人性化”处理的AI重写工具。其核心目标

AI教程 · 2026-07-18

三星收购英国AI公司推动本地AI模拟人类处理复杂任务

三星近期在本地人工智能领域再次展开布局，宣布收购英国初创公司Oxford Semantic Technologies，该公司专注于知识图谱技术。此次收购的核心目标十分明确：通过提升设备端AI的语义理解与推理能力，为用户带来更加个性化和智能化的体验。 Oxford Semantic Technolog