高德开源ABot-M0具身操作基座模型通用大脑适配多形态机器人_AI热点日报

高德开源ABot-M0具身操作基座模型通用大脑适配多形态机器人

类型：热点整理2026-05-20

机器人领域迎来重大突破。高德地图正式宣布，将其自主研发的ABot-M0模型全量开源。根据官方定义，这是全球首个基于统一架构的机器人具身操作基座模型。其核心目标，是构建一个能够适配多种形态机器人硬件的“通用大脑”，从而推动机器人智能化迈入新阶段。这一构想如何落地？从公开的基准测试成绩来看，ABot-

机器人领域迎来重大突破。高德地图正式宣布，将其自主研发的ABot-M0模型全量开源。根据官方定义，这是全球首个基于统一架构的机器人具身操作基座模型。其核心目标，是构建一个能够适配多种形态机器人硬件的“通用大脑”，从而推动机器人智能化迈入新阶段。

这一构想如何落地？从公开的基准测试成绩来看，ABot-M0表现卓越。在Libero、Libero-Plus、RoboCasa等国际权威机器人操作基准测试中，该模型均取得了SOTA（当前最优）性能。特别是在Libero-Plus基准上，其任务成功率高达80.5%。这一数据具有里程碑意义——相较于此前业界领先的Pi0方案，性能提升接近30%，标志着机器人操作模型技术实现了显著跨越。

高德宣布全量开源具身操作基座模型 ABot-M0，可实现一个“通用大脑”适配多种形态具身机器人 — ABot-M0 模型架构图

开源的价值在于实际贡献。高德此次开源诚意十足，全面覆盖了数据、算法与模型三大核心层面。其根本目的在于，破解当前机器人研发中普遍存在的数据壁垒与部署困境，为行业提供一个具备先进空间理解能力、且能快速部署应用的通用技术基座。

数据层面：构建统一标准，破除信息孤岛

数据是训练AI模型的基石。本次开源的核心亮点之一，是同步发布了名为UniACT的通用机器人操作数据集。该数据集整合了超过600万条真实机器人操作轨迹，规模位居全球前列。更为关键的是，它提供了一套完整的、将原始异构数据转化为标准化训练数据的处理流程。

由于机器人厂商、传感器与控制接口各异，产生的数据格式千差万别，如同“方言”林立。UniACT通过统一动作表示、坐标系与控制频率，为所有机器人数据建立了一套标准的“普通话”体系。这使得全球范围内不同形态的机器人数据得以汇聚与高效利用，极大提升了大规模预训练的数据质量与模型效果。

算法创新：两项核心技术，解决行业痛点

在算法开源部分，ABot-M0公开了完整的模型架构与训练框架，其中包含两项关键技术创新。

首先是动作流形学习算法。传统机器人动作预测方法常在噪声中摸索，导致策略不稳定。AML算法则另辟蹊径，它引导模型直接预测在物理上可行且平滑的连续动作序列。这相当于为机器人规划了更可靠的行为轨迹，不仅提升了动作解码效率，更确保了执行过程的稳健性。

其次是双流感知架构。现有视觉语言大模型虽擅长语义理解，却在三维空间与几何关系推理上存在短板。ABot-M0的创新架构巧妙解决了这一问题：它一方面利用如Qwen3-VL等先进VLM提供高层语义理解；另一方面，设计了一个“即插即用”的接口，可无缝接入专用的3D几何理解模块。这种设计无需改动骨干网络，就能有效增强模型对三维环境的深度感知能力，实现“语义”与“空间”理解的融合。

模型价值与行业愿景：通用大脑赋能万物互联

在模型交付层面，高德开源了端到端的预训练模型及全套工具链。对于开发者与研究人员而言，这意味着无需从零开始构建基础设施，即可基于此成熟底座，快速开发适用于工业自动化、家庭服务等垂直场景的机器人解决方案。

更深远的行业意义在于，ABot-M0成功验证了“单一智能大脑驱动多元物理躯体”的技术路径。它为未来形成“通用智能基座+专用执行载体”的产业范式提供了坚实的技术实证。若此路径得以普及，机器人技术的开发门槛将显著降低，商业化应用进程也将全面加速。

如果您希望深入了解这项机器人操作模型的开源进展，可通过以下资源获取详细信息：

论文标题：ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning
项目主页：https://amap-cvlab.github.io/ABot-Manipulation
代码地址：https://github.com/amap-cvlab/ABot-Manipulation
论文全文：https://arxiv.org/pdf/2602.11236

来源：https://www.ithome.com/0/934/962.htm

具身智能高德

延伸阅读

补充最近整理过的热点入口。