高德开源ABot-M0具身操作基座模型 通用大脑适配多形态机器人
机器人领域迎来重大突破。高德地图正式宣布,将其自主研发的ABot-M0模型全量开源。根据官方定义,这是全球首个基于统一架构的机器人具身操作基座模型。其核心目标,是构建一个能够适配多种形态机器人硬件的“通用大脑”,从而推动机器人智能化迈入新阶段。
这一构想如何落地?从公开的基准测试成绩来看,ABot-M0表现卓越。在Libero、Libero-Plus、RoboCasa等国际权威机器人操作基准测试中,该模型均取得了SOTA(当前最优)性能。特别是在Libero-Plus基准上,其任务成功率高达80.5%。这一数据具有里程碑意义——相较于此前业界领先的Pi0方案,性能提升接近30%,标志着机器人操作模型技术实现了显著跨越。
开源的价值在于实际贡献。高德此次开源诚意十足,全面覆盖了数据、算法与模型三大核心层面。其根本目的在于,破解当前机器人研发中普遍存在的数据壁垒与部署困境,为行业提供一个具备先进空间理解能力、且能快速部署应用的通用技术基座。
数据层面:构建统一标准,破除信息孤岛
数据是训练AI模型的基石。本次开源的核心亮点之一,是同步发布了名为UniACT的通用机器人操作数据集。该数据集整合了超过600万条真实机器人操作轨迹,规模位居全球前列。更为关键的是,它提供了一套完整的、将原始异构数据转化为标准化训练数据的处理流程。
由于机器人厂商、传感器与控制接口各异,产生的数据格式千差万别,如同“方言”林立。UniACT通过统一动作表示、坐标系与控制频率,为所有机器人数据建立了一套标准的“普通话”体系。这使得全球范围内不同形态的机器人数据得以汇聚与高效利用,极大提升了大规模预训练的数据质量与模型效果。
算法创新:两项核心技术,解决行业痛点
在算法开源部分,ABot-M0公开了完整的模型架构与训练框架,其中包含两项关键技术创新。
首先是动作流形学习算法。传统机器人动作预测方法常在噪声中摸索,导致策略不稳定。AML算法则另辟蹊径,它引导模型直接预测在物理上可行且平滑的连续动作序列。这相当于为机器人规划了更可靠的行为轨迹,不仅提升了动作解码效率,更确保了执行过程的稳健性。
其次是双流感知架构。现有视觉语言大模型虽擅长语义理解,却在三维空间与几何关系推理上存在短板。ABot-M0的创新架构巧妙解决了这一问题:它一方面利用如Qwen3-VL等先进VLM提供高层语义理解;另一方面,设计了一个“即插即用”的接口,可无缝接入专用的3D几何理解模块。这种设计无需改动骨干网络,就能有效增强模型对三维环境的深度感知能力,实现“语义”与“空间”理解的融合。
模型价值与行业愿景:通用大脑赋能万物互联
在模型交付层面,高德开源了端到端的预训练模型及全套工具链。对于开发者与研究人员而言,这意味着无需从零开始构建基础设施,即可基于此成熟底座,快速开发适用于工业自动化、家庭服务等垂直场景的机器人解决方案。
更深远的行业意义在于,ABot-M0成功验证了“单一智能大脑驱动多元物理躯体”的技术路径。它为未来形成“通用智能基座+专用执行载体”的产业范式提供了坚实的技术实证。若此路径得以普及,机器人技术的开发门槛将显著降低,商业化应用进程也将全面加速。
如果您希望深入了解这项机器人操作模型的开源进展,可通过以下资源获取详细信息:
- 论文标题:ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning
- 项目主页:https://amap-cvlab.github.io/ABot-Manipulation
- 代码地址:https://github.com/amap-cvlab/ABot-Manipulation
- 论文全文:https://arxiv.org/pdf/2602.11236
相关攻略
机器人领域迎来重大突破。高德地图正式宣布,将其自主研发的ABot-M0模型全量开源。根据官方定义,这是全球首个基于统一架构的机器人具身操作基座模型。其核心目标,是构建一个能够适配多种形态机器人硬件的“通用大脑”,从而推动机器人智能化迈入新阶段。 这一构想如何落地?从公开的基准测试成绩来看,ABot-
今天凌晨,机器人领域传来一声惊雷。由Physical Intelligence公司发布的全新VLA模型π0 7,以一种意想不到的方式,为“世界模型”的叙事敲下了一记重锤。 它的突破点在于,首次在机器人领域实证了组合泛化能力。简单来说,当面对一个全新任务时,这个模型能够像搭积木一样,组合运用过去学过的
继一个月前宣布将建成全球最大具身数据采集中心、助力万亿机器人产业生态后,京东在具身智能领域再有重磅进展。4月16日,在京东具身智能生态发布会上,京东全球首次推出覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施体系,自研的超高清采集终端JoyEgoCam、具身大模型JoyAI-RA以及具
在过去的两年中,AI行业普遍信奉一个增长公式:更多的数据、更大的模型,便能带来更强的能力。这套逻辑在语言模型领域取得了显著成效。然而,当人工智能从数字世界迈向物理现实,当机器人需要实际执行抓取、操作等任务时,一个根本性的前提问题凸显出来——如果训练数据所基于的物理规律本身就不准确,那么盲目地扩大数据
近日,具身智能领域迎来一系列重要进展。仙工智能在短期内连续推进了三项关键合作,分别从底层算力支持、产业生态协同以及金融赋能产业化三个维度持续发力。这一系列举措目标清晰:旨在进一步完善其平台型具身智能机器人的能力体系,为前沿技术从实验室走向规模化商业落地,构筑更为坚实的支撑。 三项合作,构建三维支撑体
热门专题
热门推荐
人工智能的浪潮正席卷每个角落,智能办公工具无疑是其中备受瞩目的弄潮儿。以自然语言处理和机器学习为内核的AI文档助手,承诺用高效与精准重塑我们的文字工作。但一个值得玩味的问题随之浮现:它究竟是一场碘伏传统的革命性创新,还是更像一位得力的职业伙伴? AI文档助手的革命性创新 不得不说,AI文档助手的出现
2026年5月13日至14日,备受瞩目的Create 2026百度AI开发者大会将在北京隆重举行。本届大会以“万物一体”为核心主题,并实现了一项重要升级:首次将“Create百度AI开发者大会”与“云智大会”全面合并。此次整合旨在为参会者提供一站式、全景式的洞察体验,无论是关注AI基础设施的企业决策
雷蛇与《鸣潮》联名的达妮娅主题外设系列将于2026年5月20日推出,涵盖无线鼠标、机械键盘、电竞椅和超大鼠标垫四款产品。系列兼顾轻量化设计、高性能硬件与角色主题元素,致力于为玩家打造兼具操作性能与沉浸氛围的全方位游戏体验。
《极限竞速:地平线6》登陆Xbox与PC平台,首次将舞台设定于日本。本作画质显著提升,以丰富细节呈现东京霓虹、樱花林与山间晨雾。玩法上重构开局身份,玩家需从普通访客逐步成长为传奇车手,并引入庄园系统与探索乐趣。游戏对硬件性能要求较高,但借助DLSS4等技术可实现画质与流畅度的平衡。
人工智能正改变传统表格制作方式,通过自然语言指令自动生成表格与图表,显著提升工作效率。人机协作虽带来便利,确保数据准确性仍是关键。未来更智能的预测功能值得期待,但使用者仍需掌握数据分析基本功,以充分释放数据价值。





