首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
高德发布ABot系列基座模型,实现全球首个具身操作与导航双突破

高德发布ABot系列基座模型,实现全球首个具身操作与导航双突破

热心网友
48
转载
2026-02-12

近日,阿里巴巴集团旗下高德正式发布具身操作基座模型ABot-M0与具身导航基座模型ABot-N0,补齐了具身机器人规模化落地的两块核心能力——操作的通用性和导航的长程性,并刷新了全球多项权威评测纪录,高德也成为全球首个在具身导航与具身操作上同步达到SOTA(目前最好、最先进的模型)的厂商。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

ABot-M0:全球首个统一架构的机器人基础模型,让机器人拥有"通用大脑"

长期以来,机器人技术的规模化应用面临诸多挑战,其中关键之一在于数据的割裂、动作表示的不统一以及空间理解能力的不足。不同厂商、不同形态的机器人往往使用各自独立的数据体系,导致模型难以跨平台复用,训练效率受限,部署成本高。

高德推出的 ABot-M0 作为一款通用的具身操作基础模型,从“数据统一—算法革新—空间感知”三个方面进行了系统性重构,致力于提升模型在多样化机器人形态和任务场景下的泛化能力。

高德发布两款ABot系列基座模型,达成全球首个具身操作和具身导航ABot-M0模型架构图

ABot-M0 基于全球开源资源,整合超过 600 万条真实操作轨迹,构建了目前规模最大的通用机器人数据集。通过统一动作表示、坐标系与控制频率,并采用增量式动作建模,实现了跨平台数据融合,支撑了完全基于公开数据的预训练。

算法革新上,ABot-M0 提出了全球首个动作流形学习:有效的机器人动作受限于物理规律、任务目标与环境约束,集中分布在低维结构化的流形上。设计了 AML(Action Manifold Learning)算法,使模型能够直接预测结构合理、物理可行的动作序列,提升策略的稳定性与解码效率。

为增强空间感知,ABot-M0 引入 3D 感知模块,增强模型对“前后、远近、遮挡”等空间语义的理解,在复杂环境中实现更精准的操作决策。

在 Libero、Libero-Plus、RoboCasa 基准测试中,该模型在包含复杂任务组合与动态场景扰动的设定下,平均任务成功率均达到 SOTA。其中,Libero-Plus 基准上达到了 80.5%,较业界先进方案pi0提升近30%,展现了其在高扰动高难度具身操作任务中的领先性能。

高德发布两款ABot系列基座模型,达成全球首个具身操作和具身导航ABot-M0在Libero-Plus的评测

通过系统的工程设计与算法改进,ABot-M0 探索了一条通向通用具身智能的技术路径,也为未来开放、共享的机器人生态提供了可复现、可扩展的基础支持。

ABot-N0:全球首个五大导航任务统一的全栈导航基座模型

导航是机器人进入物理开放世界的核心基础能力,机器人需要在动态且存在干扰的环境里展现出通用的行动能力,如跨场景送物或跟随服务,这同时也是具身智能演进的终极命题。

然而,当前的具身导航研究普遍深陷“碎片化”:主流方法往往针对特定任务构建孤立的专用架构,这不仅限制了模型的跨任务泛化能力,更阻碍了智能体从海量异构数据中提取统一物理先验的可能性。

这也是当前机器人常陷于“环境看不懂、动作做不准”的核心原因,复杂指令(如“去门口帮我看看快递”)更是难以执行。

高德推出的具身导航基座模型ABot-N0,以“全任务一统”为核心目标,并实现全球首次在单一模型中完整集成Point-Goal(点位导航)、Object-Goal(目标导航)、Instruction-Following(指令跟随)、POI-Goal(兴趣点导航)与Person-Following(人物跟随)五大导航任务,有效突破了传统架构中任务割裂的瓶颈。

比如,当用户对搭载ABot-N0的具身机器人说:“带我去奶茶店买一杯奶茶,再帮我占个座。”时系统会自动分解为具体的导航任务:首先执行Point-Goal,根据地图记忆接近奶茶店区域;之后切换至POI-Goal,精准锁定店铺入口并靠近;随后触发Instruction-Following,进入店铺并导航至柜台;最后执行Object-Goal,在店内寻找空沙发并停靠。

相较于只能支持部分任务的具身导航模型,高德ABot-N0所实现的五大导航任务给长程复杂任务的执行提供了可行的解决方案。这一能力背后,是高德在架构设计、数据引擎和系统框架上的关键革新。

高德发布两款ABot系列基座模型,达成全球首个具身操作和具身导航ABot-N0的数据、性能、任务概览

在模型架构上,ABot-N0采用层次化的“大脑‑动作”设计哲学:由“认知大脑”理解指令并做推理,由基于流匹配(Flow Matching)的“动作专家”生成精确且多峰分布的连续轨迹 。训练上,先让模型做认知训练热身,再用部分认知数据和海量导航动作进行联合监督微调,最后用强化学习把导航决策对齐到人类偏好的行为价值,最终打造出真实环境中更通用的VLA基座模型。

在数据侧,依托高德长期沉淀的场景资产和专家示例,高德构建了业内最大规模的具身导航数据引擎,涵盖约 8000 个高保真 3D 场景等海量时空数据与近1700万条专家示例,从而增强模型在真实环境中的泛化能力与鲁棒性。

基于ABot-N0的系统性创新,其在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大权威基准测试中全面刷新了世界纪录。其中在SocNav闭环仿真中,成功率(SR)飙升40.5%,在HM3D-OVON评测中成功率(SR)提升8.8%,均显著强于之前的SOTA模型。

高德发布两款ABot系列基座模型,达成全球首个具身操作和具身导航Point-Goal任务:在CityWalker及SocNav上分别进行开环和闭环评测

此外,为了解决机器人在执行长程复杂任务时的任务拆解与容错问题,高德提出了可落地的Agentic Navigation System具身导航系统框架,行成从“读懂指令”到“长程复杂任务执行”的闭环能力架构,支持机器人在执行过程中持续感知、记忆、决策与纠错。系统已成功部署于真实四足机器人平台,并在边缘侧实现了高效推理与闭环控制,验证了其在动态现实环境中的泛化性能与工业级稳定性。


来源:https://www.leiphone.com/category/industrynews/Md6FbG7BkzMzmjIf.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里QoderWork移动端打通钉钉微信飞书,一键调用AI
业界动态
阿里QoderWork移动端打通钉钉微信飞书,一键调用AI

3月27日消息,阿里桌面Agent应用QoderWork全面打通钉钉、微信和飞书三大主流IM,用户可直接在手机上与QoderWork对话,随时随地调度桌面AI助手的全部能力,远程完成文件整理、数据处

热心网友
03.27
阿里千问上车红旗汽车:一句话智能指挥座舱各项功能
编程语言
阿里千问上车红旗汽车:一句话智能指挥座舱各项功能

3月26日消息,阿里AI助手千问正式接入红旗汽车智能座舱,这是继AI眼镜之后,千问进一步拓展至更高复杂度的车载场景,加速进入物理世界,迈向全场景AI助手。据悉,千问很快就会首次搭载在红旗HS6 PH

热心网友
03.26
阿里蔡崇信首谈智能体:是虚拟白领的未来吗?
科技数码
阿里蔡崇信首谈智能体:是虚拟白领的未来吗?

3月23日,在西门子RXD大会上,阿里巴巴集团主席蔡崇信和西门子CEO博乐仁对谈时,抛出了一个很有攻击性的观点:智能体(AI Agent)本质上就是虚拟白领,是一种知识型员工。蔡崇信甚至直接算了一笔

热心网友
03.26
实测千问AI新功能:打车技能一句话高效体验
科技数码
实测千问AI新功能:打车技能一句话高效体验

那个春节前因为奶茶免单爆火的千问App,现在又多了项新功能。3月23日,阿里千问宣布上线打车功能,用户只要在千问App中输入一句话,AI就会帮你搞定。小雷打开了千问App实际体验了下,发现这个功能的

热心网友
03.26
阿里速卖通与奥地利邮政签约,强化欧洲本地履约服务
业界动态
阿里速卖通与奥地利邮政签约,强化欧洲本地履约服务

近日,阿里旗下跨境电商平台速卖通AliExpress与奥地利邮政公司签署谅解备忘录(MOU) ,建立深度战略合作伙伴关系,为商家和消费者创造高效的履约体验,重点辐射中欧、东欧等关键市场。这是速卖通与

热心网友
03.25

最新APP

史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28

热门推荐

Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险
网络安全
Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险

IT之家 3 月 31 日消息,手机手电筒是一项用户常用的功能,无论是在漆黑的衣柜里翻找物品,还是夜间在停车场辨路前行,需要时它总能随时派上用场。但如今,部分 Pixel 10 Pro 用户反馈:如

热心网友
03.31
Numbers判断闰年公式设置方法:详解步骤与实用技巧
电脑教程
Numbers判断闰年公式设置方法:详解步骤与实用技巧

闰年判定有四种Numbers兼容公式:一、MOD嵌套OR+AND逻辑;二、DATE+DAY反推2月最后一天;三、TEXT+ISERROR验证“年份-02-29”有效性;四、YEAR

热心网友
03.31
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状
科技数码
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状

IT之家 3 月 31 日消息,对很多人来说,晕车晕船是旅行中最常见的烦心事之一。三星悄然上线了一款名为 Hearapy 的免费应用,来解决这一令人不适的问题。该公司称,这款应用无需药物或物理缓解手

热心网友
03.31
湖南电信与海光信息深化合作,共筑算网融合与AI新生态
科技数码
湖南电信与海光信息深化合作,共筑算网融合与AI新生态

据海光信息(688041 SH)消息,近日,中国电信(601728 SH)湖南分公司2026年数智科技生态大会在长沙召开,中国电信湖南分公司与海光信息全面深化数智生态合作。根据协议,双方将聚焦智能制

热心网友
03.31
高端纯电困局,车企如何破解盈利难题
科技数码
高端纯电困局,车企如何破解盈利难题

30万元以上的高端纯电车,显然成了新能源车市的那块硬骨头。除了有换电加持的蔚来新ES8,大量被车企寄予厚望的高端明星纯电车都难逃疲软命运,典型如理想MEGA和i8,一次起火事故,直接造成销量断崖式下

热心网友
03.31