首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
高德发布ABot系列基座模型:全球首款具身操作与导航双突破

高德发布ABot系列基座模型:全球首款具身操作与导航双突破

热心网友
84
转载
2026-02-12

近日,阿里巴巴集团旗下高德正式发布具身操作基座模型ABot-M0与具身导航基座模型ABot-N0,补齐了具身机器人规模化落地的两块核心能力——操作的通用性和导航的长程性,并刷新了全球多项权威评测纪录,高德也成为全球首个在具身导航与具身操作上同步达到SOTA(目前最好、最先进的模型)的厂商。

ABot-M0:全球首个统一架构的机器人基础模型,让机器人拥有"通用大脑"

长期以来,机器人技术的规模化应用面临诸多挑战,其中关键之一在于数据的割裂、动作表示的不统一以及空间理解能力的不足。不同厂商、不同形态的机器人往往使用各自独立的数据体系,导致模型难以跨平台复用,训练效率受限,部署成本高。

高德推出的 ABot-M0 作为一款通用的具身操作基础模型,从“数据统一—算法革新—空间感知”三个方面进行了系统性重构,致力于提升模型在多样化机器人形态和任务场景下的泛化能力。


ABot-M0模型架构图

ABot-M0 基于全球开源资源,整合超过 600 万条真实操作轨迹,构建了目前规模最大的通用机器人数据集。通过统一动作表示、坐标系与控制频率,并采用增量式动作建模,实现了跨平台数据融合,支撑了完全基于公开数据的预训练。

算法革新上,ABot-M0 提出了全球首个动作流形学习:有效的机器人动作受限于物理规律、任务目标与环境约束,集中分布在低维结构化的流形上。设计了 AML(Action Manifold Learning)算法,使模型能够直接预测结构合理、物理可行的动作序列,提升策略的稳定性与解码效率。

为增强空间感知,ABot-M0 引入 3D 感知模块,增强模型对“前后、远近、遮挡”等空间语义的理解,在复杂环境中实现更精准的操作决策。

在 Libero、Libero-Plus、RoboCasa 基准测试中,该模型在包含复杂任务组合与动态场景扰动的设定下,平均任务成功率均达到 SOTA。其中,Libero-Plus 基准上达到了 80.5%,较业界先进方案pi0提升近30%,展现了其在高扰动高难度具身操作任务中的领先性能。


ABot-M0在Libero-Plus的评测

通过系统的工程设计与算法改进,ABot-M0 探索了一条通向通用具身智能的技术路径,也为未来开放、共享的机器人生态提供了可复现、可扩展的基础支持。

ABot-N0:全球首个五大导航任务统一的全栈导航基座模型

导航是机器人进入物理开放世界的核心基础能力,机器人需要在动态且存在干扰的环境里展现出通用的行动能力,如跨场景送物或跟随服务,这同时也是具身智能演进的终极命题。

然而,当前的具身导航研究普遍深陷“碎片化”:主流方法往往针对特定任务构建孤立的专用架构,这不仅限制了模型的跨任务泛化能力,更阻碍了智能体从海量异构数据中提取统一物理先验的可能性。

这也是当前机器人常陷于“环境看不懂、动作做不准”的核心原因,复杂指令(如“去门口帮我看看快递”)更是难以执行。

高德推出的具身导航基座模型ABot-N0,以“全任务一统”为核心目标,并实现全球首次在单一模型中完整集成Point-Goal(点位导航)、Object-Goal(目标导航)、Instruction-Following(指令跟随)、POI-Goal(兴趣点导航)与Person-Following(人物跟随)五大导航任务,有效突破了传统架构中任务割裂的瓶颈。

比如,当用户对搭载ABot-N0的具身机器人说:“带我去奶茶店买一杯奶茶,再帮我占个座。”时系统会自动分解为具体的导航任务:首先执行Point-Goal,根据地图记忆接近奶茶店区域;之后切换至POI-Goal,精准锁定店铺入口并靠近;随后触发Instruction-Following,进入店铺并导航至柜台;最后执行Object-Goal,在店内寻找空沙发并停靠。

相较于只能支持部分任务的具身导航模型,高德ABot-N0所实现的五大导航任务给长程复杂任务的执行提供了可行的解决方案。这一能力背后,是高德在架构设计、数据引擎和系统框架上的关键革新。


ABot-N0的数据、性能、任务概览

在模型架构上,ABot-N0采用层次化的“大脑‑动作”设计哲学:由“认知大脑”理解指令并做推理,由基于流匹配(Flow Matching)的“动作专家”生成精确且多峰分布的连续轨迹 。训练上,先让模型做认知训练热身,再用部分认知数据和海量导航动作进行联合监督微调,最后用强化学习把导航决策对齐到人类偏好的行为价值,最终打造出真实环境中更通用的VLA基座模型。

在数据侧,依托高德长期沉淀的场景资产和专家示例,高德构建了业内最大规模的具身导航数据引擎,涵盖约 8000 个高保真 3D 场景等海量时空数据与近1700万条专家示例,从而增强模型在真实环境中的泛化能力与鲁棒性。

基于ABot-N0的系统性创新,其在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大权威基准测试中全面刷新了世界纪录。其中在SocNav闭环仿真中,成功率(SR)飙升40.5%,在HM3D-OVON评测中成功率(SR)提升8.8%,均显著强于之前的SOTA模型。


Point-Goal任务:在CityWalker及SocNav上分别进行开环和闭环评测

此外,为了解决机器人在执行长程复杂任务时的任务拆解与容错问题,高德提出了可落地的Agentic Navigation System具身导航系统框架,行成从“读懂指令”到“长程复杂任务执行”的闭环能力架构,支持机器人在执行过程中持续感知、记忆、决策与纠错。系统已成功部署于真实四足机器人平台,并在边缘侧实现了高效推理与闭环控制,验证了其在动态现实环境中的泛化性能与工业级稳定性。

来源:https://www.163.com/dy/article/KLJ2679905118HA4.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenClaw人人养虾接入Matrix平台操作指南
AI资讯
OpenClaw人人养虾接入Matrix平台操作指南

Matrix 是一种开放且去中心化的即时通讯协议,允许用户自主部署私有服务器并接入全球 Matrix 联邦网络。OpenClaw 网关通过集成 Matrix 的 Client-Server API,实现与这一分布式通信生态的无缝对接。 前置准备 在配置 OpenClaw 连接 Matrix 之前,请

热心网友
05.20
阿里官方揭秘欢乐马项目源自ATH郑波团队
AI资讯
阿里官方揭秘欢乐马项目源自ATH郑波团队

周二晚间,AI领域迎来了一则重磅消息。在权威AI评测平台Artificial Analysis的榜单上,一个名为「HappyHorse-1 0」的神秘模型异军突起,一举登顶视频生成能力排行榜,引发了业界的广泛关注与热议。 这一成绩极具含金量。无论是文本生成视频,还是图像生成视频,HappyHorse

热心网友
05.19
世界模型AI直播预约开启引爆人工智能新浪潮
AI资讯
世界模型AI直播预约开启引爆人工智能新浪潮

当AI开始学会“脑补”物理世界的运行规律,并尝试模拟一个动态变化的真实环境时,我们距离那个传说中的通用人工智能(AGI)究竟还有多远? 进入2026年以来,“世界模型”毫无悬念地成为了科技圈最炙手可热的核心议题。它标志着一个关键的范式转变:人工智能正从被动地“感知当下”,迈向主动地对时空与动态变化进

热心网友
05.19
世界模型第二期直播预约AI技术前沿与应用解析
AI资讯
世界模型第二期直播预约AI技术前沿与应用解析

上周三关于“世界模型”的线上沙龙反响空前热烈,这充分表明,从被动感知迈向主动推演,这条被视为实现通用人工智能(AGI)的核心技术路径,正深度吸引着整个AI行业的关注。鉴于持续高涨的讨论热度,我们决定加开一场深度分享会。 那么,这条充满潜力却又极具挑战性的前沿赛道,目前进展到了何种阶段?顶尖的研究者们

热心网友
05.19
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
科技数码
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币现货持有者坚定持仓 BTC价格逼近115000美元关键阻力位
web3.0
比特币现货持有者坚定持仓 BTC价格逼近115000美元关键阻力位

现货持有者坚守仓位,比特币接近115,000水平 近期比特币(BTC)价格接近$115,000水平,市场整体情绪谨慎,但现货持有者依旧坚守仓位,显示出一定的多头信心。 市场现状与资金流动 那么,当前市场的资金究竟在如何流动?分析显示,一个有趣的现象正在上演:短线资金的流入其实相当有限,市场热度并未急

热心网友
05.23
瑞波币XRP现最强看涨形态目标6美元 近期回调后走势深度解析
web3.0
瑞波币XRP现最强看涨形态目标6美元 近期回调后走势深度解析

目录 要点介绍:分析师称XRP呈现“最强看涨结构”高位清算集中于2 90美元以上区域 周四,XRP价格稳稳站在了2 80美元上方。这个位置守住了,意味着什么?意味着市场向那个经典的“杯柄形态”目标价——6美元以上——又迈进了一步。 要点介绍: 先看几个核心数据:周四XRP报收2 82美元。技术分析显

热心网友
05.23
以太坊衍生品市场企稳 交易员聚焦4500美元关键阻力位突破
web3.0
以太坊衍生品市场企稳 交易员聚焦4500美元关键阻力位突破

近期,以太坊(ETH)衍生品市场经历了短暂的闪崩,但随后价格快速企稳,交易者开始关注关键突破点——$4,500水平。 ETH衍生品市场现状 市场情绪往往在剧烈波动后显露真容。从最新的链上数据和期权、永续合约的交易情况来看,那场短暂的闪崩更像是一次压力测试——结果是,市场波动率显著下降,多空力量似乎进

热心网友
05.23
狗狗币DOGE暴涨11%交易量激增四倍 市场反弹行情能否持续
web3.0
狗狗币DOGE暴涨11%交易量激增四倍 市场反弹行情能否持续

DOGE单日暴涨11%,交易量激增四倍,市场风向变了? 最近,加密货币市场又热闹起来了。DOGE(狗狗币)上演了一出“旱地拔葱”,价格单日暴涨11%,更关键的是,成交量直接翻了四倍。这种“价量齐升”的场面,无疑给整个迷因币板块打了一针强心剂,市场情绪肉眼可见地回暖了。 DOGE价格拉升原因分析 那么

热心网友
05.23
欧易OKX官方APP下载指南 安全交易入口与安装教程
web3.0
欧易OKX官方APP下载指南 安全交易入口与安装教程

如何安全获取欧易(OKX)官方APP?一份详尽的下载与使用指南 Binance币安 欧易OKX ️ Huobi火币️ 当人们谈论“欧易易欧”时,指的往往是那个全球顶尖的数字资产交易平台——欧易(OKX)。作为业务版图庞大的行业巨头,其官方APP无疑是用户进行交易、查看行情和管理资产的核心工具。不过,

热心网友
05.23