首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
高德ABot-World登顶四项权威评测,全球唯一在物理合规性、动作可控性、零样本泛化均达第一的世界模型

高德ABot-World登顶四项权威评测,全球唯一在物理合规性、动作可控性、零样本泛化均达第一的世界模型

热心网友
83
转载
2026-04-19

全球首款开放环境全自主具身机器人“高德途途”亮相,ABot全栈技术体系揭开面纱

就在4月19日,北京亦庄的一场机器人半程马拉松上,发生了一件足以载入行业发展史册的事件。阿里巴巴旗下高德,正式向全球公开了其首款开放环境全自主具身机器人——“高德途途”。这款四足机器人不仅完成了复杂避障、人群穿行等一系列高难度挑战,更关键的是,它成功协助视障人士完成了实战路线。这意味着什么?意味着具身智能技术,第一次真正意义上跨越了从“实验室”到“开放环境”之间的那道巨大鸿沟。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

途途能够应对导盲这类严苛场景,其底层依托绝非单一技术,而是高德全新发布的ABot全栈具身技术体系。这套体系的厉害之处在于,它基于上万种真实场景与千万级多模态数据,将高德沉淀多年的空间智能资产,高效转化为了具身核心的训练资源。可以说,这标志着全球首个面向通用人工智能(AGI)的全栈具身技术体系正式成型。

从架构上看,ABot体系彻底跳出了传统具身智能“单点拼凑、封闭验证”的碎片化老路。它以AGI为核心目标,首次将数据引擎、基座模型与执行中枢耦合为一个统一的系统。目前,高德ABot系列模型已经在全球15项权威基准测试中拿到了SOTA(领先水平),实力可见一斑。

ABot体系:三层飞轮式设计,构建持续进化的具身智能闭环

那么,这套体系究竟是如何运作的?其核心在于一个闭环飞轮式设计,涵盖了数据、模型、应用三层。这可不是简单的功能堆叠,而是深度咬合、互为引擎的精密结构,实现了“数据驱动模型、模型服务应用、应用反哺数据”的完美循环。正是这个设计,精准击穿了数据稀缺、仿真鸿沟与技能泛化这三大行业瓶颈,形成了一个能够持续自我进化的完整闭环。

数据是具身智能的核心“燃料”,直接决定了其泛化能力的天花板。但问题在于,不同于大语言模型,传统的真机采集方式成本高昂,难以规模化。怎么办?

作为数据层的核心,ABot-World给出了答案。它通过批量合成视频、深度、点云、轨迹四类训练数据,配合强化学习训练引擎在虚拟环境中定义奖惩、反复试错。简单来说,就是用高保真仿真替代高昂的真机采集,从根本上弥合了仿真到现实的鸿沟,将数据成本压缩了数个数量级。

模型层则重点解决两大难题:具身操作的通用性和导航的长程性。其核心是感知与决策的分工协作。其中,ABot-M负责操作,ABot-N负责导航,两个模型分工训练,再通过“模型技能”机制组合调用,从而协同完成长程复杂任务。

应用层的核心,是具身版的“龙虾”——ABot-Claw。它通过将异构机器人统一于共享的认知框架之下,打造了一个具备调度、记忆、分层控制与社会对齐能力的“执行中枢”。这直接应对了长程任务闭环难、知识不共享等行业痛点。

值得注意的是,ABot体系的设计逻辑,直接沿袭自高德成熟的空间智能飞轮。依托近10亿月活场景产生的海量时空数据与实时反馈,算法在闭环中持续迭代,推动模型对物理世界的认知不断加深。这个飞轮每日都在真实世界中自动演进,从根本上界定了高德的体系化优势:它不依赖某个单点技术的偶然突破,而是依靠整个飞轮在真实场景中持续运转的“转速”来赢得竞争。

ABot-World:物理合规性、动作可控性、零样本泛化三大维度均达全球第一

当主流的世界模型还在受困于“视觉幻觉”与动力学脱节时,ABot-World已经实现了率先突破。它成为全球首个将物理定律深度嵌入生成全流程的可微分、可进化动力学引擎。作为ABot体系的底层仿真基座,它直接决定了上层模型的物理一致性与泛化上限。正是以该引擎为核心,ABot体系才得以彻底打通“虚拟训练-真实部署”的闭环。

在架构上,ABot-World专为具身智能设计了14B DiT架构,以观测与动作为输入,在潜空间直接生成符合时空动力学的未来状态序列。同时,基于千万级真实数据与多层级采样治理,它成功突破了单一任务的泛化制约。

在场景构建上,其3DGS冷启动空间基座面向手机拍摄、航测图等稀疏输入,通过“粗建模、高保真修复再到蒸馏回环”的自动化流程,能将低质量视频转化为高质量3D场景,大幅拉低了数据成本。

训练方面,模型首创了Diffusion-DPO物理偏好对齐框架,由视觉语言模型生成物理规则清单并独立判别,构建优劣样本对,从而驱动模型主动抑制违反物理规律的行为。同时,拉格朗日动力学与3DGS重建的融合,使得每一帧画面都成为包含质量、摩擦、接触力等属性的可微分物理快照。

除此之外,ABot-World还构建了“训练+数据”双引擎并行架构,实现了模型自进化。依托自有地图与脱敏数据,结合3DGS技术实现厘米级重建与光照一致性,系统已累计生产了万级3D真实场景、百万级推理数据与千万级训练轨迹,覆盖了99%的典型生活场景。通过接入视觉语言-动作闭环,模型实现了“预测即训练,演练即学习”的持续进化,并经由跨形态动作映射,统一支持多种机械形态的精确控制。

在PBench、EZSbench、WorldArena、Agibot World Challenge等主流评测中,ABot-World持续保持领先,并成为唯一在物理合规性、动作可控性、零样本泛化三大维度均达到SOTA的模型。

ABot-N & ABot-M:ABot体系的“运动双核”,跨本体导航与操作基座斩获11项SOTA

如果把ABot全栈体系视为具身智能的“运行大脑”,那么ABot-N与ABot-M便是其不可或缺的“运动双核”。它们分别掌管机器人的“双腿”与“双手”,直接响应物理世界中“去哪里”与“做什么”的基础指令。依托统一架构设计,高德打造出了可解耦又可协同的专用基座模型,一举突破了跨形态适配与跨任务泛化的技术瓶颈。

作为全球首个实现五大核心导航任务“大一统”的视觉语言-动作基座模型,ABot-N具备了意图理解、自主决策与持续进化的能力,是途途走向开放世界的核心导航引擎。它采用层级式“大脑-动作”架构,通过多模块协同实现单一模型对导航任务的全覆盖,彻底打破了传统专用架构的泛化天花板。

ABot-N推出后,迅速在VLN-CE(R2R/RxR)、HM3D-OVON、EVT-Bench等7大权威基准上全面刷新SOTA,并在导航精度、社会合规性、零样本泛化能力上实现了断层式领先。

另一边,ABot-M则是全球首个统一架构的具身操作基座模型。它的目标很明确:实现一个“通用大脑”适配多种形态的机器人,从而大幅提升操作模型在异构机器人形态和任务场景下的泛化能力。

为此,ABot-M提出了全球首个动作流形学习,将学习目标由去噪重构转为流形投影,显著提升了动作生成的稳定性与解码效率,在高自由度全身控制等复杂场景中展现出更强的可扩展性。在感知端,它采用语义流和动作流双流并行的架构,有效提升了精细操作的执行精度。

在LIBERO、LIBERO-Plus、RoboCasa GR1、RoboTwin 2.0等主流评测中,ABot-M全面超越了π0.5、UniVLA、OpenVLA-OFT等强基线,在泛化能力、鲁棒性与跨形态迁移三个维度实现了系统性领先。

不仅如此,ABot-N与ABot-M的多项子成果还入选了ICLR、CVPR等顶级学术会议,成为精确、高效、安全的机器人导航与操作领域的范式参考。

ABot-Claw:首创“Map as Memory”的通用集中式Harness架构

记忆,是机器人跨越认知与执行鸿沟的底层基石。传统机器视觉受限于“视野之外即荒原”,记忆呈碎片化,严重制约了泛化能力。

为突破这一瓶颈,ABot-Claw首创了“Map as Memory”的理念,重构了具身智能的记忆机制。作为ABot体系的“执行中枢”,ABot-Claw采用集中式Harness架构,将高德地图与用户私有地图设为全局认知锚点,把多模态感知数据统一映射至共享语义空间,形成可动态刷新、持久沉淀的“世界记忆”。新终端接入后,仅需读取全局上下文即可零成本继承环境认知,彻底粉碎了场景孤岛。

另外,ABot-Claw采用了“云端大脑—边缘响应”两级设计,兼顾了智能深度与执行可靠性。在调度层面,该架构还支持多种异构机器人的并行协作与任务接力,故障时自动接续,实现了任务上下文的无缝移交与跨形态协作。这标志着机器人系统正从“单体智能”向“体系智能”演进,机器人不再是孤立个体,而是共享记忆、统一调度、协同进化的智能网络节点。

ABot-Claw还首创了闭环反馈与纠错机制,在模糊指令理解、跨机导引等复杂场景中,充分验证了其鲁棒性与泛化性。

伴随高德途途的全球首秀,高德同步宣布将开源ABot全体系。此举不仅是对“AMAP AI Inside”核心理念的深度践行,更将重塑具身智能的研发范式,加速AGI时代的全面到来。可以预见,一个由开放、协同的智能体所驱动的未来,正在加速成为现实。

来源:https://www.donews.com/news/detail/1/6517919.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

荣耀闪电机器人包揽半马前三,精密结构件由这家中国供应商提供
AI
荣耀闪电机器人包揽半马前三,精密结构件由这家中国供应商提供

荣耀机器人半马夺冠背后:精密结构如何成为“胜负手” 4月19日,2026北京亦庄人形机器人半程马拉松赛场上,结果有些“意料之外,情理之中”——荣耀旗下的“闪电”机器人包揽了赛事前三名。而这场胜利背后,一个关键角色浮出水面:核心供应商瑞声科技,正是它为“闪电”提供了决定性的本体精密结构支持。全长21公

热心网友
04.19
直击2026机器人半马:荣耀闪电率先冲线 速度较去年大幅提升
科技数码
直击2026机器人半马:荣耀闪电率先冲线 速度较去年大幅提升

直击2026机器人半马:荣耀闪电率先冲线 速度较去年大幅提升 今天,北京亦庄的赛道上演了一场别开生面的较量——2026年人形机器人半程马拉松正式鸣枪开跑。从现场传回的消息看,这场科技与耐力的测试,结果相当令人振奋。 与去年一样,赛程依然是经典的21公里。但今年的冠军成绩,却带来了一个巨大的飞跃。来自

热心网友
04.19
MOVA P60 高温洗扫拖机器人仅需 866 元26000Pa 吸力特惠新低
科技数码
MOVA P60 高温洗扫拖机器人仅需 866 元26000Pa 吸力特惠新低

MOVA P60 甄选版“破冰”新低:旗舰洗地机器人价格腰斩背后的机会 还记得去年MOVA Z5洗地机器人直降999元引发的热潮吗?用户反馈的热度还未完全散去,如今,轮到了上一代旗舰机型MOVA P60迎来价格“大跳水”。 MOVA P60最初于2025年2月上市,标准版官方定价为3999元,而功能

热心网友
04.19
高德公开全球首款开放环境全自主具身机器人
科技数码
高德公开全球首款开放环境全自主具身机器人

高德发布首款具身机器人“途途”,开放环境自主行动成现实 4月19日,高德正式揭晓了其首款具身机器人产品——途途。这款四足机器人被定义为“既能出门、会思考,也能作为智能导盲犬”,更关键的是,它被宣称为全球首款能够在开放环境下实现全自主行动的具身机器人。 赛事首秀:复杂环境下的能力验证 途途的首次公开亮

热心网友
04.19
高德首款具身机器人亮相马拉松大赛
科技数码
高德首款具身机器人亮相马拉松大赛

4月19日,一场特殊的马拉松 北京亦庄,2026年人形机器人半程马拉松赛的现场,出现了一个引人注目的组合:一位视障人士,在一台四足机器人的引导下,从容地绕开障碍、穿过熙攘的人群,并自主找到了补给站。整个过程流畅、自然,仿佛一位经验丰富的伙伴在旁协助。 这台机器人名叫“途途”。它的亮相之所以备受关注,

热心网友
04.19

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Chaplin
AI
Chaplin

Chaplin是什么 提起AI股票分析工具,很多投资者可能首先会想到各种通用型平台。但今天要聊的这个,有些特别——它叫Chaplin,一个专为专业交易者量身打造的分析利器。简单来说,这是一款由Chaplin app开发的工具,核心目标很明确:为那些渴求深度洞察和精准预测的专业投资者与交易者,提供前沿

热心网友
04.19
使用 hermes gateway start 命令让 AI 后台常驻运行
AI
使用 hermes gateway start 命令让 AI 后台常驻运行

执行hermes gateway start后服务未持续运行,需依次检查命令可用性、启用--daemon模式、注册systemd服务或手动创建service文件 遇到执行 hermes gateway start 命令后服务没跑起来,或者终端一关就停,甚至干脆提示“command not found

热心网友
04.19
Win10怎么设置多显示器_Win10多屏显示设置教程【简明】
系统平台
Win10怎么设置多显示器_Win10多屏显示设置教程【简明】

一、使用Win + P快捷键即时启用扩展模式 这个方法最直接,它绕过了复杂的设置界面,直接调用系统底层的投影功能。无论你是在游戏、办公还是系统卡顿的时候,都能快速调出,用来临时切换或者测试显示器连接状态非常方便。 操作前,先确保几个基本条件:所有显示器都通着电,视频线在电脑和显示器两头都插紧了,别忘

热心网友
04.19
MatchThatRoleAI
AI
MatchThatRoleAI

MatchThatRoleAI是什么 在求职市场里,一份好简历是敲门砖,但找到真正适合自己的岗位往往更像大海捞针。有没有一款工具能把这两件事儿都搞定,甚至还能帮你规划未来几年?还真有,这就是我们今天要聊的MatchThatRoleAI。 简单来说,它是一个在线智能平台,核心任务就是帮你“双向奔赴”。

热心网友
04.19
HermesAgentOpenRouter密钥填写位置在哪里
AI
HermesAgentOpenRouter密钥填写位置在哪里

一、环境变量文件 env 这是最推荐、也是优先级最高的配置方式。Hermes Agent 启动时会默认优先读取这个文件,好处是无需改动任何代码或主配置文件,对所有支持的模型提供商(包括OpenRouter)都通用。 具体操作很简单:找到或创建这个文件——路径是 ~ hermes env。然后,

热心网友
04.19