游乐游手机版
首页/科技数码/文章详情

越疆空弈DobotWAM具身大模型LIBERO评测夺冠

时间:2026-05-31 22:56
具身智能领域近期涌现出一个令人瞩目的成果。越疆科技正式推出了其自主研发的全球动作模型——空弈DobotWAM具身大模型,并在业内公认的硬核评测平台LIBERO上取得了表现十分亮眼的成绩。 先列出几个核心事实:在LIBERO的四个标准任务套件中,空弈DobotWAM实现了平均99 25%的成功率。这四

具身智能领域近期涌现出一个令人瞩目的成果。越疆科技正式推出了其自主研发的全球动作模型——空弈DobotWAM具身大模型,并在业内公认的硬核评测平台LIBERO上取得了表现十分亮眼的成绩。

先列出几个核心事实:在LIBERO的四个标准任务套件中,空弈DobotWAM实现了平均99.25%的成功率。这四个套件分别用于考验空间关系理解、物体泛化能力、目标指令理解以及长时序任务执行能力。99.25%这一成绩,直接将π0.5、π0、GR00T-N1.5、π0+FAST等公开模型,以及行业内其他已公布数据的模型,都远远甩在了身后。

深圳具身智能企业越疆空弈DobotWAM具身大模型,LIBERO评测第一、排名第一

更值得关注的是,在LIBERO-Object这个套件中,空弈实现了100/100的满分成绩。而在Spatial、Goal和LIBERO-10三个套件中,也分别交出了99/100的优异答卷。这绝非偶然或运气,而是其真实技术实力的体现。

越疆能够跻身具身智能行业头部阵营,背后是近三年来从协作机器人到具身智能的完整战略升级。依托对机器人“身体”操作能力的深刻洞察,空弈DobotWAM构建了自身独特的具身优势。换言之,此次在LIBERO上的出色表现,是整个产品战略升级的必然结果。

话说回来,具身智能的下一站,并非更华丽的演示,而是真实可用的现场执行能力。过去我们也见过不少机器人演示,大多为预设轨迹的舞蹈、翻跟头,视觉效果虽然拉满,但距离实际生产场景相去甚远。而越疆此次将焦点拉回到了插接、抓取、对准这类高精度接触作业上,让具身智能真正迈向可用、可靠、可落地的阶段。这才是行业真正需要的前进方向。

机器人要走向真实应用,真正的挑战并非“识别物体”,而是在动态、多变的开放场景中,理解空间关系,拆解任务目标,生成符合运动结构的动作,同时保证多步执行中的全局一致性。这实际上是一个极高的要求。

近两年,视觉—语言—动作模型已成为具身智能动作生成的主流范式。在数据覆盖充分、任务边界清晰的场景下,这套范式确实高效。但问题在于,过度依赖二维图像模式或离线轨迹模仿,在面对空间扰动、物体变化、长流程任务和真实接触反馈时,很容易出现动作漂移、目标丢失,或者局部动作正确但整体任务失败的情况。这意味着机器人模型必须超越单纯的“模仿”,建立起对动作深层次结构的真正理解。

空弈DobotWAM的高成功率,正是源于其在感知、理解、控制与数据闭环上的系统性设计。在视觉—语言—动作建模的基础上,它进一步引入了三维空间理解、机器人运动几何约束和真实数据闭环机制。结果就是,机器人不仅学会了“模仿动作”,更学会了“理解动作为什么这样做”。

核心技术突破主要体现在四个方面:

第一个是3D-Aware Spatial Representation。简单来说,就是将3D空间信息直接引入视觉—语言—动作建模。这样一来,模型不再仅依赖2D图像的纹理和像素特征,而是能够显式感知物体的位置、空间关系,以及操作目标之间的几何结构,泛化能力自然更强。

第二个是Joint Dynamic Geometry Loss。该技术将机器人关节的动态信息和末端执行器的几何约束都融入了训练损失函数,让模型从“模仿动作”升级为“理解真实动作结构”。带来的直接收益是:轨迹漂移减少,姿态不连续的问题得到缓解,抓取失败率降低,长时序任务的执行稳定性显著提升。

第三个是Advanced VLM Task Decomposition。基于高级VLM backbone,该模型能够对复杂语言指令进行语义理解和任务拆解,将长流程操作分解成清晰的阶段目标和可执行的子步骤。这解决了行业里一个老大难问题:局部动作都对,但整体任务就是完不成。

第四个是High-Quality Data Flywheel + Real-Robot Recap。越疆构建了一个高质量数据飞轮,核心是Recap真机实验,闭环完成采集、训练、评测和反馈。成功案例、失败案例、长尾场景的真实经验被持续吸收,显著提升了从仿真benchmark到真实环境的迁移能力。

这四项技术彼此耦合、相互增强,使空弈DobotWAM能够更稳定地完成多物体、多阶段、长时序的机器人操作任务。它为具身智能的大规模落地提供了一个可复用的系统性框架。

拿三个典型的测试任务来说:分类抓取、插充电器、插笔帽。这些任务看似日常,实则是高精度接触作业的典型代表。模型不仅要识别目标物体的位置,还得理解插头与插座、笔身与笔帽之间的空间关系,连续完成对准、接近、插入和闭合等动作。这直接考验的是小目标定位与姿态估计、强几何约束下的末端控制,以及接触过程中的稳定执行与误差修正这三项关键能力。

测试中,空弈DobotWAM能够基于视觉观测完成目标定位,结合机器人自身状态实时生成动作,使机械臂在真实环境中稳定完成抓取和充电器插接流程。在插笔帽任务中,模型准确判断笔身与笔帽的相对位置及开口方向,完成轴线对齐和精细插入动作,全程姿态稳定。三项任务的连续稳定完成,验证了它在真实物理世界中从空间理解、姿态控制到接触执行的完整闭环能力。

具身智能要走向真实世界,不能只依赖更大的模型参数,也不能只依赖单次演示中的亮眼表现。真正能够推动机器人规模化落地的,是一套同时具备空间理解、任务规划、精准执行和持续进化能力的模型系统。越疆空弈DobotWAM具身大模型,正是沿着这一路径迈出的关键一步。未来,越疆将继续围绕真实机器人场景推进模型迭代,让机器人从“能看懂、能行动”,进一步走向“能适应、能泛化、能长期可靠执行”。

来源:https://www.163.com/dy/article/KU9MA257053469RG.html
上一篇618开门红秒杀攻略:小米手环1元抢百度网盘13.5元/月 下一篇暴力熊与猫头鹰联名显卡监测器亮相台北电脑展2026
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态
科技数码 · 2026-07-01

国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态

6月30日,机器人ETF易方达(159530)盘中涨幅超过4 3%,报收1 555元,机器人板块整体表现活跃。消息面上,国内首个基于开源鸿蒙的机器人操作系统社区(M-Robots)正式启动运营并发布了年度发展路线,日本GMO INTERNET集团子公司与宇树科技达成合作协议。国产机器人软件生态建设取

ROI利剑悬顶,AI员工面临效益大考
科技数码 · 2026-07-01

ROI利剑悬顶,AI员工面临效益大考

先说说现在AI行业一个普遍现象:几乎所有公司都在按“使用量”来收费。不管是按token消耗算,还是按额度制走,本质上都是“用多少,付多少”。 这套模式放在模型API上当然没问题,但放到那些越来越深入企业工作流的Agent身上,就有点水土不服了。你想想,一个Agent为了完成一个任务,需要反复读取上下

武汉光谷三年投入超10亿元打造智能体之城
科技数码 · 2026-07-01

武汉光谷三年投入超10亿元打造智能体之城

6月29日,武汉光谷智能体经济大会正式召开,会上重磅发布了“光谷智能体引力计划”。根据规划,未来3年内,光谷将在政策扶持、算力基建、产业基金等领域投入超过10亿元,致力于全域打造智能体之城,抢占人工智能产业新高地。 具体如何推进?主要依托湖北科创供应链平台,设立光谷智能体场景发布厅,引导百亿级人工智

苹果印度梦受挫 iPhone 18 Pro机密文件泄露
科技数码 · 2026-07-01

苹果印度梦受挫 iPhone 18 Pro机密文件泄露

从暗网流出的文件来看,窃取苹果印度供应商塔塔电子数据的勒索软件组织,此次曝光的“重磅信息”中,明确包含了即将发布的iPhone 18 Pro机型的敏感组件清单、供应商名单以及实物照片。消息人士和文件内容均证实了这一点。 这绝非小事。苹果在全球供应商之间精密运转的iPhone组装业务,直接面临威胁。众

企业级AI聚焦全场景闭环办事加速成为业绩抓手
科技数码 · 2026-07-01

企业级AI聚焦全场景闭环办事加速成为业绩抓手

AI产业正从技术验证阶段迈向深度产业落地的关键转型期,这一趋势正成为驱动企业数智化增长的核心引擎。6月30日,联想乐享迎来重要升级——4 0版本正式发布。作为业界首个企业级超级智能体,此次升级带来了三项扎实成果:自主研制的Harness运行层、自我进化与反思机制,以及多场景Skill能力体系,三大支