蚂蚁灵波LingBot-VLA开源:跨本体与任务的泛化能力突破
继昨日开源高精度空间感知模型LingBot-Depth后,蚂蚁集团旗下灵波科技今日宣布全面开源具身大模型 LingBot-VLA。作为一款面向真实机器人操作场景的“智能基座”,LingBot-VLA 实现了跨本体、跨任务泛化能力,并大幅降低后训练成本,推动“一脑多机”走向工程化落地。
在上海交通大学开源的具身评测基准 GM-100(包含 100 项真实操作任务)测试中,LingBot-VLA 在 3 个不同的真实机器人平台上,跨本体泛化平均成功率相比Pi0.5 的 13.0% 提升至 15.7%(w/o Depth)。引入深度信息(w/Depth)后,空间感知能力增强,平均成功率进一步攀升至 17.3%,刷新了真机评测的成功率纪录,验证了其在真实场景中的性能优势。

(图示:在 GM-100 真机评测中,LingBot-VLA 跨本体泛化性能超越 Pi0.5)
在 RoboTwin 2.0 仿真基准(包含50项任务)评测中,面对高强度的环境随机干扰(如光照、杂物、高度扰动等),LingBot-VLA 凭借独特可学习查询对齐机制,高度融合深度信息,操作成功率比 Pi0.5 提升了 9.92%,实现了从虚拟仿真到真实落地的全方位性能领跑。
(图示:在 RoboTwin 2.0 仿真评测中,LingBot-VLA 跨任务泛化性能超越 Pi0.5)
长期以来,由于本体差异、任务差异、环境差异等,具身智能模型落地面临严重的泛化性挑战。开发者往往需要针对不同硬件和不同任务重复采集大量数据进行后训练,直接抬高了落地成本,也使行业难以形成可规模化复制的交付路径。
针对上述问题,LingBot-VLA 基于 20000+小时大规模真机数据进行预训练,覆盖了 9 种主流双臂机器人构型(包括 AgileX,Galaxea R1Pro、R1Lite、AgiBot G1 等),从而让同一个“大脑”可以无缝迁移至不同构型的机器人,并在任务变化、环境变化时保持可用的成功率与鲁棒性。与高精度空间感知模型 LingBot-Depth 配合,LingBot-VLA 能获得更高质量的深度信息表征,通过“视力”的升级,真正做到“看得更清楚、做得更明白”。
LingBot-VLA 凭借扎实的基座能力,大幅降低了下游任务的适配门槛,仅需 80 条演示数据即可实现高质量的任务迁移。此外,配合底层代码库的深度优化,其训练效率达到StarVLA、OpenPI 等主流框架的1.5~2.8 倍,实现了数据与算力成本的双重降低。
此次开源不仅提供了模型权重,还同步开放了包含数据处理、高效微调及自动化评估在内的全套代码库。这一举措大幅压缩了模型训练周期,降低了商业化落地的算力与时间门槛,助力开发者以更低成本快速适配自有场景,模型实用性大幅提升。
蚂蚁灵波科技CEO朱兴表示:“具身智能要想大规模应用,依赖高效的具身基座模型,这直接决定了是否可用以及能否用得起。我们希望通过LingBot-VLA的开源,积极探索具身智能上限,推进具身智能研发早日进入可复用、可验证、可规模化落地的新阶段,让AI加速在物理世界渗透普及,更早地服务每一个人。”
LingBot-VLA是蚂蚁开源的第一款具身智能基座模型,也是蚂蚁在AGI研发上又一探索性成果。朱兴介绍,蚂蚁集团坚定以开源开放模式探索AGI,为此打造InclusionAI,构建了涵盖基础模型、多模态、推理、新型架构及具身智能的完整技术体系与开源生态。LingBot-VLA的开源,正是InclusionAI的关键实践。“期待携手全球开发者,加速具身智能技术的迭代与规模化应用,助力AGI更快到来。”
据悉,在数据采集阶段,LingBot-VLA 使用了星海图、松灵的硬件平台,乐聚、库帕思、国家地方共建人形机器人创新中心、北京人形机器人创新中心有限公司、博登智能、睿尔曼也在模型预训练阶段提供了高质量数据支持。目前,LingBot-VLA 已与星海图、松灵、乐聚等厂商完成适配,验证了模型在不同构型机器人上的跨本体迁移能力。
相关攻略
蚂蚁百灵开源Ring-2 6-1T模型,核心为可调节的“按需思考”机制,提供high与xhigh两档推理强度。high模式高效处理多轮对话等任务,xhigh模式专攻数学竞赛等高难度挑战。模型采用异步强化学习与“棒冰算法”提升训练效率,战略聚焦于提升真实环境下的计算效率与实用性。
蚂蚁灵波开源具身大模型LingBot-VLA,旨在提升机器人跨本体与跨任务泛化能力,降低落地成本。在GM-100真机评测中,其平均成功率提升至17 3%,刷新纪录;仿真测试成功率亦提高9 92%。该模型基于超两万小时真机数据预训练,仅需少量演示即可迁移任务,并配套开源工具链,推动具身智能规模化应用。
艾瑞咨询报告指出,金融智能体是金融机构数智化转型的关键。蚂蚁数科凭借业务理解与AI工程能力,被列为综合领导者。其“四车间”架构与金融大模型解决了决策可解释性问题,在AI应用、风控等场景表现突出。公司探索按效付费的RaaS模式,与机构风险共担,已助力银行提升效率与客户满意度。预计到。
第五届ATEC科技精英赛在香港收官,赛事以“无遥操”为核心,要求机器人在户外复杂地形中完全自主完成吊桥穿越、垃圾分拣等任务。来自全球的13支队伍参赛,浙江大学凭借全自主智能表现夺冠。比赛旨在推动机器人从实验室走向真实应用,通过真实场景挑战测试机器人的感知、决策与执行能力,促。
当AI眼镜学会“跑腿”:语音解锁单车,无感支付停车费 近来,智能穿戴领域的一个新动向值得关注:阿里旗下的千问AI眼镜,正式接入了蚂蚁集团的GPASS平台。这可不是一次简单的功能叠加,它意味着,诸如共享单车骑行、停车缴费这一系列高频的“AI办事”功能,开始从手机屏幕转移到了你的眼前。 简单说,借助GP
热门专题
热门推荐
公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。
理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小
5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给
比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”
Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构





