蚂蚁灵波开源LingBot-VLA具身大模型跨任务泛化能力创新高

首页

热心网友

转载

2026-05-16

具身智能领域迎来里程碑式开源突破。继昨日发布高精度空间感知模型LingBot-Depth后，蚂蚁集团旗下灵波科技今日正式宣布，全面开源其核心具身大模型LingBot-VLA。该模型定位为“智能基座”，专注于真实机器人操作场景，致力于突破跨本体与跨任务的泛化瓶颈，显著降低后训练成本，从而推动“一脑多机”从技术概念迈向工程化与规模化落地。

这款新开源的“机器人大脑”实际性能究竟如何？权威真机测试提供了有力证明。在上海交通大学发布的具身评测基准GM-100（涵盖100项真实操作任务）中，LingBot-VLA在三个不同的真实机器人平台上进行了全面验证。测试数据显示，其跨本体泛化的平均成功率，在未引入深度信息的情况下，已达到15.7%，显著超越了此前表现优异的Pi0.5模型（13.0%）。而当模型结合深度信息（w/Depth）后，其空间感知与理解能力得到强化，平均成功率进一步提升至17.3%，刷新了该真机评测的成功率纪录。这一结果充分验证了LingBot-VLA在复杂、动态的真实世界场景中的卓越性能与稳定性。

（图说：在 GM-100 真机评测中，LingBot-VLA 跨本体泛化性能超越 Pi0.5）

在虚拟仿真环境的严苛考验中，LingBot-VLA同样表现领先。在RoboTwin 2.0仿真基准（包含50项任务）的评测中，面对高强度环境随机化干扰（如光照突变、杂物遮挡、高度扰动等），模型凭借其独特的可学习查询对齐机制，实现了深度信息的深度融合，最终操作成功率较Pi0.5模型提升了9.92%。这不仅证明了其在仿真环境中的强大泛化能力，也为其从虚拟训练到现实部署的全链路可靠性提供了坚实保障。

（图说：在 RoboTwin 2.0 仿真评测中，LingBot-VLA 跨任务泛化性能超越 Pi0.5）

破解泛化难题，降低落地门槛

泛化能力不足一直是制约具身智能规模化落地的核心瓶颈。机器人本体形态多样，任务场景千变万化，环境条件复杂不一，导致针对特定硬件或任务训练的模型难以迁移，往往需要耗费巨量数据与算力进行重复后训练。这种高成本、低效率的模式，严重阻碍了技术的商业化进程与规模化复制。

LingBot-VLA的研发正是为了攻克这一难题。其强大的泛化能力源于超过20000小时的大规模真机数据预训练，数据覆盖了包括AgileX、Galaxea R1Pro/R1Lite、AgiBot G1在内的9种主流双臂机器人构型。广泛的“实践经验”使得同一个“大脑”能够高效适配不同机械结构的机器人，并在任务或环境发生变化时，依然保持高成功率与强鲁棒性。特别是当它与高精度空间感知模型LingBot-Depth协同工作时，能获得更优质的深度信息表征，相当于为机器人装备了更敏锐的“视觉系统”，实现“感知更精准，操作更智能”。

强大的基座能力直接带来了极低的下游应用门槛。据官方信息，仅需约80条演示数据，LingBot-VLA即可完成高质量的任务迁移与适配。同时，得益于底层代码库的深度优化，其训练效率达到了StarVLA、OpenPI等主流框架的1.5至2.8倍。这意味着开发者和企业能够以更少的数据标注量、更短的训练周期和更低的算力投入，快速实现模型在特定场景的部署，真正实现了数据成本与算力成本的双重降低。

开源全套工具链，加速生态构建

此次开源并非仅释放模型权重，而是同步开放了包含数据处理、高效微调及自动化评估在内的完整工具链与代码库。这一举措的战略价值在于，它极大地缩短了模型从获取到实际应用之间的工程化路径，降低了商业化落地的综合门槛。开发者可以基于这套成熟工具，快速针对自身业务场景进行定制化微调与验证，大幅提升了模型的实用性与易用性。

蚂蚁灵波科技CEO朱兴对此解读道：“具身智能要实现大规模应用，一个高效、通用的基座模型是关键基础。它直接决定了技术是否‘真正可用’以及是否‘经济可用’。我们开源LingBot-VLA，旨在与产业界共同探索具身智能的性能边界，推动整个领域进入一个可复用、可验证、可规模化落地的新阶段，加速人工智能在物理世界的深度融合与普及。”

值得关注的是，LingBot-VLA是蚂蚁集团开源的首款具身智能基座模型，也是其在AGI（通用人工智能）前沿方向上的重要探索成果。朱兴介绍，蚂蚁集团正持续以开源开放模式推进AGI研究，并构建了“InclusionAI”技术体系，形成了覆盖基础模型、多模态、推理、新型架构及具身智能的完整技术栈与开源生态。LingBot-VLA的开源正是这一战略的关键实践。“我们期待与全球开发者及产业伙伴携手，共同加速具身智能技术的迭代创新与产业应用。”朱兴表示。

据悉，在模型研发的数据采集与预训练阶段，星海图、松灵、乐聚、库帕思、国家地方共建人形机器人创新中心、北京人形机器人创新中心有限公司、博登智能、睿尔曼等多家产业伙伴提供了关键的硬件平台与高质量数据支持。目前，LingBot-VLA已成功与星海图、松灵、乐聚等厂商的机器人完成适配，初步验证了其在不同机器人构型上的跨本体迁移能力，为后续更广泛的产业协作与生态共建奠定了坚实基础。

来源:https://www.leiphone.com/category/ai/deykYBXwVJwzOQxI.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：豆包AI安全使用指南如何防止信息泄露下一篇：Recraft AI账号注册教程：新用户详细步骤与避坑指南

热门推荐

松应科技发布ORCA Lab 1.0 国产物理AI操作系统替代方案

英伟达Omniverse定位为物理AI操作系统。松应科技推出ORCALab1 0，旨在构建基于国产GPU的物理AI训练体系。针对机器人行业数据成本高、仿真迁移难的问题，平台提出“1:8:1黄金数据合成策略”，并通过高精度仿真提升数据可用性。平台将仿真与训练集成于个人设备，降低开发门槛，核心战略是在英伟达生态垄断下推动国产替。

热心网友

05.16

web3.0

Concordium CCD币全面解析：发行机制、应用场景与投资前景

Concordium是一个注重合规与隐私的区块链平台，其原生代币为CCD。该平台通过内置身份验证机制平衡隐私与监管要求，旨在服务企业级应用。CCD用于支付交易手续费、网络治理及生态内服务结算。其经济模型包含释放与销毁机制，以维持代币价值稳定。项目在合规金融、供应链、数字身份等领域有应用潜力。

热心网友

05.16

上海人工智能实验室联合商汤共建AI全链路验证平台与生态社区

上海人工智能实验室联合多家机构发起国产软硬件适配验证计划，致力于打造覆盖AI全流程的验证平台与自主生态社区。该平台旨在解决国产算力与应用协同难题，构建从芯片到应用的全链路验证体系，支持多种软硬件适配，推动国产AI技术向“好用、易用”发展。商汤科技依托AI大装置深度参与，已。

热心网友

05.16

达闼科技陨落一周年回顾具身智能独角兽兴衰启示录

具身智能行业资本火热，但曾估值超200亿元的达闼科技迅速崩塌。其失败主因在于创始人黄晓庆以通信行业思维经营机器人业务，过度依赖政商关系与资本运作，技术产品突破有限；同时股权结构复杂分散，倚重政府基金，最终因融资断档与商业化不足导致团队离散。这折射出第一代创业者跨。

热心网友

05.16

大厂学术霸权引争议 TurboQuant事件暴露学界困境如何破局

TurboQuant论文被质疑弱化与RaBitQ的关联，并存在理论比较与实验公平性问题。谷歌借助平台影响力将其定义为突破性成果，凸显了大厂在学术生态中的结构性优势。类似争议在伦理AI、芯片等领域亦有体现，反映了产业界将利益嵌入研究流程的机制。当前AI研究日益由大厂主导，其通过资本、渠道与话语权塑造。

热心网友

05.16