蚂蚁灵波开源LingBot-VLA具身大模型 跨任务泛化能力创新高
具身智能领域迎来里程碑式开源突破。继昨日发布高精度空间感知模型LingBot-Depth后,蚂蚁集团旗下灵波科技今日正式宣布,全面开源其核心具身大模型LingBot-VLA。该模型定位为“智能基座”,专注于真实机器人操作场景,致力于突破跨本体与跨任务的泛化瓶颈,显著降低后训练成本,从而推动“一脑多机”从技术概念迈向工程化与规模化落地。
这款新开源的“机器人大脑”实际性能究竟如何?权威真机测试提供了有力证明。在上海交通大学发布的具身评测基准GM-100(涵盖100项真实操作任务)中,LingBot-VLA在三个不同的真实机器人平台上进行了全面验证。测试数据显示,其跨本体泛化的平均成功率,在未引入深度信息的情况下,已达到15.7%,显著超越了此前表现优异的Pi0.5模型(13.0%)。而当模型结合深度信息(w/Depth)后,其空间感知与理解能力得到强化,平均成功率进一步提升至17.3%,刷新了该真机评测的成功率纪录。这一结果充分验证了LingBot-VLA在复杂、动态的真实世界场景中的卓越性能与稳定性。

(图说:在 GM-100 真机评测中,LingBot-VLA 跨本体泛化性能超越 Pi0.5)
在虚拟仿真环境的严苛考验中,LingBot-VLA同样表现领先。在RoboTwin 2.0仿真基准(包含50项任务)的评测中,面对高强度环境随机化干扰(如光照突变、杂物遮挡、高度扰动等),模型凭借其独特的可学习查询对齐机制,实现了深度信息的深度融合,最终操作成功率较Pi0.5模型提升了9.92%。这不仅证明了其在仿真环境中的强大泛化能力,也为其从虚拟训练到现实部署的全链路可靠性提供了坚实保障。

(图说:在 RoboTwin 2.0 仿真评测中,LingBot-VLA 跨任务泛化性能超越 Pi0.5)
破解泛化难题,降低落地门槛
泛化能力不足一直是制约具身智能规模化落地的核心瓶颈。机器人本体形态多样,任务场景千变万化,环境条件复杂不一,导致针对特定硬件或任务训练的模型难以迁移,往往需要耗费巨量数据与算力进行重复后训练。这种高成本、低效率的模式,严重阻碍了技术的商业化进程与规模化复制。
LingBot-VLA的研发正是为了攻克这一难题。其强大的泛化能力源于超过20000小时的大规模真机数据预训练,数据覆盖了包括AgileX、Galaxea R1Pro/R1Lite、AgiBot G1在内的9种主流双臂机器人构型。广泛的“实践经验”使得同一个“大脑”能够高效适配不同机械结构的机器人,并在任务或环境发生变化时,依然保持高成功率与强鲁棒性。特别是当它与高精度空间感知模型LingBot-Depth协同工作时,能获得更优质的深度信息表征,相当于为机器人装备了更敏锐的“视觉系统”,实现“感知更精准,操作更智能”。
强大的基座能力直接带来了极低的下游应用门槛。据官方信息,仅需约80条演示数据,LingBot-VLA即可完成高质量的任务迁移与适配。同时,得益于底层代码库的深度优化,其训练效率达到了StarVLA、OpenPI等主流框架的1.5至2.8倍。这意味着开发者和企业能够以更少的数据标注量、更短的训练周期和更低的算力投入,快速实现模型在特定场景的部署,真正实现了数据成本与算力成本的双重降低。
开源全套工具链,加速生态构建
此次开源并非仅释放模型权重,而是同步开放了包含数据处理、高效微调及自动化评估在内的完整工具链与代码库。这一举措的战略价值在于,它极大地缩短了模型从获取到实际应用之间的工程化路径,降低了商业化落地的综合门槛。开发者可以基于这套成熟工具,快速针对自身业务场景进行定制化微调与验证,大幅提升了模型的实用性与易用性。
蚂蚁灵波科技CEO朱兴对此解读道:“具身智能要实现大规模应用,一个高效、通用的基座模型是关键基础。它直接决定了技术是否‘真正可用’以及是否‘经济可用’。我们开源LingBot-VLA,旨在与产业界共同探索具身智能的性能边界,推动整个领域进入一个可复用、可验证、可规模化落地的新阶段,加速人工智能在物理世界的深度融合与普及。”
值得关注的是,LingBot-VLA是蚂蚁集团开源的首款具身智能基座模型,也是其在AGI(通用人工智能)前沿方向上的重要探索成果。朱兴介绍,蚂蚁集团正持续以开源开放模式推进AGI研究,并构建了“InclusionAI”技术体系,形成了覆盖基础模型、多模态、推理、新型架构及具身智能的完整技术栈与开源生态。LingBot-VLA的开源正是这一战略的关键实践。“我们期待与全球开发者及产业伙伴携手,共同加速具身智能技术的迭代创新与产业应用。”朱兴表示。
据悉,在模型研发的数据采集与预训练阶段,星海图、松灵、乐聚、库帕思、国家地方共建人形机器人创新中心、北京人形机器人创新中心有限公司、博登智能、睿尔曼等多家产业伙伴提供了关键的硬件平台与高质量数据支持。目前,LingBot-VLA已成功与星海图、松灵、乐聚等厂商的机器人完成适配,初步验证了其在不同机器人构型上的跨本体迁移能力,为后续更广泛的产业协作与生态共建奠定了坚实基础。
相关攻略
第五届ATEC科技精英赛在香港收官,赛事以“无遥操”为核心,要求机器人在户外复杂地形中完全自主完成吊桥穿越、垃圾分拣等任务。来自全球的13支队伍参赛,浙江大学凭借全自主智能表现夺冠。比赛旨在推动机器人从实验室走向真实应用,通过真实场景挑战测试机器人的感知、决策与执行能力,促。
当AI眼镜学会“跑腿”:语音解锁单车,无感支付停车费 近来,智能穿戴领域的一个新动向值得关注:阿里旗下的千问AI眼镜,正式接入了蚂蚁集团的GPASS平台。这可不是一次简单的功能叠加,它意味着,诸如共享单车骑行、停车缴费这一系列高频的“AI办事”功能,开始从手机屏幕转移到了你的眼前。 简单说,借助GP
要闻提示1 OpenAI 与美国防部合作惹众怒:ChatGPT 卸载量大增 295%,一星评价暴涨 775%2 比亚迪车在以色列扛住了一枚导弹!车身完好没起火,乘客仅轻伤3 马云与阿里、蚂蚁核心管理
3月3日,市场调研机构Quest Mobile发布《2025年AI应用层发展核心报告》。数据显示,截止到2025年12月,移动端AI应用月活跃用户规模达到7 22亿。具体到12月的应用榜单上看,豆
来源:科技日报科技日报记者 刘霞一条胖乎乎的毛毛虫,居然能通过敲击节拍的方式,和蚂蚁“聊天”?甚至还说服蚂蚁把自己带回巢穴、当宝贝一样供养起来?这可不是童话故事,而是科学家刚刚发现的有趣真相。有些蝴
热门专题
热门推荐
英伟达Omniverse定位为物理AI操作系统。松应科技推出ORCALab1 0,旨在构建基于国产GPU的物理AI训练体系。针对机器人行业数据成本高、仿真迁移难的问题,平台提出“1:8:1黄金数据合成策略”,并通过高精度仿真提升数据可用性。平台将仿真与训练集成于个人设备,降低开发门槛,核心战略是在英伟达生态垄断下推动国产替。
Concordium是一个注重合规与隐私的区块链平台,其原生代币为CCD。该平台通过内置身份验证机制平衡隐私与监管要求,旨在服务企业级应用。CCD用于支付交易手续费、网络治理及生态内服务结算。其经济模型包含释放与销毁机制,以维持代币价值稳定。项目在合规金融、供应链、数字身份等领域有应用潜力。
上海人工智能实验室联合多家机构发起国产软硬件适配验证计划,致力于打造覆盖AI全流程的验证平台与自主生态社区。该平台旨在解决国产算力与应用协同难题,构建从芯片到应用的全链路验证体系,支持多种软硬件适配,推动国产AI技术向“好用、易用”发展。商汤科技依托AI大装置深度参与,已。
具身智能行业资本火热,但曾估值超200亿元的达闼科技迅速崩塌。其失败主因在于创始人黄晓庆以通信行业思维经营机器人业务,过度依赖政商关系与资本运作,技术产品突破有限;同时股权结构复杂分散,倚重政府基金,最终因融资断档与商业化不足导致团队离散。这折射出第一代创业者跨。
TurboQuant论文被质疑弱化与RaBitQ的关联,并存在理论比较与实验公平性问题。谷歌借助平台影响力将其定义为突破性成果,凸显了大厂在学术生态中的结构性优势。类似争议在伦理AI、芯片等领域亦有体现,反映了产业界将利益嵌入研究流程的机制。当前AI研究日益由大厂主导,其通过资本、渠道与话语权塑造。





