蚂蚁灵波开源世界模型LingBot,高保真交互毫秒级响应
一月二十九日,继连续发布空间感知与VLA基座模型后,蚂蚁灵波科技再次刷新行业预期,开源发布世界模型 LingBot-World。该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美 Google Genie 3,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。
在适用场景、生成长度、动态程度、分辨率等方面,LingBot-World 均处于业界顶尖水平。
针对视频生成中最常见的“长时漂移”问题(生成时间一长就可能会出现物体变形、细节坍塌、主体消失或场景结构崩坏等现象),LingBot-World 通过多阶段训练以及并行化加速,实现了近 10 分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。
交互性能上,LingBot-World 可实现约 16 FPS 的生成吞吐,并将端到端交互延迟控制在 1 秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。此外,用户可通过文本触发环境变化与世界事件,例如调整天气、改变画面风格或生成特定事件,并在保持场景几何关系相对一致的前提下完成变化。
一致性压力测试,镜头最长移开60秒后返回,目标物体仍存在且结构一致
高动态环境下,镜头长时间移开后返回,车辆形态外观仍保持一致
镜头长时间移开后返回,房屋仍存在且结构一致
模型具备 Zero-shot 泛化能力,仅需输入一张真实照片(如城市街景)或游戏截图,即可生成可交互的视频流,无需针对单一场景进行额外训练或数据采集,从而降低在不同场景中的部署与使用成本。
为解决世界模型训练中高质量交互数据匮乏的问题,LingBot-World 采用了混合采集策略:一方面通过清洗大规模的网络视频以覆盖多样化的场景,另一方面结合游戏采集与虚幻引擎(UE)合成管线,从渲染层直接提取无 UI 干扰的纯净画面,并同步记录操作指令与相机位姿,为模型学习“动作如何改变环境”提供精确对齐的训练信号。
具身智能的规模化落地面临一个核心挑战——复杂长程任务的真机训练数据极度稀缺。LingBot-World 凭借长时序一致性(也就是记忆能力)、实时交互响应,以及对“动作-环境变化”因果关系的理解,能够在数字世界中“想象”物理世界,为智能体的场景理解和长程任务执行提供了一个低成本、高保真的试错空间。同时,LingBot-World 支持场景多样化生成(如光照、摆放位置变化等),也有助于提升具身智能算法在真实场景中的泛化能力。
随着“灵波”系列连续发布三款具身领域大模型,蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸。这标志着其“基础模型-通用应用-实体交互”的全栈路径已然清晰。蚂蚁正通过InclusionAI 社区将模型全部开源,和行业共建,探索AGI的边界。一个旨在深度融合开源开放并服务于真实场景的AGI生态,正加速成型。
目前,LingBot-World 模型权重及推理代码已面向社区开放。
相关攻略
300 万对样本、2 71T 数据,蚂蚁灵波开源大规模空间感知数据集 3 月 31 日,蚂蚁集团旗下的灵波科技(Ant Group LingBot)向社区投下了一枚“重磅数据冲击波”——正式开源了其大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。这个消息,无疑为正在快速发
在基座模型阶段,蚂蚁灵波选择那条“慢”但正确的路。作者|周悦编辑|王博1956年的好莱坞电影《禁忌星球》里,有一个名叫Robby的机器人。它力大无穷、逻辑严密,却被设定了一条不可违背的禁令——不能伤
作者 | 郭海惟邮箱 | guohaiwei@pingwest com马上要过年了,蚂蚁旗下的灵波科技这几天像是下饺子一样,连续发了一堆具身的新成果。他们1月27日先是发了开源高精度空间感知模型
蚂蚁集团旗下具身智能公司灵波科技本周接连开源四个大模型。1 月 30 日,蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。LingBot-VA提出自回归视频-动作世界建模框架,将大规模视频生成
来源:环球网【环球网科技报道 记者 李文瑶】近日,全球人工智能领域接连迎来重磅消息。1月27日至30日,蚂蚁集团旗下灵波科技连续四天密集开源发布四大核心模型——空间感知模型LingBot-Depth
热门专题
热门推荐
为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘
Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,
劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲
新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。
当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID





