首页 游戏 软件 资讯 排行榜 专题
首页
AI
蚂蚁灵波开源世界模型LingBot,高保真交互毫秒级响应

蚂蚁灵波开源世界模型LingBot,高保真交互毫秒级响应

热心网友
26
转载
2026-01-30

一月二十九日,继连续发布空间感知与VLA基座模型后,蚂蚁灵波科技再次刷新行业预期,开源发布世界模型 LingBot-World。该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美 Google Genie 3,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。

在适用场景、生成长度、动态程度、分辨率等方面,LingBot-World 均处于业界顶尖水平。

针对视频生成中最常见的“长时漂移”问题(生成时间一长就可能会出现物体变形、细节坍塌、主体消失或场景结构崩坏等现象),LingBot-World 通过多阶段训练以及并行化加速,实现了近 10 分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。

交互性能上,LingBot-World 可实现约 16 FPS 的生成吞吐,并将端到端交互延迟控制在 1 秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。此外,用户可通过文本触发环境变化与世界事件,例如调整天气、改变画面风格或生成特定事件,并在保持场景几何关系相对一致的前提下完成变化。

一致性压力测试,镜头最长移开60秒后返回,目标物体仍存在且结构一致

高动态环境下,镜头长时间移开后返回,车辆形态外观仍保持一致

镜头长时间移开后返回,房屋仍存在且结构一致

模型具备 Zero-shot 泛化能力,仅需输入一张真实照片(如城市街景)或游戏截图,即可生成可交互的视频流,无需针对单一场景进行额外训练或数据采集,从而降低在不同场景中的部署与使用成本。

为解决世界模型训练中高质量交互数据匮乏的问题,LingBot-World 采用了混合采集策略:一方面通过清洗大规模的网络视频以覆盖多样化的场景,另一方面结合游戏采集与虚幻引擎(UE)合成管线,从渲染层直接提取无 UI 干扰的纯净画面,并同步记录操作指令与相机位姿,为模型学习“动作如何改变环境”提供精确对齐的训练信号。

具身智能的规模化落地面临一个核心挑战——复杂长程任务的真机训练数据极度稀缺。LingBot-World 凭借长时序一致性(也就是记忆能力)、实时交互响应,以及对“动作-环境变化”因果关系的理解,能够在数字世界中“想象”物理世界,为智能体的场景理解和长程任务执行提供了一个低成本、高保真的试错空间。同时,LingBot-World 支持场景多样化生成(如光照、摆放位置变化等),也有助于提升具身智能算法在真实场景中的泛化能力。

随着“灵波”系列连续发布三款具身领域大模型,蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸。这标志着其“基础模型-通用应用-实体交互”的全栈路径已然清晰。蚂蚁正通过InclusionAI 社区将模型全部开源,和行业共建,探索AGI的边界。一个旨在深度融合开源开放并服务于真实场景的AGI生态,正加速成型。

目前,LingBot-World 模型权重及推理代码已面向社区开放。

来源:https://www.51cto.com/article/835343.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

300 万对样本、2.71T 数据,蚂蚁灵波开源大规模空间感知数据集
AI
300 万对样本、2.71T 数据,蚂蚁灵波开源大规模空间感知数据集

300 万对样本、2 71T 数据,蚂蚁灵波开源大规模空间感知数据集 3 月 31 日,蚂蚁集团旗下的灵波科技(Ant Group LingBot)向社区投下了一枚“重磅数据冲击波”——正式开源了其大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。这个消息,无疑为正在快速发

热心网友
04.22
对话蚂蚁灵波首席科学家沈宇军:2万小时真机数据锤炼具身智能慢功夫
AI
对话蚂蚁灵波首席科学家沈宇军:2万小时真机数据锤炼具身智能慢功夫

在基座模型阶段,蚂蚁灵波选择那条“慢”但正确的路。作者|周悦编辑|王博1956年的好莱坞电影《禁忌星球》里,有一个名叫Robby的机器人。它力大无穷、逻辑严密,却被设定了一条不可违背的禁令——不能伤

热心网友
02.10
“指挥双手”成风口:蚂蚁灵波布局具身智能更清晰
科技数码
“指挥双手”成风口:蚂蚁灵波布局具身智能更清晰

作者 | 郭海惟邮箱 | guohaiwei@pingwest com马上要过年了,蚂蚁旗下的灵波科技这几天像是下饺子一样,连续发了一堆具身的新成果。他们1月27日先是发了开源高精度空间感知模型

热心网友
01.31
蚂蚁灵波一周四连发,揭秘具身智能开源基座新范式
科技数码
蚂蚁灵波一周四连发,揭秘具身智能开源基座新范式

蚂蚁集团旗下具身智能公司灵波科技本周接连开源四个大模型。1 月 30 日,蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。LingBot-VA提出自回归视频-动作世界建模框架,将大规模视频生成

热心网友
01.30
蚂蚁灵波开源全球模型竞赛神器,谷歌开放模型体验平台
科技数码
蚂蚁灵波开源全球模型竞赛神器,谷歌开放模型体验平台

来源:环球网【环球网科技报道 记者 李文瑶】近日,全球人工智能领域接连迎来重磅消息。1月27日至30日,蚂蚁集团旗下灵波科技连续四天密集开源发布四大核心模型——空间感知模型LingBot-Depth

热心网友
01.30

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

斯柯达晶锐Fabia Motorsport特别版车型正式发布
业界动态
斯柯达晶锐Fabia Motorsport特别版车型正式发布

为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘

热心网友
05.18
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元
web3.0
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元

Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,

热心网友
05.18
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾
业界动态
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾

劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲

热心网友
05.18
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台
游戏资讯
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台

新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。

热心网友
05.18
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录
业界动态
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录

当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID

热心网友
05.18