游乐游手机版
首页/科技数码/文章详情

对标Genie 3,蚂蚁研开源世界模型LingBot-World,视频10分钟无损生成

时间:2026-01-30 11:19
1 月 29 日,继连续发布空间感知与VLA基座模型后,蚂蚁灵波科技再次刷新行业预期,开源发布世界模型 LingBot-World。该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美

1月29日,蚂蚁灵波科技继先前发布空间感知基座模型后,再次以开源世界模型LingBot-World刷新行业预期。该模型在视频质量、动态表现、长时一致性以及交互能力等核心指标上均与Google最新的Genie 3媲美,旨在为具身智能、自动驾驶及游戏开发等领域,提供一个高保真、高动态、可实时操控的“数字演训场”。

对标 Genie 3,蚂蚁灵波开源世界模型 LingBot-World,10分钟长视频无损生成(图示:LingBot-World在适用场景、生成时长、动态程度、分辨率等方面均达到了业界顶尖水平)

针对视频生成中常见的“长时漂移”问题(即生成时间过长可能出现物体变形、细节坍陷、主体消失或场景结构破坏等现象),LingBot-World凭借多阶段训练以及并行化加速,实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供了有力支撑。

在交互性能方面,LingBot-World可实现约16 FPS的生成吞吐,并将端到端交互延迟控制在1秒以内。用户可以通过键盘或鼠标实时操控角色与相机视角,画面随指令即时反馈。此外,用户还能通过文本指令触发环境变化与世界事件,例如调整天气、改变画面风格或生成特定事件,并在保持场景几何关系相对一致的前提下完成动态演变。

对标 Genie 3,蚂蚁灵波开源世界模型 LingBot-World,10分钟长视频无损生成(图示:一致性压力测试:镜头最长移开60秒后返回,目标物体仍存在且结构一致)

对标 Genie 3,蚂蚁灵波开源世界模型 LingBot-World,10分钟长视频无损生成(图示:高动态环境下,镜头长时间移开后返回,车辆形态外观仍保持一致)

对标 Genie 3,蚂蚁灵波开源世界模型 LingBot-World,10分钟长视频无损生成(图示:镜头长时间移开后返回,房屋仍存在且结构一致)

模型具备强大的Zero-shot泛化能力,仅需输入一张真实照片(如城市街景)或游戏截图,即可生成可交互的视频流,无需针对单一场景进行额外训练或数据采集,从而降低了在不同场景中的部署与使用成本。

为解决世界模型训练中高质量交互数据匮乏的难题,LingBot-World采用了混合采集策略:一方面通过清洗大规模的网络视频以覆盖多样化的场景,另一方面结合游戏采集与虚幻引擎合成管线,从渲染层直接提取无UI干扰的纯净画面,并同步记录操作指令与相机位姿,为模型学习“动作如何改变环境”提供了精确对齐的训练信号。

具身智能的规模化落地面临一个核心挑战——复杂长程任务的真机训练数据极度稀缺。LingBot-World凭借长时序一致性(即记忆能力)、实时交互响应,以及对“动作-环境变化”因果关系的深刻理解,能够在数字世界中“想像”物理世界,为智能体的场景理解和长程任务执行提供了一个低成本、高保真的试错空间。同时,LingBot-World支持场景多样化生成(如光照、摆放位置变化等),也有助于提升具身智能算法在真实场景中的泛化能力。

随着“灵波”系列连续发布三款具身领域大模型,蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸。这标志着其“基础模型-通用应用-实体交互”的全栈路径已然清晰。蚂蚁正通过InclusionAI社区将模型全部开源,与行业共建,探索AGI的边界。一个旨在深度融合开源开放并服务于真实场景的AGI生态,正在加速成形。

目前,LingBot-World模型权重及推理代码已面向社区开放。

来源:https://www.leiphone.com/category/ai/KSxQNHzSG9VZub1A.html
上一篇李想眼中,理想汽车的未来就是AI 下一篇马斯克重塑特斯拉使命:聚焦AI与人形机器人,华尔街反应不一
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南
科技数码 · 2026-06-07

2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南

国补政策一落地,身边不少朋友都开始在盘算换新机。学生党、年轻姑娘、还有那些天天拍短视频的创作者,成了这波购机主力。大家普遍头疼的是:手里预算就那么多,想要颜值、拍照、续航都兼顾,实在不容易。这次我们把vivo几款热门机型真机摸了个遍,结合实验室实测数据,从影像、做工、续航到补贴后到手价,一步步拆解。

SHEIN污染问题与环保管理框架全面解读
科技数码 · 2026-06-07

SHEIN污染问题与环保管理框架全面解读

SHEIN希音环保表现,关键要看这个框架 关注SHEIN希音的环保问题,其实是在探讨一个非常现实的话题:作为一家全球性的时尚零售商,它究竟如何应对服装行业长期面临的环境挑战——资源消耗、库存积压、碳排放、包装与纺织废弃物?如果能够把这些议题梳理清楚,那么对SHEIN希音的整体环保表现,心里也就大致有

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%
科技数码 · 2026-06-07

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%

苹果官方翻新商店再次迎来新品上架。6月5日,据MacRumors报道,美国官网的官方翻新专区悄然上线了三款2025年9月发布的智能手表——Apple Watch Series 11、Apple Watch Ultra 3以及Apple Watch SE 3。这是该系列机型首次通过翻新渠道销售,折扣幅

飞牛fnOS上线OPPO一加相册互联功能
科技数码 · 2026-06-07

飞牛fnOS上线OPPO一加相册互联功能

近日,飞牛 fnOS 发布重要更新:ARM 设备上的飞牛相册迎来大幅升级,其中最受关注的亮点是正式支持 OPPO 和一加设备互联。值得一提的是,此前 X86 平台已实现该功能,此次更新为 ARM 用户补齐了这项实用功能。 具体来说,OPPO 与飞牛之间的互联打通了四个关键场景,每项体验都非常实在:

小米米家植萃系列智能香氛机首发229元支持澎湃智联
科技数码 · 2026-06-07

小米米家植萃系列智能香氛机首发229元支持澎湃智联

米家智能香氛机植萃系列现已正式开售。大家最关心的价格方面,官方建议零售价为299元,而首发优惠价直接降至229元,性价比十足。 这款香氛机的核心亮点在于选用了奇华顿Orpur高端精油,天然植物萃取,气味清新自然,不刺鼻也不显廉价。它提供三种香型:风铃草、红茶、薰衣草,分别对应清甜、醇厚、舒缓的不同风