首页 游戏 软件 资讯 排行榜 专题
首页
AI
蚂蚁开源世界模型Genie:10分钟用单图生成长视频

蚂蚁开源世界模型Genie:10分钟用单图生成长视频

热心网友
60
转载
2026-01-29


智东西
作者 王涵
编辑 云鹏

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智东西1月29日报道,今日,蚂蚁灵波科技正式发布并开源了其世界模型LingBot-World。该模型是一个专为交互式世界模拟设计的开源框架。其核心基础组件LingBot-World-Base能够提供高保真度、可控且逻辑一致的模拟环境。


LingBot-World由一个可扩展的数据引擎驱动,通过从大规模游戏环境中学习物理规律与因果关系,可以实现与生成世界进行实时交互。

该模型在视频质量、动态范围、长时一致性、交互能力等关键指标上均接近于谷歌Genie 3模型。


▲ LingBot-World能力表

体验地址:

technology.robbyant.com/lingbot-worldModel

开源地址:

Hugging Face:

huggingface.co/collections/robbyant/lingbot-world

魔搭社区:

www.modelscope.cn/collections/Robbyant/LingBot-world

Github:

github.com/Robbyant/lingbot-worldTech

技术报告:

github.com/robbyant/lingbot-world/blob/main/LingBot_World_paper.pdf

一、近十分钟稳定生成,镜头移动60秒还能保持一致

针对视频生成中最常见的“长时漂移”问题——即生成时间一长就可能出现物体变形、细节塌陷、主体消失或场景结构崩溃等现象,LingBot-World通过多阶段训练以及并行化加速,实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。

▲ 一致性压力测试,镜头最长移动60秒后返回,目标物体仍存在且结构一致

▲ 高动态环境下,镜头长时间移开后返回,车辆形态外观仍保持一致


▲ 镜头长时间移开后返回,房屋仍存在且结构一致

交互性能上,LingBot-World可实现约16 FPS的生成吞吐,并将端到端交互延迟控制在1秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。

用户可以通过文本指令触发环境变化与世界事件,例如调整天气、切换画面风格或生成特定事件等,且所有变化均可在保持场景几何关系相对稳定的前提下完成。

二、支持长程任务训练,与场景多样化生成

为解决世界模型训练中高质量交互数据匮乏的问题,LingBot-World采用了混合采集策略:一方面通过清洗大规模的网络视频以覆盖多样化的场景,另一方面结合游戏采集与虚幻引擎(UE)合成管线,从渲染层直接提取无UI干扰的纯净画面,并同步记录操作指令与相机位姿,为模型学习“动作如何改变环境”提供对齐的训练信号。

得益于此,LingBot-World具备了良好的Zero-shot泛化能力。仅需输入一张真实的城市街景照片或游戏截图,模型即可生成对应的可交互视频流,无需针对单一场景进行额外训练,降低了在不同场景中的部署与使用成本。

▲ 机器人穿梭在城市之间

具身智能的规模化落地还面临一个核心挑战,那就是复杂长程任务的真实机训练数据极度稀缺。

LingBot-World凭借长时序一致性、实时交互响应,以及对“动作-环境变化”因果关系的理解,能够在数字世界中“想象”物理世界,为智能体的场景理解和长程任务执行提供了一个低成本、高保真的试错空间。

同时,LingBot-World还支持场景多样化生成,可以改变光照、摆放位置变化等,此功能也有助于提升具身智能算法在真实场景中的泛化能力。

结语:蚂蚁补充物理感知拼图

蚂蚁连续发布三款“灵波”系列具身领域大模型,其通用人工智能(AGI)战略由此完成从数字世界向物理感知层面的关键延伸,也令其“基础模型 – 通用应用 – 实体交互” 的全栈技术路径进一步清晰。

从行业视角看,世界模型正成为连接生成式AI与具身智能的关键桥梁。LingBot-World在长序列生成与零样本泛化方面的能力,若能在实际应用中验证,或可推动相关领域从有限场景训练向开放场景适应的演进。

来源:https://www.163.com/dy/article/KKFBEGIU051180F7.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

BCBC币(BCBC)实时行情?
web3.0
BCBC币(BCBC)实时行情?

BCBC币(BCBC)深度解析:技术底色与市场前景 在百花齐放的数字货币领域,总有项目希望以独特的技术路径站稳脚跟。BCBC币(BCBC)正是其中之一,它依托一套组合技术方案来构建其安全与稳定的基石,目标直指高效、低成本的支付新体验,同时也不失为投资者眼中一个潜在的增值选项。 技术架构:不止于共识的

热心网友
04.02
BNB连锁店在最新焚化活动中燃烧了价值9.16亿美元的代币
web3.0
BNB连锁店在最新焚化活动中燃烧了价值9.16亿美元的代币

BNB Chain完成第31次季度销毁,近10亿美元BNB永久退出流通 近日,全球顶尖的区块链基础设施BNB Chain正式完成了其第31次季度代币销毁。根据官方公布的数据,本次共计销毁了1,579,207 716枚BNB,按销毁时市场价值计算,总额高达约9 16亿美元。此次大规模销毁再次向市场展现

热心网友
04.02
openclaw 常见命令解析
AI
openclaw 常见命令解析

OpenClaw 核心命令完全指南:从入门到精通 当您开始接触一个新工具时,最常见的障碍是什么?往往是面对复杂的命令列表感到困惑,只能被动地复制粘贴。这不仅影响效率,而且在遇到问题时更难以排查。 本文将为您深入解析 OpenClaw 的关键指令,帮助您从基础操作者转变为理解原理的熟练用户,全面提升配

热心网友
04.02
全球首款带物理直觉的AI模型在沪发布,理解真实世界规律
科技数码
全球首款带物理直觉的AI模型在沪发布,理解真实世界规律

让AI告别“重视觉效果、轻物理逻辑”的行业短板,近期五一视界(51WORLD)发布全球首款物理直觉世界模型51World Model,实现AI遵循物理规律推演、与真实场景全要素交互的核心突破,彻底破

热心网友
04.01
宇树G1机器人拆解:揭秘超40%毛利率与全供应链控制
科技数码
宇树G1机器人拆解:揭秘超40%毛利率与全供应链控制

一台售价8 5万元的人形机器人,拆开来看,成本只有4 16万元,预估毛利率40 7%。但宇树G1的真正壁垒,藏在硬件之外。3月30日,中邮证券电新团队分析师苏千叶、盛炜、杨帅波发布《宇树G1人形机器

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

金亨泰称三上真司03年作品《P.N.03》是《剑星》的灵感来源之一
游戏资讯
金亨泰称三上真司03年作品《P.N.03》是《剑星》的灵感来源之一

金亨泰亲证:《剑星》核心灵感源自三上真司经典动作游戏《P N 03》 近日,游戏界迎来一则令动作游戏爱好者振奋的重磅消息。Shift Up创始人金亨泰通过官方视频,正式宣布与传奇制作人三上真司旗下工作室展开深度合作。他特别强调,此次联手并非简单的资源整合,而是要让玩家亲眼见证,当三上真司深厚的动作游

热心网友
04.02
《红色沙漠》属性限制突破方法介绍
游戏攻略
《红色沙漠》属性限制突破方法介绍

红色沙漠属性限制怎么突破 在《红色沙漠》游戏进程中,很多玩家会发现,当角色属性提升至10级后便会遭遇等级上限的封锁,无法继续升级。这并非设计缺陷,而恰恰是游戏深度成长系统的起点——只有成功突破这层限制,角色真正的潜力才能被彻底释放。 那么,突破属性限制的具体方法是什么?关键在于寻访分布在游戏世界各地

热心网友
04.02
Kraken旗下代币化美股平台xStocks宣布将推出xPoints!积分计划细节引起发币猜想
web3.0
Kraken旗下代币化美股平台xStocks宣布将推出xPoints!积分计划细节引起发币猜想

Kraken旗下代币化美股平台xStocks宣布将推出xPoints!积分计划细节引出发币猜想 随着真实世界资产(RWA)赛道持续升温,代币化股票已然成为加密市场里增长最为迅猛的领域之一。最新消息显示,知名交易所Kraken旗下的代币化美股平台xStocks即将推出名为“xPoints”的奖励计划,

热心网友
04.02
流放之路2双修闪打德鲁伊怎么搭配BD思路-流放之路2双修闪打德鲁伊BD思路如何搭配
游戏资讯
流放之路2双修闪打德鲁伊怎么搭配BD思路-流放之路2双修闪打德鲁伊BD思路如何搭配

一、BD核心构建思路 想要打造一个能抗能打、生存与输出兼备的近战角色吗?双修闪打德鲁伊无疑是你的理想选择。这套玩法的核心理念非常清晰:召唤强大的熊灵作为你的“不朽壁垒”,在前排承担主要伤害并稳固仇恨;与此同时,你自身则化身为“风暴裁决者”,依靠风暴打击实现高频位移与持续输出。一守一攻,默契配合,使得

热心网友
04.02
虚拟币网格交易超出区间会强行卖出吗?网格交易模式有哪些?
web3.0
虚拟币网格交易超出区间会强行卖出吗?网格交易模式有哪些?

虚拟币网格交易超出区间会强行卖出吗? 聊起网格交易,很多朋友第一印象就是“自动化低买高卖”。作为一种经典的量化策略,它确实试图在市场波动中捕捉利润。但问题来了:一旦币价飘出了预设的“网格”,系统会不会来个“清仓大甩卖”呢?通常来说,答案是否定的,强行卖出并非标准动作。不过,具体会发生什么,还真得看您

热心网友
04.02