首页 游戏 软件 资讯 排行榜 专题
首页
AI教程
蚂蚁开源世界模型Genie 3 具身智能未来已来

蚂蚁开源世界模型Genie 3 具身智能未来已来

热心网友
23
转载
2026-05-26

昨晚临近午夜,AI视频领域又迎来一次毫无征兆的“深夜冲击波”。蚂蚁集团旗下的具身智能公司——灵波科技,悄然开源了一个名为“LingBot-World”的世界模型。初看之下,这不过是AI圈“内卷”浪潮中的又一朵浪花,但仔细审视其演示案例后,一个清晰的信号浮现出来:AI视频的“无限流”交互时代,或许真的拉开了序幕。

PixVerse发布全新世界模型,终于让AI视频进入了“无限流”时代!

这个模型最震撼之处,在于它实现了真正意义上的“实时生成与交互”。不妨先看一个长达一分钟的第一人称探索案例:

熟悉游戏的朋友或许会觉得,这不过是一个普通的废弃小镇场景。但关键在于,眼前所见的一切——街道、建筑、光影——并非预先渲染好的固定画面,而是根据你按下的每一个方向键,由模型实时动态生成的。你按下“W”,世界就向前延伸;你按下“A”,左侧的景观便随之展开。甚至,你可以输入“下雨了”,天空便会阴云密布;说“来点烟花”,远处的城堡上空即刻绽放出绚烂的花火。

这是一种根本性的范式转变。如果说Sora、Kling这类视频生成模型是“精心剪辑好的电影”,那么LingBot-World则是一个“可实时演算的模拟器”。前者是叙事的终点,观众只能被动欣赏;后者则是世界的起点,探索者拥有了“言出法随,指哪打哪”的创造权。更令人惊讶的是其稳定性,在另一个长达十分钟的古城漫游演示中,场景始终维持一致,几乎没有出现崩溃或严重变形,这与之前一些世界模型几分钟内就“面目全非”的表现形成了鲜明对比。

这种能力让人立刻联想到几个月前谷歌发布的Genie 3,两者技术路线相似,都致力于构建可交互的生成世界。但Genie 3至今仍未开放体验,而LingBot-World不仅拿出了可观的成果,更直接选择了开源。目前,其项目已在GitHub上发布了第一个版本。

根据官方信息,模型将提供三个版本,侧重点各有不同:

LingBot-World-Base (Cam):已开源。专注于相机位姿控制,擅长处理推拉、环绕、平移等明确的镜头运动,适合需要精密运镜的场景。

LingBot-World-Base (Act):待开源。强化了“动作指令”控制,能用更结构化的方式约束主体行为,如行走、转身等,将可控性从镜头扩展到角色层面。

LingBot-World-Fast:待开源。追求低延迟与实时交互,通过结构优化实现流式生成,响应延迟可低于1秒,达到每秒16帧,更像一个实时世界模拟器,虽画质上限可能略低于Base版,但交互体验更流畅。

模型参数量约280亿,推理时约为140亿。纵观其所有演示案例与论文,可以总结出三大核心优势:卓越的长时记忆、强大的风格泛化能力以及新颖的动作袋里机制。

一、长时记忆很稳定

对于世界模型而言,长时记忆能力是基石,甚至可以说是第一生命线。试想一下,在一个交互世界中,如果你推开一扇门进入房间,一回头却发现门消失了,变成了陌生的走廊;再一回头,房间内的陈设也全然改变——这种缺乏记忆的状态,无异于一场“数字鬼打墙”,会彻底摧毁沉浸感与逻辑性。

LingBot-World在这方面表现出了惊人的稳定性。在廊桥漫步的案例中,无论视角如何转动、前行还是后退,周围的建筑始终稳固地存在于它们应该在的位置,遮挡关系也随距离变化而自然改变。

另一个穿越巨兽腹下的演示则更能体现其对空间尺度和时间连贯性的把握。视角真实地穿过了巨兽的横向身躯,整个过程符合物理直觉。相比之下,缺乏记忆的模型很可能在此处陷入“鬼打墙”,让人在局部空间里无限穿梭,无法产生真实的穿越感。

二、风格泛化性极强

许多世界模型往往受限于训练数据,只能在特定风格(如超写实)下表现良好,一旦切换到卡通、奇幻等非写实风格,质量便急剧下降。LingBot-World则打破了这一局限,其风格泛化能力令人印象深刻。

例如在奇幻风格的演示中,角色手持的大剑虽偶有轻微不稳定,但整体世界的质感已接近游戏渲染水平,色彩、光影和物体形态都得到了很好的保持。

这得益于其“海纳百川”式的训练策略。模型将真实世界视频、游戏录像以及UE引擎合成的场景数据“一锅炖”。真实视频教会它物理规律,游戏数据赋予它虚拟世界的交互逻辑,而合成数据则补全了各种极端、复杂的相机视角和运动轨迹。这种类似机器人领域“域随机化”的方法,让模型见识了足够多变的像素世界分布,从而具备了强大的风格适应能力。

三、很棒的动作袋里

如果世界模型只能被动响应方向键,那它终究还是一个高级的“步行模拟器”。LingBot-World的突破在于,它引入了一个“动作袋里”机制。这意味着,当你控制宏观探索方向时,世界内的角色可以基于视觉输入进行自主的运动规划与决策。

在布偶房间的案例中,布偶并非僵硬滑动,而是会根据方向指令在房间内自主移动,遇到沙发时会自然地绕行,避免了穿模这种破坏沉浸感的问题。

另一个赛车场景中,车辆的移动包含了急停、变道等动态,而非简单的匀速滑行。

根据论文,这背后是两条技术路线的协同。一是对用户连续指令的理解,模型能将一个按键动作解释为包含步伐、相机抖动在内的连续意图序列。二是那个独立的AI动作袋里,它像一个内置的“玩家”,观察当前画面,输出接下来几秒的行为指令,驱动世界内的角色自主行动。这创造了一种奇妙的体验:你作为观察者决定探索的大方向,而世界内的智能体则在生成的空间中自主生活与反应。

写在最后

LingBot-World的出现,其意义远不止于一个强大的技术演示。它标志着世界模型这一赛道,正从概念验证快速走向实用化与开源化。世界模型不仅是游戏、影视、娱乐的未来引擎,其更核心的使命在于为具身智能提供一个低成本、高保真的“数字练兵场”。一个能够稳定运行、泛化能力强的虚拟世界,是训练机器人理解物理规律、执行长程复杂任务的绝佳环境。

从Sora到Genie 3,再到今天的LingBot-World,我们正在见证AI从生成静态内容,迈向动态创造并理解整个世界的关键转折。蚂蚁的这次开源,无疑将这一进程向前推进了一大步。当世界模型真正成熟之时,随之而来的,必将是具身智能的井喷,以及AI深度融入实体世界的崭新时代。那或许,才是许多人心中所期待的、真正的AI革命图景。

来源:https://www.uisdc.com/lingbot-world
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Supertest AI 接口自动化测试工具使用指南
AI教程
Supertest AI 接口自动化测试工具使用指南

Supertest AI是什么?AI驱动的智能测试助手 在追求敏捷与高效的软件开发现代环境中,测试环节的效率瓶颈直接影响产品迭代速度与成本控制。近期,一款名为Supertest AI的智能测试工具正迅速获得开发与测试团队的青睐。它是一款由专业团队精心打造的AI辅助测试解决方案,其核心使命在于赋能质量

热心网友
05.26
Notion AI提案写作课教你写出让甲方满意的报告
AI资讯
Notion AI提案写作课教你写出让甲方满意的报告

NotionAI能高效辅助撰写专业提案。通过搭建结构化模板生成清晰框架,依据客户需求定制内容并优化语言风格。AI可将策略转化为可视化执行细节,并嵌入验证机制确保覆盖关键需求,从而提升提案质量与针对性。

热心网友
05.26
AI制作PPT教程 三步打造专业级演示文档
AI教程
AI制作PPT教程 三步打造专业级演示文档

如何利用AI高效制作PPT,轻松打造专业级演示文档 在当今快节奏的办公环境中,如何快速产出既专业又具视觉吸引力的PPT,是众多职场人士亟待解决的难题。从内容策划、版式设计到数据图表呈现,每个步骤都可能耗费大量精力。幸运的是,随着人工智能技术的成熟与普及,这一创作过程正经历革命性的效率提升。以WPS

热心网友
05.26
AI优化PPT技巧 轻松制作专业级演示文稿
AI教程
AI优化PPT技巧 轻松制作专业级演示文稿

如何利用PPT AI优化工具高效打造专业级演示文稿 制作一份专业且富有吸引力的演示文稿,往往涉及内容策划、视觉设计、数据整合与逻辑梳理等多重挑战。传统方式耗时费力,但如今,以WPS AI为代表的智能工具正在彻底改变这一流程。本文将深入解析如何系统化运用PPT AI优化技术,显著提升制作效率与视觉表现

热心网友
05.26
AI生成PPT全攻略提升办公效率轻松应对工作挑战
AI教程
AI生成PPT全攻略提升办公效率轻松应对工作挑战

提升办公效率,如何使用AI生成高质量PPT 在快节奏的现代职场中,时间是最宝贵的资源。对于ToB行业的从业者而言,频繁的会议报告与突发的客户需求,常常带来巨大的时间压力。你是否经历过在产品发布会前被临时要求制作一份演示文稿的手忙脚乱?此时,借助AI工具快速生成一份专业PPT,无疑是提升效率、从容应对

热心网友
05.26

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

和平精英丢雷轨迹线设置教程 手雷抛物线开启方法
游戏资讯
和平精英丢雷轨迹线设置教程 手雷抛物线开启方法

在《和平精英》的激烈对决中,手雷不仅是范围杀伤武器,更是扭转战局、攻破敌阵的核心战术道具。许多玩家都曾遇到过手雷扔不准、错失良机的困扰。其实,游戏内自带了一个能极大提升投掷命中率的实用功能——丢雷轨迹线。这项功能无需在外部设置菜单中预先开启,其所有操作都集成在实战投掷界面中,关键在于对局时的灵活调用

热心网友
05.26
2026 ASCO年会中国创新药企多项重磅研究亮相
科技数码
2026 ASCO年会中国创新药企多项重磅研究亮相

2026年5月29日至6月2日,全球肿瘤学界的年度盛典——美国临床肿瘤学会(ASCO)年会将于芝加哥隆重举行。作为肿瘤领域最具影响力的国际学术会议,ASCO年会始终是前沿科研突破的风向标和临床治疗理念的策源地。本届大会,中国创新力量的表现格外引人瞩目:由中国学者主导并入选口头报告、快速口头报告等核心

热心网友
05.26
EverMail AI 人工智能邮件助手使用指南
AI教程
EverMail AI 人工智能邮件助手使用指南

EverMail AI是什么 在邮件营销的实际工作中,营销人员常常面临两难选择:使用模板群发效率高但缺乏个性,手动撰写又耗时耗力。如何实现大规模个性化沟通,是提升转化率的关键。EverMail AI正是为解决这一核心痛点而生的智能解决方案。 简单来说,EverMail AI是一款基于人工智能技术的电

热心网友
05.26
OKX欧易官方App最新版下载 安全获取手机端正版安装包
web3.0
OKX欧易官方App最新版下载 安全获取手机端正版安装包

OKX欧易:全球领先的数字资产服务平台 在数字资产的世界里,选择一个可靠、功能全面的交易平台,无疑是开启旅程的第一步。OKX欧易,正是这样一个备受全球用户信赖的数字资产服务平台。它集成了比特币(BTC)、以太坊(ETH)、狗狗币(DOGE)等主流数字资产的交易服务,凭借其强大的功能、清晰友好的用户界

热心网友
05.26
和平精英奥特蛋作用与效果详解 获取方法及实战用途解析
游戏资讯
和平精英奥特蛋作用与效果详解 获取方法及实战用途解析

《和平精英》全新推出的“奥特精英和平蛋”活动,已成为近期玩家热议的焦点。该活动为玩家提供了一个获取“荣耀勋章”的全新途径,而勋章正是抽取奥特曼主题限定奖励的关键道具。奖池内包含终极赛罗飞行器、多款人气角色套装及枪械皮肤等珍稀物品,对于奥特曼系列爱好者与皮肤收藏家来说,这是一次极具吸引力的机会。 奥特

热心网友
05.26