首页 游戏 软件 资讯 排行榜 专题
首页
AI
纽约大学研究实现AI同时操控多个我的世界角色

纽约大学研究实现AI同时操控多个我的世界角色

热心网友
59
转载
2026-05-13

这项由纽约大学主导的突破性研究,论文编号arXiv:2602.22208v2,已于2026年2月发布。研究团队成功开发了名为Solaris的多人游戏世界模型,标志着AI在理解复杂虚拟交互方面迈出了关键一步。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

纽约大学发布:让AI同时控制多个《我的世界》角色,首次实现多玩家视角的虚拟世界建模

长久以来,让机器真正“看懂”并预测动态的虚拟世界,一直是人工智能领域的核心挑战之一。以往的模型,更像是一个只能透过固定舷窗观察海面的水手,视野单一,难以把握全局。而纽约大学的这项研究,则赋予了AI一种“多重视角”的能力——仿佛同时拥有了多双眼睛,能从不同角度观察、理解并预测同一个复杂环境中的变化。

研究团队选择《我的世界》作为试验场,这个决定颇具深意。这个开放世界的沙盒游戏,本质上是一个由规则驱动的复杂三维系统,玩家可以自由建造、探索和互动,并且天然支持多人协作。它对AI而言,是一个近乎完美的测试平台:不仅需要理解物体属性和空间关系,还必须处理多个玩家行为之间错综复杂的相互影响。

传统AI视频生成模型的能力边界在此显露无遗。它们擅长生成连贯的单视角视频,就像一位技艺精湛的默剧演员,能完美复刻单人表演。然而,一旦场景中间出现两个或更多互动的“演员”,传统模型就难以招架了。多个玩家的行为会产生连锁反应,一个玩家放置一个方块,必须在所有相关玩家的视野中同步、一致地呈现。这种跨视角的“因果一致性”,是此前技术未能攻克的高地。

Solaris模型的核心突破,恰恰在于它能够并行地理解和预测多个独立视角。当玩家A开始砌墙时,模型不仅要准确推演出A视角中墙体逐渐升高的过程,还必须同步计算出位于不同位置的玩家B、C会看到怎样的景象。这好比一位导演同时指挥多台摄像机进行拍摄,并确保所有镜头在逻辑和时序上严丝合缝。

一、构建虚拟世界的“摄影棚”

训练这样一个复杂的模型,首要条件是海量且高质量的数据。研究团队面临的第一个挑战,就是在《我的世界》中搭建一个自动化的“电影制片厂”。这个“制片厂”既需要能自主行动的“演员”(游戏内机器人),也需要能精准记录一切的“摄像团队”。

现有的工具难以满足要求:有的平台支持多人游戏但无法对角色进行精细控制;有的能精确控制却又局限于单人模式,更别提同步录制高质量的多视角视频了。于是,研究团队从零开始,构建了名为SolarisEngine的数据收集系统。

这个系统的设计非常巧妙。它将每个虚拟玩家拆解为两个部分:一个“控制器”负责决策并执行复杂行为,一个“摄像机”则忠实记录该角色所见的一切。控制器如同幕后操纵师,通过编程指令让角色完成建造、协作战斗等任务;摄像机则确保录制的画面与游戏内的真实状态完全吻合,解决了行为与视觉记录脱钩的技术难题。

为了让虚拟“演员”的表演足够丰富且真实,研究团队为其编写了一套涵盖建造、挖掘、战斗、探索等行为的“技能库”。尤为关键的是,这些技能支持多人协作脚本,例如两个机器人可以默契配合,共同搭建一座桥梁。

整个系统采用容器化部署,可以同时运行大量实例,极大提升了数据采集效率。系统还具备自动容错能力,当某个游戏进程卡顿时,会自动重启以确保数据流水线的持续运转。

最终,通过这套系统,团队收集了超过1200万帧、涵盖四大类场景的多人游戏画面:包括协作建造、玩家对战、复杂移动和地下挖掘。这些数据的珍贵之处在于,它们完整捕捉了多人互动中的所有细节——一个玩家的动作如何实时且一致地呈现在所有相关玩家的视野里,为模型训练奠定了坚实基础。

二、让AI学会“多重视角”的思考

有了数据,下一步是设计能处理多视角信息的模型架构。传统视频生成模型如同一位肖像画家,精于刻画单一主体。而Solaris需要成为能驾驭宏大场面的“全景画家”,同时处理多个主体及其视角。

研究团队的策略是在强大的现有视频生成模型基础上进行创新性改造。其核心是一种“视觉交错”机制:模型在处理时,会将不同玩家的视频帧按时间线交错输入,如同编织时交替使用不同颜色的丝线。这使得模型能同时“感知”所有视角,并学习它们之间的关联。

为了区分不同玩家,每个视角都被赋予了独特的身份标识。更重要的是模型采用了“共享注意力”机制,这就像一个乐团指挥,让不同声部(视角)的信息在模型内部进行交流与协调,从而保证生成的多个视频在逻辑上自洽。

举例来说,当玩家A建造一面墙时,模型不仅要预测A视野中墙体的变化,还需同步推演出墙另一侧的玩家B所看到的景象。如果B正对着施工面,那么在他的视角里,也必须出现相应的建造动画,只是观察角度不同。这种跨视角的因果一致性,是Solaris的核心能力。

模型的动作处理模块也经过了专门扩展,使其能理解《我的世界》中移动、跳跃、放置、挖掘等丰富操作,及其对应的视觉反馈。

三、循序渐进的训练策略

训练如此复杂的模型,需要一个分阶段、循序渐进的策略,好比培养一名从基本功练起的专业运动员。

第一阶段是单人游戏强化训练。这是至关重要的基础阶段。模型首先利用超过2000小时的人类玩家真实游戏记录进行学习,掌握游戏的基本物理规律和行为模式,比如挖掘会导致方块消失,放置会带来新的结构。

第二阶段引入多人场景。模型开始学习处理多个玩家同时行动产生的复杂交互。关键目标是建立“全局视角”概念,理解一个玩家的动作会如何同时影响多个视野。例如,一个玩家点燃火把,其光照效果应同步出现在附近所有玩家的画面中。

第三阶段专注于因果关系建模。前两阶段训练允许模型“瞻前顾后”地学习数据关联。但实际预测未来需要纯粹的因果推理能力。此阶段训练模型理解“时间的箭头”,仅根据当前状态预测后续画面,而不能利用未来信息进行“作弊”。

第四阶段是自我强化训练。这是最具挑战性的一环。为了让模型能应对更复杂、更长期的任务,研究团队引入了“检查点自强化”技术。该技术允许模型将中间生成结果临时存储,大幅降低了长序列训练的内存负担,使得模型能够利用自身生成的预测进行迭代提升,从而获得生成长时间、多视角一致视频的稳定能力。

四、测试AI的“游戏智商”

模型能力究竟如何?研究团队设计了一套系统的“游戏智商”测试,从五个维度进行严谨评估。

运动能力测试:考察模型对角色移动的预测精度。一个玩家运动,另一个玩家观察,模型需准确预测观察者视角中的画面变化。

定位能力测试:挑战模型的空间记忆。两名玩家面对面站立,其中一人转身再转回,模型需判断他能否再次看到对方。这要求模型理解“对象虽不在视野内,但依然存在于空间中”这一概念。

记忆能力测试:难度升级。两名玩家同时转身再转回,模型需同时追踪并记忆两者的空间关系。

建造能力测试:检验模型对环境动态变化的理解。一个玩家进行建造,模型需在观察者视角中准确预测出建筑过程的每一步。

一致性测试:这是终极挑战,检验多视角间的逻辑一致性。例如,相邻玩家看向同一方向应看到相似景象,看向相反方向则应看到不同景象。

评估方式也别出心裁:采用先进的视觉语言模型作为“AI评委”,让其观看生成视频并回答具体问题(如“玩家向左还是向右移动?”)。这种方法实现了自动化、大规模且客观的评估。

测试结果显示,Solaris在运动和一致性测试中表现近乎完美,在更复杂的记忆和建造测试中也远超现有的单人世界模型。与简单将多个单视角视频拼接的方法相比,Solaris在保持跨视角一致性方面展现出压倒性优势。

五、从实验室到现实世界的可能性

Solaris所展示的能力,其意义远不止于学术演示。它为多个领域开启了新的想象空间。

在游戏开发领域,此类技术可革命性地改变测试流程。AI可以模拟海量玩家行为,快速发现漏洞和平衡性问题,极大加速开发周期。更进一步,它甚至能用于动态生成个性化游戏内容,为玩家提供独一无二的体验。

在教育与培训领域,它能构建出高度逼真的多人协作虚拟环境。例如,医学生可以在虚拟手术室中协同演练复杂手术,每位学员都能从自身视角观察团队操作,在零风险环境中积累宝贵经验。

对于机器人技术,这项研究提供了重要启示。现实中的机器人常需协作完成任务(如工厂流水线、仓库分拣)。通过在Solaris这类虚拟环境中训练多智能体的协调策略,可以大幅降低现实测试的成本与风险,让机器人先在数字世界中学会团队协作。

当然,技术仍有局限。目前训练数据完全来自虚拟环境,模型处理真实世界无限复杂性的能力有待验证。此外,模型缺乏持久的长期记忆,难以追踪玩家长时间分离后又重逢的历史互动。

尽管如此,Solaris代表的方向极具潜力。研究团队已开源SolarisEngine系统及相关数据集,这将加速全球同行的后续探索。这项工作的核心价值在于,它让AI向理解复杂、多参与者的互动世界迈出了坚实的一步。毕竟,我们生活的真实世界,其本质正是由无数智能体(人类)的协作与互动构成的。让AI学会理解和预测这种互动,是构建真正实用、智能的下一代系统的关键基石。

从更宏观的视角看,这项研究折射出AI发展的一个清晰趋势:从解决孤立任务,转向理解复杂场景;从优化单个智能体,转向协调智能群体。这不仅是技术的演进,更是对智能本质的深入探索。真正的智能,往往正是在与他者的互动中得以体现和锤炼。

Q&A

Q1:Solaris模型和普通的视频生成AI有什么区别?

普通视频生成AI通常专注于生成单一视角的连贯视频。而Solaris是首个能同时建模多个玩家视角的世界模型,其核心是确保跨视角的因果一致性。例如,当一名玩家在游戏中放置一个方块时,Solaris能保证在其他所有相关玩家的视角中,这个方块都会在正确的位置和时刻出现。

Q2:SolarisEngine数据收集系统是如何工作的?

SolarisEngine是一个高度自动化的多智能体数据采集平台。它通过编程控制多个虚拟机器人在《我的世界》中执行建造、战斗、探索等协作任务,并同步录制每个机器人“眼中”看到的所有画面。该系统最终收集了超过1200万帧精准对齐的多视角游戏数据。

Q3:这项技术除了游戏还能用在哪些地方?

应用前景广泛。主要包括:1)虚拟现实培训,如多人协作的应急演练或手术模拟;2)机器人协作系统开发,在虚拟环境中训练多机器人协同策略;3)交互式教育内容构建,创建支持多人实时互动的学习场景。任何需要多个智能体在共享环境中进行复杂协调的领域,都可能受益于此项技术。

来源:https://www.techwalker.com/2026/0228/3179873.shtml
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

我的世界基岩版如何修改世界名称与设置指令
游戏攻略
我的世界基岩版如何修改世界名称与设置指令

在《我的世界》基岩版中,随着创建的世界越来越多,系统自动生成的那一串默认名称常常让人难以分辨。想要为世界设置一个清晰易记的专属名称?虽然游戏内没有提供直接的“重命名”功能,但玩家完全可以通过几种有效的方法来实现。无论是通过系统文件操作、使用专业编辑器,还是借助服务器插件,都能轻松完成世界名称的修改。

热心网友
05.13
我的世界基岩版创造模式切换指令与游戏模式更改方法
游戏攻略
我的世界基岩版创造模式切换指令与游戏模式更改方法

在《我的世界》基岩版中,从生存模式切换到创造模式是许多玩家探索建筑、红石或单纯享受自由创造乐趣的常见需求。无论你是想临时改变玩法,还是为特定项目预设一个理想环境,掌握多种切换方法都能让你的游戏体验更加顺畅。本文将为你详细解析五种主流切换方式,涵盖从基础指令到高阶应用,帮助你快速进入创造模式。 以下方

热心网友
05.13
我的世界MCJS网页版官网入口免费在线玩
游戏攻略
我的世界MCJS网页版官网入口免费在线玩

mc js官方网站入口地址是https: www mcjs cn,提供跨设备即开即玩、多端无缝同步、轻量极速启动、联机协作安全架构及版本兼容性保障五大核心功能。 想随时随地打开浏览器就能玩《我的世界》?现在,一个名为mc js的网页版项目让这个想法变成了现实。它的官方网站入口其实很简单,就是 ht

热心网友
05.12
我的世界绘画教程 从入门到精通的详细步骤指南
游戏攻略
我的世界绘画教程 从入门到精通的详细步骤指南

在《我的世界》这款充满无限可能的沙盒游戏中,亲手绘制一幅独特的画作,不仅能为你精心搭建的建筑注入灵魂与个性,更是展现个人艺术创意的绝佳方式。本文将为你详细解析从零开始,制作一幅专属艺术画的完整步骤。 准备材料 工欲善其事,必先利其器。制作一幅画的核心材料主要分为两类:一是用于构建画框的木材,二是用于

热心网友
05.12
我的世界基岩版游戏模式切换指令使用教程
游戏攻略
我的世界基岩版游戏模式切换指令使用教程

在《我的世界》基岩版中,成功切换游戏模式的关键在于正确启用作弊功能。玩家可以根据不同需求,选择多种高效方法:既能在创建世界时预先设定默认模式,也能在游戏过程中使用 gamemode指令即时切换,还可以在多人游戏中为特定玩家调整模式,甚至通过游戏内设置菜单进行快速变更。 在《我的世界》基岩版中体验不同

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

截图软件推荐与好用截图工具排行榜
游戏资讯
截图软件推荐与好用截图工具排行榜

在日常工作、线上沟通或是学习过程中,截图几乎成了每个人的高频操作。面对市面上琳琅满目的截图工具,如何选择一款清晰、高效又功能趁手的软件,确实是个值得聊聊的话题。今天,我们就来盘点几款备受好评的截图应用,希望能帮你轻松应对各种截图场景。 1、截图帝:功能全面的效率助手 这款工具主打操作简便与功能实用,

热心网友
05.13
日语学习软件推荐 精选高效自学工具与资源
游戏资讯
日语学习软件推荐 精选高效自学工具与资源

对于日语学习者而言,选择合适的工具往往能让学习效果事半功倍。面对市场上琳琅满目的学习资源,一款设计科学、功能匹配的App,能够高效地帮助你从五十音图入门,逐步攻克词汇、语法乃至听说读写的各个难关。那么,目前有哪些备受好评的日语学习软件值得推荐呢?以下这几款应用,或许能成为你日语进阶之路上的得力伙伴。

热心网友
05.13
赛睿寒冰新星Pro OMNI耳机新品发布与评测
游戏资讯
赛睿寒冰新星Pro OMNI耳机新品发布与评测

近期,CGMagazine对赛睿SteelSeries推出的旗舰级游戏耳机Arctis Nova Pro OMNI进行了全面评测。这款耳机的最大亮点,无疑是其创新的OMNIplay多设备互联功能——它允许用户在多个音源设备间实现无缝切换,甚至能同步监听多个音频输入。设想一下,当你沉浸于激烈的游戏对战

热心网友
05.13
韩援选手美图鉴赏 精致Cosplay造型与身材展示
游戏资讯
韩援选手美图鉴赏 精致Cosplay造型与身材展示

探讨Cosplay的魅力,总离不开那些令人印象深刻的精彩演绎。今天为大家带来的这组作品,出自韩国知名Coser(@baby_hippo__)之手,她也被粉丝们亲切地称为“韩援大姐姐”。凭借其出众的身材条件和极具张力的形体表现,这组作品再次证明,在视觉艺术领域,完美的“身材数据”本身就是一种极具说服力

热心网友
05.13
明日方舟终末地1.2版本前瞻兑换码领取攻略
游戏资讯
明日方舟终末地1.2版本前瞻兑换码领取攻略

在《明日方舟:终末地》中,前瞻兑换码是玩家开荒阶段获取资源的重要途径,能有效加速前期发展,积累宝贵物资。不过,如何高效领取并使用这些福利,其中有一些实用技巧值得了解。 首先,关键在于信息获取。官方渠道始终是最可靠的信息来源,建议密切关注游戏官网公告、官方社交媒体账号以及游戏内的系统邮件。一旦有新的兑

热心网友
05.13