首页 游戏 软件 资讯 排行榜 专题
首页
AI
Runway深夜发布:五大核心功能更新与首个通用世界模型上线

Runway深夜发布:五大核心功能更新与首个通用世界模型上线

热心网友
74
转载
2025-12-12



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈


机器之心报道

机器之心编辑部

GPT-5.2 更新的同时,主攻 AI 视频与多媒体生成技术的独角兽 Runway 也来了一波大的:一口气来了 5 个「激动人心的宣布」。



这一波更新之猛,甚至让人觉得他们是不是把过去半年的大招一次性全放了出来。Runway 这一波发布,不仅刷新了视频生成的各项指标,更重要的是,他们正式对外展示了其在通用世界模型(General World Models/GWM)上的野心。

如果说之前的竞争还在于谁生成的视频更清晰、谁的时间更长,那么 Runway 今天似乎想说:「我们不再只是生成像素,我们在模拟世界。」

此次发布的「全家桶」阵容豪华:

Gen-4.5:最新的旗舰视频生成模型,不仅画质惊人,更引入了原生音频生成与编辑功能。GWM-1:Runway 的首个通用世界模型,这是理解物理世界运行规律的基石。GWM Worlds:基于 GWM-1 的环境模拟器,让你在无限的数字世界中实时探索。GWM Avatars:音频驱动的交互式视频模型,让数字人拥有了自然的灵魂。GWM Robotics:打破物理瓶颈,为机器人训练提供合成数据的学习型模拟器。

更有意思的是,为了庆祝这一时刻,英伟达 CEO 黄仁勋还专门给 Runway 发来了一条特别的节日祝福。

话不多说,下面我们就来看看 Runway 到底要把我们带向一个怎样的未来。

Gen-4.5

作为 Runway 最新的旗舰视频模型,Gen-4.5 主打的是画面保真度和创意控制能力。

先来看看最新宣传片:



性能表现也很不错:



总的来看,Gen-4.5 的生成能力有以下特点:

1、精确遵循提示

Gen-4.5 实现了极高的物理精度和视觉精确度。物体以逼真的重量、动量和力量移动。液体以正确的动力学流动。表面细节以极高的保真度渲染。而发丝和材料纹理等精细细节在运动和时间中保持连贯。



提示词:A continuous shot with no scene cut.We see water coming out of a garden faucet filling up a rusty metal bucket.Right below the bucket is a perfect folded white paper boat with a small yellow flower.The boat rides down a small river of water and enters a house,ending the journey in front of a broken TV.

2、风格控制和视觉一致性

Gen-4.5 能够处理多种美学风格,从照片级真实感和电影感到风格化动画,同时保持连贯的视觉语言。



提示词:A cinematic scene highlights a young woman with striking features,captured in a close-up that emphasizes her intense gaze.The camera focuses on her face,showcasing her platinum blonde hair.

除此之外,Gen-4.5 现在也支持原生音频生成和原生音频编辑了!



也就是说,你不仅能够生成带有音频的新视频,还能根据自己的需求编辑现有视频的音频。

不仅如此,Gen-4.5 还引入了多镜头编辑功能。借助多镜头编辑,你可以对初始场景进行更改,并将该更改应用到整个视频中。



不过,Runway 也坦言,Gen-4.5 仍有一些视频模型常见的局限:

因果关系推理:有时结果会先于原因发生(例如,门在把手被按下之前就打开了)。客体恒存性:物体可能会在帧之间突然消失或出现(例如,一个杯子在被遮挡后消失)。成功偏差:行动的成功率高得不成比例(例如,一次瞄准不佳的射门仍然进球)。

Runway 表示,这些局限性在他们的世界模型研究工作中尤为重要,因为世界模型需要准确反映在环境中采取行动的结果。他们正在积极研究解决这些问题的方法。

目前,Runway 正在逐步开放对 Gen-4.5 的访问权限,它将在未来几天内向所有人开放。

GWM-1

这一次,Runway 还推出了自家的首个通用世界模型:GWM-1

据介绍,GWM-1 是基于 Gen-4.5 构建的,但有一个关键区别:它是自回归的。

也就是说,GWM-1 采用了逐帧预测的方式。这也意味着,在任何时刻,用户都可以根据应用场景进行干预,例如在空间中移动、控制机械臂或与智能体交互,模型都会模拟接下来发生的事情。



目前,GWM-1 有三种变体:

用于可探索环境的GWM Worlds用于对话角色的GWM Avatars用于机器人操作的GWM Robotics



Runway 表示:「目前这些是单独的后训练模型。我们正在努力将许多不同的领域和动作空间统一到一个单一的基础世界模型之下。」



他们认为:「世界模型处于 AI 进步的前沿。仅靠语言模型无法解决世界上最棘手的问题 —— 机器人技术、疾病、科学发现等。真正的进步需要模型像人类一样去体验世界,并从错误中学习。而这种试错过程在模拟环境中进行,比在现实世界中进行要快得多。世界模型为通用模拟提供了最为清晰的路径。」

有意思的是,英伟达 CEO 黄仁勋还专门给 Runway CEO & 联创 Cristóbal Valenzuela 发送了一条祝贺视频。(毕竟看到这些依赖英伟达硬件的 AI 公司不断进步,大概没有人比老黄更开心了。)





下面来简单看看 GWM-1 的三种变体。

GWM Worlds

GWM Worlds 是一个用于实时环境模拟的世界模型。

按最新的说法是:「你给模型提供一个静态场景,它就能在你穿梭其中时,实时生成一个沉浸式、无限且可探索的空间,其中包含几何体、光照和物理效果。你可以前往任何地点,无论是真实的还是想象的。你可以化身为任何角色,比如漫步城市的人、飞越雪山的无人机,或是穿梭于仓库的机器人。」

听起来很炫酷,下面是最新的宣传视频:



Runway 表示:让这一切得以实现的关键在于一致性(consistency)

这很容易理解,当你探索一个环境时,你期望这个世界保持连贯一致。转身时,你身后的事物依然存在。前后走动,你可以回到起点。

而 GWM Worlds 似乎在这方面表现不错,其能在长时间的移动序列中保持这种空间连贯性。而且由于它是一个模拟系统,环境可以做出反应。你可以通过输入指令来定义一个世界的物理规则,这个世界会做出准确的响应。

举个例子,如果你指令 agent 骑自行车,它会稳稳地行驶在地面上;如果你指令其飞行,它就能在天空中自由导航。这对于交互式体验、游戏、可探索的世界以及沉浸式环境都非常有用。

但对于训练 agent 来说,它同样重要。如果你想训练一个 AI 系统在现实世界中进行导航和行动,你需要一个模拟器来对其进行训练。GWM Worlds 可以充当这样的沙盒,一个让 agent 可以探索、犯错并学习的环境。

整体而言,从描述上看 GWM Worlds 与其它类似的前沿世界模型差别不大,但实际表现如何还有待观察。

GWM Robotics

GWM Robotics 是一个基于机器人数据训练而成的世界模型,它能够根据机器人动作生成预测视频序列。



该模型支持反事实生成,可以探索不同的机器人轨迹与结果。其特性包括:

合成数据增强策略训练:利用世界模型生成合成训练数据,从多个维度扩充你现有的机器人数据集,包括新物体、任务指令以及环境变化。这些合成数据能在无需昂贵真实数据采集的前提下,显著提升策略的泛化能力与鲁棒性。策略模拟评估:无需部署到真实机器人上,你可以直接在 Runway 的世界模型中测试策略模型(如 OpenVLA 或 OpenPi 这类 VLA 模型)。这种方式更快、可复现性更强、安全性也更高,同时仍能提供逼真的行为评估。

Runway 还发布了一个GWM-1 Robotics SDK。这是一款面向 Runway 机器人世界模型 API 的 Python SDK,可以基于机器人动作生成视频。该 SDK 支持多视角视频生成和长上下文序列,并提供了与现代机器人策略模型无缝衔接的接口设计。



GWM Avatars

GWM Avatars 是一个由音频驱动的交互式视频生成模型,可针对任意逼真写实或风格化的角色模拟自然的人类动作和表情。

该模型能在说话和倾听时呈现出逼真的面部表情、眼球运动、口型同步和手势动作,并且在长时间对话过程中也不会出现质量下降的问题。



这个模型已经有着广泛的应用潜力,最新列出了一些例子:

实时辅导与教育:让个性化导师鲜活起来。这些反应灵敏的角色能够讲解概念、回应问题,并以自然的表情和手势进行长时间对话,让学习感觉就像一场真实的交流。客户支持与服务:通过让交互有「脸」可寻,变革客户支持体验。一个反应灵敏、栩栩如生的角色,能倾听、回应并引导用户解决问题,它拥有真人客服般自然的表达和耐心,随时待命,服务规模不受限。培训模拟:与能够自然回应、保持眼神交流并实时做出反应的逼真角色一起练习艰难的对话、谈判或高风险场景,在安全的环境中培养技能。互动娱乐与游戏:让游戏角色和数字演员鲜活起来。有会倾听并回应的角色,有会根据你的选择做出反应的主持人,还有能进行真实对话的伙伴。让互动娱乐体验宛如一场真诚的交流。

GWM Avatars 即将登陆 Runway 网页产品和 Runway API,以便用户集成到自己的产品和服务中。



结语

Runway 今天的更新标志着行业正在跨越一个关键的临界点:从单纯的「视频生成」迈向了真正的「世界模拟」。

无论是 Gen-4.5 对物理细节的把控,还是 GWM-1 对环境与实体的构建,都表明 AI 不再仅仅是模仿像素的排列组合,而是开始理解物理世界的底层逻辑。

正如 Runway 所言,通往 AGI 的道路不能仅靠语言,AI 必须在一个可交互的模拟环境中去体验和学习。英伟达 CEO 黄仁勋的惊喜现身,也隐喻了算力与算法的深度绑定。对于创作者而言,这扇大门已经打开:未来的视频或许不再只是用来看的,更是用来交互的。

https://runwayml.com/

https://runwayml.com/research/introducing-runway-gen-4.5

https://runwayml.com/research/introducing-runway-gwm-1

https://x.com/c_valenzuelab/status/1999240966885003295

https://x.com/runwayml/status/1999190924069400583

文中视频链接:https://mp.weixin.qq.com/s/XACKFq465dc8I8RFLzq9xg

来源:https://www.163.com/dy/article/KGJ8DKBV0511AQHO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI时代,未来将是谁为谁打工?
科技数码
AI时代,未来将是谁为谁打工?

来源:北京日报AI风口,人人皆有所感。且看市面各类产品,主打交互的,谈天说地仿若知心好友;擅长功能的,写文画图生成视频样样堪称好手。“养龙虾”热了,老老少少排队装机,生怕错过头啖汤。都说人工智能是一

热心网友
03.31
硅谷AI创业无中文基础指南:核心策略与关键资源解析
科技数码
硅谷AI创业无中文基础指南:核心策略与关键资源解析

文 | 针探STI,作者 | 岳轻2026年的春天,对于大洋彼岸的硅谷来说,冷意下浮动着暗流。过去几周,几则看似孤立、实则暗流涌动的边角料新闻,正在悄然改变着全世界对“AI霸权”的陈旧认知。首先是2

热心网友
03.31
香港科技大学团队突破实时视频生成关键技术
科技数码
香港科技大学团队突破实时视频生成关键技术

这项由香港科技大学、京东探索研究院和香港大学联合开展的研究发表于2026年3月,论文编号为arXiv:2603 17051v1。有兴趣深入了解的读者可以通过该编号在学术数据库中查询完整论文。制作一段

热心网友
03.31
斯蒂文斯理工联手打造工业级加密汇编代码验证测试基准
科技数码
斯蒂文斯理工联手打造工业级加密汇编代码验证测试基准

这项来自史蒂文斯理工学院和亚马逊云服务的突破性研究发表于2026年的AIPV工作坊会议,论文编号为arXiv:2603 14628v1。有兴趣深入了解的读者可以通过该论文编号查询完整论文。想象你正在

热心网友
03.31
中国人民大学AI团队新方案:告别低效查询,搜索准确率提升25%
科技数码
中国人民大学AI团队新方案:告别低效查询,搜索准确率提升25%

来自中国人民大学的研究团队在2026年1月向学术界提交了一项关于AI搜索代理优化的重要研究成果。这篇论文将在2026年7月20-24日于澳大利亚墨尔本举行的第49届ACM SIGIR信息检索研究与发

热心网友
03.31

最新APP

你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29

热门推荐

崩坏星穹铁道3.4新增四星光锥怎么玩-崩坏星穹铁道3.4新增四星光锥玩法解析
游戏资讯
崩坏星穹铁道3.4新增四星光锥怎么玩-崩坏星穹铁道3.4新增四星光锥玩法解析

角色与光锥适配深度解析 为队伍挑选合适的光锥,往往能起到画龙点睛的作用。今天,我们就来深入聊聊几款功能各异的光锥,看看它们如何与特定命途的角色产生化学反应。 酣战如始 1 属性与适配角色:作为同谐命途的光锥,其核心属性集中在速度与能量恢复上。这无疑是那些专注于辅助队友、提供团队增益角色的优质选择。

热心网友
03.31
什么是加密货币对冲?如何操作?有什么优势?
web3.0
什么是加密货币对冲?如何操作?有什么优势?

什么是对冲? 加密货币市场的价格变化,向来以快速剧烈著称。上午还在上涨的资产,下午就可能面临回调。在这种高波动的环境下,交易者们自然会寻求一种方法来保护自己的资金免受冲击。这种方法就是对冲——一种旨在降低风险、提升投资组合稳定性的核心策略。简单来说,对冲的核心逻辑在于:当你持有的主要加密货币资产价值

热心网友
03.31
荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性
科技数码
荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性

荣耀平板PC化升级计划公布,将带来PC交互、PC级应用支持等特性 三月十号,荣耀的一场重磅发布会,揭开了其平板产品线战略升级的序幕。在荣耀Magic V6旗舰新品发布会后,荣耀终端股份有限公司全场景产品线的负责人,@荣耀潇哥,进一步分享了一项备受关注的“平板PC化升级计划”。 在分享中,@荣耀潇哥清

热心网友
03.31
5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图
业界动态
5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图

5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图 “没有人比我们比亚迪更懂电池。”这句在发布会上掷地有声的口号,背后是实打实的技术突破。前不久的比亚迪“闪充中国改变世界”发布会上,王传福总裁正式揭晓了第二代刀片电池与配套的闪充技术,一组数据瞬间引爆了行业: 从10%到70%电量,只需

热心网友
03.31
OPPO K15 Pro核心配置公布:明日发布,抢先了解亮点
网络安全
OPPO K15 Pro核心配置公布:明日发布,抢先了解亮点

IT之家 3 月 31 日消息,OPPO K15 Pro 系列手机已官宣将于明日 14:30 正式发布。IT之家注意到,OPPO K15 Pro 手机已现身正式,并公布了核心配置信息,IT之家附如下

热心网友
03.31