12月1日,美国消费者新闻与商业频道报道称,人工智能初创企业Runway推出了新一代视频生成模型Gen 4.5。根据第三方基准测试结果,该模型在多项指标上的表现超越了谷歌和OpenAI的同类型产品。
Gen 4.5能够根据用户输入的文字描述生成高清视频,并精准理解物体运动轨迹、人物动作、镜头调度以及场景间的因果关系。Runway透露,这款模型在物理规律模拟方面也有显著提升。
该模型目前在独立评测机构Artificial Analysis维护的Video Arena榜单中位居榜首。该榜单采用盲评机制生成:用户同时对比两个不同模型生成的视频片段,通过投票选出更优质的作品。
在这份榜单中,谷歌的Veo 3位列第二,而OpenAI的Sora 2 Pro排名第七。

Runway首席执行官克里斯托瓦尔·瓦伦苏埃拉在接受采访时表示:“我们仅用百人规模的团队,就战胜了市值数万亿美元的科技巨头。这证明只要保持专注与勤奋,小型团队同样能走在技术前沿。”
Runway成立于2018年,主要从事人工智能研究与视频模型、世界模型的开发工作。世界模型通过视频与观测数据训练,能够更准确地模拟现实世界的物理特性。
该公司的客户群体涵盖媒体机构、影视工作室、品牌方、设计师、创作者以及教育机构。根据PitchBook数据,Runway估值已升至35.5亿美元(约合251.36亿元人民币)。
瓦伦苏埃拉透露,Gen 4.5的开发代号为“David(大卫)”,取自圣经中大卫战胜歌利亚的典故。“这是我们深耕七年的成果。在强调研发效率的当下,我们希望能确保生成式AI领域不会形成寡头垄断格局。”
Gen 4.5目前正在分批开放权限,本周末前将向所有Runway用户开放。公司还计划在未来推出多项重要功能更新。
瓦伦苏埃拉表示,用户可通过Runway官方平台、API接口以及部分合作伙伴渠道使用Gen 4.5服务。
