当地时间12月2日,美国人工智能初创企业Runway正式发布了新一代视频生成模型Gen-4.5。根据独立基准测试结果显示,该产品的性能表现超越了谷歌与OpenAI的同类型模型,成为当前视频生成工具领域的领跑者。
Gen-4.5能够根据用户输入的文字提示生成高清动态视频,其显著提升了物理规律模拟、人体动作捕捉、镜头运动控制以及因果关系处理等方面的能力。
在AI基准测试机构Artificial Analysis公布的Video Arena排行榜中,Gen-4.5高居榜首,谷歌的Veo 3位列第二,而OpenAI的Sora 2 Pro则排名第七。
Runway首席执行官Cristóbal Valenzuela在接受专访时表示:"我们仅以百人规模的团队,成功超越了资金规模远超我们的行业巨头。这证明只要保持极致专注与持续创新,中小团队同样能够触及技术前沿。"
他特别透露,Gen-4.5的内部代号为"David",取自大卫战胜歌利亚的典故,寓意小团队挑战行业巨头的创新精神。
成立于2018年的Runway目前拥有约120名员工,其客户群体涵盖媒体机构、影视工作室、品牌方与内容创作者。根据PitchBook最新数据,公司估值已达35.5亿美元,投资方包括General Atlantic、Baillie Gifford、英伟达与Salesforce Ventures等知名机构。
在技术层面,Gen-4.5在动态生成、时间一致性及可控性方面实现重大突破,能够呈现具备真实物理效果的复杂场景与细腻的角色表现。
该模型的研发与推理均基于英伟达Hopper与Blackwell系列GPU,Runway与英伟达在训练效率与推理速度优化方面建立了深度技术合作。
英伟达首席执行官黄仁勋评价称:"这是一个令人振奋的技术里程碑,Runway在视频生成领域的突破充分展现了人工智能的巨大潜力。"
