2024年12月10日凌晨,OpenAI正式推出了Sora的高端加速版本——Sora Turbo。与初代相比,这一版本最显著的优势在于生成速度显著提升。初代Sora平均每10秒才能生成1秒视频,而在此次直播演示中,Sora Turbo同时生成四条10秒长的视频,全程仅耗时72秒,效率确实迈上了新台阶。
此外,Sora Turbo还大幅降低了使用门槛,支持通过文字、图片或现有视频来生成新内容,灵活性进一步增强。
自12月10日起,Sora Turbo已向所有OpenAI Plus和Pro会员开放全部功能,无需额外付费。不过,不同会员的使用额度存在明显差异:每月支付20美元的Plus会员,单月可进行50次视频生成;而每月200美元的Pro会员,则可慢速无限生成视频,加速生成次数达到500次,但如果选择高分辨率,可用次数会相应减少。
生成视频的参数也有所不同。Plus会员最高只能生成720p分辨率、每条5秒的视频;Pro会员则可以同时生成5条视频,分辨率提升至1080p,时长延长到20秒。
OpenAI官网信息显示,Sora目前支持全球155个国家和地区使用,但中国大陆和欧洲大部分地区不在服务范围内。
Sora一经开放,用户的热情瞬间挤爆了服务器。OpenAI首席执行官Sam Altman发文确认:用户注册已经暂停,视频生成速度也会暂时放缓。

一场在线视频工具实战教学
OpenAI团队将Sora定义为一款创意工具,用户只需输入一段文字、一张图片或一段视频,即可生成预期的视频内容。但他们也强调,不要指望一键生成故事片,需要不断优化才能达到理想效果。为了让用户快速上手,OpenAI直接把发布会直播变成了一场在线视频工具实战教学。
例如,要生成视频,首先需要打开分镜(Storyboard)。分镜会展示四个视频,从不同视角呈现细节。

在分镜中,用户在描述框内输入期望的指令,设置好风格、画面比例、时长、分镜数量、分辨率,就能生成视频。目前,Sora最长可生成20秒、分辨率为1080p的视频,画面比例有16:9、1:1、9:16三种可选。
OpenAI介绍了一个有趣的特点:如果指令字数较少,Sora会在细节上自由发挥;字数较多,它就会更严格地遵循指令。
直播中,他们输入了“一只黄尾白鹤站在小溪里”的指令,把生成的片段放到时间轴前端;接着又输入“这只鹤将头探入水中并叼出一条鱼”,放在时间轴后端。两段视频不连续,Sora需要自行生成过渡片段,将它们合成一个完整故事。结果令人满意:视频清晰,过渡平滑,连贯且富有故事感。不过美中不足的是,并未看到明显的鱼,只有鹤叼鱼时溅起的水花。

用户也可以直接上传一张图片或一段视频,Sora会根据内容生成后续视频的文字描述,用户再自由调整指令。例如,提交一张灯塔图片后,Sora会自动创建一张卡片,描述接下来要生成的视频,用户可以修改指令,并在时间轴上调整播放位置。

初始视频生成后,如果想进一步优化,可以使用remix工具改变物体——比如把猛犸象换成机器人,或调整人物表情。Sora还提供了细微、轻微、强力三种强度,满足不同修改需求。

如果只对其中某段片段满意,可以借助recut工具,剪辑保留想要的片段,再通过指令扩充成新视频。此外,Sora还具备loop功能和高级功能blend:前者让视频无限循环,并自动生成细节使首尾衔接;后者则能将两个完全不同的场景融合在一起。
不止是工具,更是实现AGI的路径
今年2月,OpenAI首次推出初代Sora,可根据提示词生成最长一分钟的高清视频。此后,Sora进入了长达10个月的封闭测试,仅向视觉艺术家、设计师和电影制作人等特定外部人员开放。直到这次直播开始前几小时,才有官方的最新演示视频流出。
在Sora封闭内测期间,国内类似产品如可灵AI、即梦AI、海螺AI已在海外积累了相当用户。根据国外分析网站Similarweb数据,11月可灵AI的全球总访问量达到940万次,超过了海外同类产品Runway的710万次。而在提前流出的Sora Turbo演示推文下,不少国外用户表示,其视频效果与国内产品水平相当。
Sam Altman曾解释,Sora更新速度较慢,主要是为了确保模型安全性,同时扩大计算规模。据了解,OpenAI已与半导体公司Broadcom合作,研发运行模型的人工智能芯片,最早可能于2026年问世。
Sora对OpenAI的意义远不止一款视频生成工具。在本次直播中,Sam Altman强调,希望AI能理解和生成视频,从而改变人们使用电脑的方式,同时推动OpenAI实现通用人工智能(AGI)。不过,对于这一说法,业内看法不一。阶跃星辰CEO姜大昕曾向智能涌现表示,他理解OpenAI推出Sora是为了探索多模态生成能力,因此阶跃星辰也沿着类似路径研究AGI;而Meta首席人工智能科学家Yann LeCun则认为,通过生成像素来模拟世界,浪费资源且注定失败。
通用人工智能的应用时间已排进OpenAI的计划表。Sam Altman上周对媒体表示,AGI的首批应用案例最快将在2025年出现,人们可以设定一项非常复杂的任务,AI会使用不同工具完成。“最初通用人工智能产生的影响可能较小,但最终,其影响力之强会超乎想象,就像每一项重大技术出现时,会有大量工作岗位被替代。”
随着Sora的开放使用,它对AGI的影响可能会越来越明显,OpenAI的最终目标似乎也在一步步接近。
