过去一周,Sam Altman在各大热门影视作品中频繁"跑龙套",从《偷盗宫崎骏画稿被抓》这样的创意情节开始,到《变身猫娘撒娇卖萌》这类轻松有趣的内容,再到《金字塔前热舞》的奇思妙想……这些风靡网络的视频全都出自Sora2。
事实上,Sora APP上线不到5天,下载量便突破百万次,增长速度甚至超越了ChatGPT。
这可谓一石激起千层浪。Sora不仅将"音画同步"和"物理模拟"推向技术竞赛的全新高度,更在全球范围内点燃了关于"谁将成为下一个Sora2"的终极追问。从马斯克的xAI到谷歌、阿里,从字节的"即梦"到快手的"可灵",各大科技企业都在积极应对这个问题。
□ AI版抖音,还是AI版朋友圈?
"Sora APP不是工具,而是一个全新的社交网络。"这个观点在过去一周内已经获得科技圈的普遍认同。
不过也有人认为Sora APP是"AI版抖音",因为它能够根据文本提示词生成10秒视频,不仅音画同步,还精确匹配环境音效和人物对话。如果输入中文关键词,Sora2同样能输出中文视频内容。应用内完整集成了从"灵感浏览-一键创作-分享互动"的全流程体验,就像刷抖音一样刷AI视频,完全重塑了内容分发的逻辑。
有博主生成不同品种的小猫,在卖场里偷了鱼后仓皇逃窜,而店主则在身后紧追不舍、高声呼喊的画面。短短7天在TikTok播放量超2.1亿,获赞超过1200万。
有人认为Sora APP是"AI版朋友圈",因为新增的社交玩法(Cameo功能,即"客串"),可以复制你的样貌和音色,将你的形象放置在任何AI场景中。Remix功能则可以将你的形象无缝融入他人作品,实现无限裂变传播。
比如和Sam Altman一起摆造型,与自己的好友一同畅想50年后一起打游戏、一起看演唱会、一起在养老院的样子。
这种建立在熟人关系上的AI玩法,不仅体验超出预期,也特别适合基于社交关系进行裂变传播。
Lovart创始人陈冕认为,Sora APP真正开启了AI的ToC应用时代,也激发了"AI社交"的想象空间,承载着OpenAI进军消费互联网的野心。
□ 大厂齐发力:音画同步成AI视频竞争新高地
Sora所在的视频赛道,一直是各大厂商的必争之地。虽然目前还没有出现能与Sora 2完全对等的产品,但全球第一梯队的视频模型已经在特定功能或应用场景上展现了不俗实力。
在模型侧,Sora 2的音画同步和物理准确性是核心亮点。目前具备该功能的模型有GAGA-1、通义万相WAN2.5、谷歌Veo 3。
5月,谷歌发布Veo 3,具备和画面同步的对话、音效,实现精准的音画同步。目前面向美国Ultra订阅用户开放,适合专业创作场景。
9月,阿里云在云栖大会发布通义万相WAN2.5,一句话出1080P电影,音画精准同步。
10月,Sand.Ai团队开发GAGA-1,支持通过上传图片和文本生成包含自然表情、动作和配音的视频,可实现音画同步。目前免费使用,无需邀请码,适合短剧、互动影游等场景。
Sora2发布后,马斯克的xAI迅速推出Imagine v0.9,以20秒内快速生成、全用户免费开放的优势予以回应;数位科技计划月d底上线Vidu Q2参考声功能。
其他模型,如9月25日上线的可灵2.5 Turbo和抖音豆包视频生成模型Seeddance1.0侧重多种运镜和物理真实;腾讯在世界模型领域卷生卷死,HunyuanWorld-Voyager支持超长漫游并将视频直接导出为3D格式;PixVerse V5则在9月迈过1亿用户大关,商业化方面订阅已经收入覆盖成本,正摩拳擦掌准备大干一场。
□ 谁能成为"下一个Sora2"?
从目前的竞争格局来看,"中国版Sora 2"的答案可能不止一个,更有可能在不同路径上产生引领者。
以Vidu、可灵为代表的技术模型派,深耕模型的核心能力,力求在视频一致性、物理规律模拟等基础能力上对标甚至超越国际标杆;挑战在于如何将技术能力转化为有活力的用户生态。
以即梦、Seeddance为代表的产品生态派,拥有庞大流量入口和创作者生态。
以GAGA为代表的创业公司,不追求大而全,而是在"人物对话演出"等特定细分领域做到极致,凭借在垂直领域的不可替代性,同样能获得稳固的用户群。
而Sora APP开启的"AI社交"赛道,更成为大厂必争之地。
陈冕预测,第一款对标Sora APP的产品可能一个月内就会出现。我们将拭目以待。
AI创投日报频道: 前沿科技