首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Sora 2的真相解密:你真的适合当AI导演吗?

Sora 2的真相解密:你真的适合当AI导演吗?

热心网友
57
转载
2025-10-14

撰文 | 程书书

编辑 | 李信马

题图 | 豆包AI

国庆假期,全球AI圈被一枚“重磅炸弹”炸醒。

OpenAI发布新一代AI视频模型 Sora 2 及其配套应用 Sora App,即使需要填写邀请码才能使用,也没有减弱网友的热情,社交平台上充满了寻求邀请码的信息。短短四天内,这款App便空降美区App Store免费榜榜首,力压ChatGPT、Google Gemini等一众头部AI产品,迅速成为海外创作者、内容营销人和TikTok卖家的新宠。

社交平台瞬间被AI生成的“同人宇宙”刷屏:动漫角色穿越现实街道,游戏角色在都市中穿行,甚至连OpenAI CEO山姆·奥尔特曼(Sam Altman)也被网友“玩出花”——他出现在东北炕头吃饭、在阿里会议室讲“闭环”“赋能”,甚至化身外卖骑手穿梭于城市街头。

奥尔特曼本人将Sora 2称为“创意领域的ChatGPT 3.5时刻”。从最新演示到网上用户实测,Sora 2在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,被多家媒体誉为“将AI视频生成推向新高度”。

在进行了体验后认为:Sora 2确实强大,但距离“现实不存在了”的预言,还是有一定距离。

01、创造力炸裂,细节仍存“AI感”

Sora App以Sora 2为技术基础,Sora 2直接内置了对话、音效和背景音乐的自动生成能力,可以实现音频和视频同步生成,改变了以往AI视频生成工具没有声音的状况。

进入 Sora App 后,主页底部设有功能栏,从左到右依次为「视频推荐」「灵感广场」「生成器」「消息」「个人主页」。很多人将其称为 “AI版抖音”,正是因为界面及首页推荐逻辑与之相似 ——App 主页为垂直视频流,用户可上下滑动浏览其他用户发布的内容。

其中,灵感广场用于展示热门作品。由于 Sora App 生成视频后,提示词会默认成为视频配文,因此热门视频的提示词可直接复制修改后使用。

生成器是用户制作视频的核心功能区,有两点值得注意:一是不支持上传用户自制视频素材,仅能通过 AI 生成视频;二是不支持单独撰写短视频文案——用户输入的文案会默认作为生成视频的提示词。​

生成视频时,有两种特色方式可选:一是图片生成视频,二是 Cameo 出镜秀。Cameo 是每个账号对应的虚拟数字形象,相当于用户的 “专属 Sora 身份标识”。创建 Cameo 需录制一段个人脸部视频,操作步骤类似支付宝、银行类 App 的视频认证,验证通过后即可用自己的虚拟形象生成并发布视频。​

此外,也可使用他人的虚拟数字形象,通过文生视频或图生视频功能创作,但前提是对方将形象设为公开。具体操作是:撰写提示词时点击他人头像,其ID会自动填入提示词;因此,使用他人形象发布视频时,系统会自动@该用户——这也意味着,形象设为公开即默认允许 App 内其他用户使用。

以奥尔特曼的虚拟数字形象和一张图片生成了一段视频,提示词为:“@sama在图片场景里说集美们,耶斯莫拉。”

在生成的视频中,Sora结合图片背景为奥尔特曼丰富了台词,奥尔特曼指向后面的店铺说:“集美们,今天带大家来看看老姐妹的店,耶斯莫拉。”台词的补充显示出AI联想的能力,与场景的配合较为自然,发音时,人物的口型也基本能对上。

不过,并非每次生成都能一次成功。DoNews再次尝试生成奥尔特曼剥猕猴桃的视频时,剥猕猴桃的细节就出现了错误,有明显的AI痕迹。

又以奥尔特曼和另一用户的数字形象创建了一段多角色视频,提示词是:“@sama@thomasdimson扮演《后宫甄嬛传》里面的华妃娘娘和皇后娘娘,穿着清朝的妃嫔服制,用中文吵架。” 系统检测到版权问题无法生成,删除提示词中的《后宫甄嬛传》后,生成就不再被拒绝。

在这段双人互动视频中,提示词只提到“用中文吵架”,而 Sora 再次为角色添加了台词,二人的吵架内容也符合清宫戏的背景。但细节仍有瑕疵,比如中间有一句台词的声音没有对口型,后面皇后的台词错误地对应到了华妃的嘴型。

这种台词错位的情况在多角色视频中发生的概率似乎较高,在DoNews之后生成的另一段多人对话视频中也出现了类似问题。

整体来看,Sora 2在物理世界理解方面确实表现不俗,用户数字人的物理效果和唇型同步效果良好,基本的一致性做得不错。但涉及到多元素的物体交互时,仍会出现多角色台词错位、物体交互 bug的问题,保留了明显的“AI感”。

“AI配音” 本身也存在缺陷:语气生硬、情感适配度低,若提示词未明确语调,生成的对话会显得机械。同时,“构思提示词” 的门槛依然存在——普通用户可能因描述不细致(比如没说清场景氛围、人物动作),导致生成的视频偏离预期,而专业创作者则需花费时间优化提示词,才能弥补 AI 的细节不足。​

02、创意 ChatGPT 时刻未到,娱乐版抖音还差口气

OpenAI 在最新声明中,将 Sora 2 定位为 “最先进的视频和音频生成模型”,更明确对比:2024 年 2 月发布的初代 Sora 是视频领域的 “GPT-1 时刻”,而 Sora 2 直接迈入了 “GPT-3.5 时刻”。

从音画同步、人物ID一致性(如 Cameo 形象复用)到多镜头叙事的技术突破来看,Sora 2 确实刷新了AI视频生成的上限,但距离 “重塑创意领域” 和 “成为新一代娱乐社交平台”,它显然还差点火候。​

“Sora 2 生成的音频真实感、清晰度,把之前的AI音效工具甩开好几条街,甚至比谷歌Veo 3还略胜一筹。” 小旭音乐创始人兼 CEO、AIGC 艺术家小旭的评价,点出了 Sora 2 的核心优势 —— 易用性。它把复杂的视频生成流程简化成 “输入提示词+选形象”,尤其是 Cameo 功能,用户录几秒脸部视频就能克隆专属虚拟形象和声音,门槛低到普通用户也能上手。

但优势之外,硬伤同样明显。“目前生成的视频时长比较短,只有10秒钟,这个在正规的创作中还是显得略短了一些。”此外,分辨率也不太行,App 里没法调画质,默认只有 480P 或 360P,横版还得用 PC 端才能生成。在小旭看来,Sora2是瞄准AI社交去的,并不是一个纯粹的AI工具。

Sora App目前采用的邀请制也可以验证他的看法,当一个邀请码注册成功后,可以再生出4个邀请码,分享给其他用户后,这些用户激活账号又能获得4个新的邀请码,如此形成裂变循环。而且一旦使用他人的邀请码,系统会自动关注邀请方,逐步构建起好友社交网络。

用户车车体验后认为,其娱乐性 “远不如抖音”:“Sora 上的内容更像‘自娱自乐’—— 每个人生成的视频都是围绕自己的虚拟形象或简单场景,没有抖音那样的话题挑战、达人生态,也缺乏能引发大众共鸣的内容,刷几条就会觉得单调。”​

这种 “娱乐性短板”,和 Sora 2 严格的限制挂钩。为规避版权、肖像权风险,它会直接拒绝生成多数真实名人、影视角色(比如前文提及《后宫甄嬛传》触发版权拦截),甚至普通人物形象的创作也有诸多约束。用户能发挥的题材空间被压缩,自然难以产出多样化、有传播力的内容——反观抖音,从生活记录到创意短剧,内容边界宽泛,再加上评论互动、合拍、话题榜等功能,社交粘性远非 Sora 2 可比。​

综上,Sora 2无疑是一次技术飞跃,它显著降低了AI视频创作的门槛,将此前分散的视频、音频生成步骤整合,让普通用户也能轻松体验创作的乐趣。

然而,无论是从其有限的画质与时长、纯AI生成内容导致的同质化倾向,还是技术上尚未克服的细节瑕疵来看,它距离成为引发创意领域革命的“ChatGPT时刻”以及媲美抖音的娱乐平台,仍差一口气。

对于普通用户,Sora 2是一款有趣、易上手的新玩具;但对于追求高质量、长序列和强一致性的专业创作者而言,它仍不是一个成熟可靠的生产力工具。OpenAI的这枚“炸场”新星,优点与缺点同样突出,它的真正成熟,或许还需要等待下一个版本的迭代。

来源:https://www.donews.com/news/detail/1/6180815.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

微软Bing Video Creator免费接入Sora 2 AI视频生成模型
AI资讯
微软Bing Video Creator免费接入Sora 2 AI视频生成模型

2025年3月6日,微软宣布了一项重要更新:其必应视频创作者服务现已全面集成OpenAI最新发布的Sora 2视频生成模型,为用户带来更强大的AI视频制作体验。 这项服务于去年6月首次推出。在当时,许多在线AI视频生成工具仍主要面向付费用户。微软通过必应平台,率先向所有用户免费开放了基于初代Sora

热心网友
05.20
      Sora 2的真相解密:你真的适合当AI导演吗?
科技数码
Sora 2的真相解密:你真的适合当AI导演吗?

撰文 | 程书书编辑 | 李信马题图 | 豆包AI国庆假期,全球AI圈被一枚“重磅炸弹”炸醒。OpenAI发布新一代AI视频模型 Sora 2 及其配套应用 Sora App,即使需要填写邀请码才能

热心网友
10.14
Sora2用AI复活逝者引争议,家属不满强烈抵制

(注:原标题核心信息被压缩,“Sora2”和“亲属反对”作为核心关键词,事件性质用“争议”点出,控制在21个字/42字符内)
科技数码
Sora2用AI复活逝者引争议,家属不满强烈抵制 (注:原标题核心信息被压缩,“Sora2”和“亲属反对”作为核心关键词,事件性质用“争议”点出,控制在21个字/42字符内)

Sora 2的迅速走红,让肖像权问题再次成为焦点。毕竟有的人为了博取流量和讨论度,甚至不惜用已故名人生成视频。比如,Sora2“复活”迈克尔·杰克逊与著名演员罗宾·威廉姆斯,还让他们在街头一起进行即

热心网友
10.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

刑事案件电子数据取证密码获取程序拟明确
业界动态
刑事案件电子数据取证密码获取程序拟明确

公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。

热心网友
05.23
小鹏G9降价12万背后何小鹏的豪赌与挑战
业界动态
小鹏G9降价12万背后何小鹏的豪赌与挑战

理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小

热心网友
05.23
魏建军感谢于东来支援环塔拉力赛 红牛千箱胖东来厨师助阵
业界动态
魏建军感谢于东来支援环塔拉力赛 红牛千箱胖东来厨师助阵

5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给

热心网友
05.23
2026年比特币官方APP下载入口及官网安全访问指南
web3.0
2026年比特币官方APP下载入口及官网安全访问指南

比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”

热心网友
05.23
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解
AI资讯
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解

Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构

热心网友
05.23