12月1日消息,可灵AI今日通过官方公众号宣布,全球首个统一多模态视频模型——可灵视频O1模型正式全面上线。
据最新介绍,可灵O1模型构建了全新的生成式底座,实现了"功能割裂"的突破,并引入MVL(多模态视觉语言)交互架构,可在单一输入框内无缝融合多种任务。结合Chain-of-thought技术,该模型具备了强大的常识推理与事件推演能力。
官方特别强调,依托统一模型的深层语义理解力,"每一张照片、每一个视频、每一段文字,在可灵O1眼中皆是指令"。同步上线的还有全新创作界面,用户仅需简单对话即可轻松调用各类素材,精准生成每一处细节。
该模型支持多视角构建主体,无论镜头如何流转,主体特征都能保持稳定一致,确保画面精准连贯。同时,它还支持自由组合多个主体进行创作。



参考
体验链接
