
2025年12月19日,火山引擎原动力大会正式推出豆包音视频创作模型Seedance 1.5 Pro。这次新版本的发布,标志着豆包在音视频创作能力上实现了重大飞跃,首次支持用户直接生成带有声音的完整视频内容。
用户只需将豆包App更新至最新版本,进入“照片动起来”功能,上传图片并配上几句简单的文字描述,然后选择“1.5 Pro”模型,就能够在短时间内获得一段配有音频的动态视频。
该模型的核心优势在于其原生的音视频联合生成能力。它不仅在音画同步性、画面表现力方面有明显提升,叙事也更为连贯。得益于创新的架构设计,它能够同步生成环境音效、动作声响、合成音效、乐器演奏、背景音乐及人声等多种音频元素,实现毫秒级的音画精准对位,确保视听体验高度一致,如同身临其境。
在语音表现方面,模型支持单人独白与多人对话场景。它能让角色口型与发音节奏精准匹配,不仅涵盖普通话,还精通多种方言(如四川话、粤语、陕西话、上海话等),以及英语和部分小语种。这种强大的多语言支持,能满足多元环境下的内容创作需求,帮助创作者还原更真实、更具沉浸感的对话。
在视觉呈现上,模型具备出色的运动控制能力,人物动作流畅自然,节奏把控准确,能够细致捕捉动态变化。同时,画面感知能力出众,人物情绪表达丰富,面部表情细腻生动,整体效果已接近影视级别,显著提升了视频内容的质感与感染力。
