豆包Seedance+1.5 Pro发布：首个音视频同步生成模型详解

2025年12月19日，火山引擎原动力大会正式发布豆包音视频创作模型Seedance 1 5 pro。此次新版本的推出标志着豆包音视频创作能力实现重要突破，首次支持直接生成带有声音的完整视频内容。用

豆包发布Seedance 1.5 Pro：首推音视频同步生成模型

2025年12月19日，火山引擎原动力大会正式推出豆包音视频创作模型Seedance 1.5 Pro。这次新版本的发布，标志着豆包在音视频创作能力上实现了重大飞跃，首次支持用户直接生成带有声音的完整视频内容。

用户只需将豆包App更新至最新版本，进入“照片动起来”功能，上传图片并配上几句简单的文字描述，然后选择“1.5 Pro”模型，就能够在短时间内获得一段配有音频的动态视频。

该模型的核心优势在于其原生的音视频联合生成能力。它不仅在音画同步性、画面表现力方面有明显提升，叙事也更为连贯。得益于创新的架构设计，它能够同步生成环境音效、动作声响、合成音效、乐器演奏、背景音乐及人声等多种音频元素，实现毫秒级的音画精准对位，确保视听体验高度一致，如同身临其境。

在语音表现方面，模型支持单人独白与多人对话场景。它能让角色口型与发音节奏精准匹配，不仅涵盖普通话，还精通多种方言（如四川话、粤语、陕西话、上海话等），以及英语和部分小语种。这种强大的多语言支持，能满足多元环境下的内容创作需求，帮助创作者还原更真实、更具沉浸感的对话。

在视觉呈现上，模型具备出色的运动控制能力，人物动作流畅自然，节奏把控准确，能够细致捕捉动态变化。同时，画面感知能力出众，人物情绪表达丰富，面部表情细腻生动，整体效果已接近影视级别，显著提升了视频内容的质感与感染力。