12月17日,字节跳动Seed团队正式发布了新一代音视频创作模型——Seedance 1.5 pro。这款模型的核心在于音视频联合生成,它能够精准理解复杂镜头语言的描述指令,同步产出高质量画面与叙事音频,真正实现了“音画一体”的高效内容创作流程。
在音频生成方面,模型支持多样化人声与音效输出。其中文语音表达尤为自然流畅,并能覆盖多种常见方言。通过优化音画同步技术,显著提升了人物口型与语音的匹配度,动作与声音的协调性也更加出色。整体音质清晰稳定,具备良好的空间层次感,能够根据画面节奏与情绪变化进行动态适配,从而增强叙事连贯性与沉浸体验。
在视频表现上,模型可以完成复杂的运镜设计,并能在叙事逻辑下智能补充合理的人物行为与场景元素。特写镜头注重细节刻画,通过精准呈现微表情来延续情感脉络。画面在构图、光影与氛围营造方面,均体现出自然协调的影视化美学风格。
Seedance 1.5 pro还具备基于提示词构建基础叙事结构的能力,能够在人物情绪、面部表情、肢体动作与语音表达之间实现高度统一,确保视听语言的一致性与完整性。该模型适用于短片创作、商业广告及社交媒体内容等多种应用场景。
目前,该模型已接入“即梦 AI”与“豆包”平台,正式面向公众开放使用。据团队介绍,在多项综合评估中,Seedance 1.5 pro的核心性能指标已达到行业领先水平。
