据智通财经APP获悉,2月12日,豆包视频生成模型Seedance 2.0正式发布,目前已全面接入豆包和即梦产品,并上线火山方舟体验中心。Seedance 2.0在物理规律遵循及长效一致性等难题上取得显著突破,同时赋予创作者前所未有的自由度,使视频生成质量与可控性满足专业生产场景需求。目前该模型限制使用真人图像/视频作为主体参考,如需采用真人形象需经本人验证或取得授权。
01.导演级操控,实现视频生成"所见即所得"
稳定呈现复杂交互与动态表现:Seedance 2.0在运动场景下的生成可用率达到业界顶尖水平,其在人物动作建模方面具备自然连贯、遵循现实世界运动规律的显著优势。该模型能高保真地合成时序精密的复杂交互场景,在特写镜头中展现高度逼真的细节与严密的物理逻辑,宛若实拍效果。
多模态全能参考:支持文字、图片、音频、视频四种模态混合输入,模型可参考输入素材中的构图、动作、运镜、特效、声音等元素,大幅提升创作自由度。
指令遵循与可控性全面提升:Seedance 2.0能精准还原复杂脚本,保持稳定的主体一致性。模型还具备一定的编导思维,分镜设计和运镜贴合叙事逻辑。此外,新增视频编辑与视频延长能力,让每位用户都能像导演一样掌控全场。
高仿沉浸音效同步生成:集成双声道立体声技术,可实现高仿真、沉浸式的音效生成。模型支持背景音乐、环境音效或人物解说等音频多轨并行输出,精准对齐画面节奏,更好地支持专业级视听内容创作。
广泛适配各类生产场景:无论是商业广告、影视特效,还是游戏动画、解说视频,模型均能提供高质量的生成效果。预计在2月中下旬,Seedance 2.0的API服务将上线火山方舟,帮助企业客户更好地落地创意。
02.Seedance 2.0评测:综合表现行业领先
为全面评估模型在多模态场景的综合能力,字节跳动Seed团队协同影视领域专家,建立了覆盖音视频生成、参考及编辑场景的综合评测集合及相关评测标准。

文生视频能力评测

图生视频能力评测

多模态参考生成评测
在各项评测中,Seedance 2.0的综合表现达到行业领先水平。但与此同时,模型在细节稳定性、多人口型匹配、多主体一致性、文字还原精度和复杂编辑效果等方面仍有优化空间。
