记者从字节跳动获悉,豆包App的视频生成能力迎来重要升级,现已支持Seedance 1.5+ Pro模型,能够一键生成声音与画面相匹配的有声视频。
记者在使用中发现,打开豆包App的对话框,选择「照片动起来」功能,上传图片并输入提示词,然后选用「1.5+ Pro」模型,即可轻松体验到这一新功能。
据字节跳动Seed团队介绍,Seedance 1.5+ Pro是其新一代音视频创作模型,它依托于原生的音视频联合架构与精细化的后训练,能够更好地理解和遵循多模态指令,生成协同一致的内容。
据悉,该模型能够实现精准的音画同步,带来更高的视听一致性。它不仅支持多种主流语言,还能适配不同的地方方言与口音,从而捕捉到语音中独特的情感张力和节奏韵律。
豆包中的Seedance 1.5+ Pro还具备电影级的运镜控制与动态张力,拥有自发的镜头调度能力。它能够实现电影级的画面拼接与专业影调,显著提升了生成视频的动态表现力。
此外,模型的语义理解与叙事协调性也得到增强,实现了对叙事语境的精准解析。这显著提升了音视频段落的整体叙事连贯性,为专业级的内容创作提供了有力支撑。
Seedance 1.5+ Pro模型在对视听协同、动态调度以及文化语境的精准把握上表现优异,使其在影视创作、短剧生成、广告生产及戏剧演绎等场景中,均展现出较强的叙事表现力与视听融合度。
2025年6月,视频生成模型Seedance 1.0+ Pro正式发布,支持文字与图片输入,能够生成多镜头无缝切换的高品质视频,其主体运动的稳定性与画面的自然度都达到了较高水平。
近期,即梦AI平台也同步上线了Seedance 1.5+ pro,支持声音与画面同步生成。
具体来看,即梦AI网页版迎来全面升级,旨在打造一站式的“AI片场”创作平台。本次更新涵盖了核心模型能力、交互方式及创作流程等环节,旨在为用户提供从灵感迸发到成品输出的全流程创作支持,让创意海报、专业视频乃至AI漫画、AI短片的制作变得更加高效便捷。
此次升级的核心亮点之一,是即梦AI最新推出的视频生成能力“视频 3.5+ Pro”。该模型基于字节自研模型Seedance 1.5+ pro,在即梦AI平台上首次全球发布。视频 3.5+ Pro 支持视频与音频同时生成,人物口型、乐器演奏、环境音效等元素无需后期再行配音,大幅提升了视频的真实感与沉浸感。该模型在执行复杂指令方面表现出色,能精准响应运镜调度、动作幅度及光影氛围等要求,并对中文发音口型、面部微表情乃至多种方言生成提供了更强的支持。
除了模型能力的提升,即梦AI网页版还将迎来全新UI界面,升级画布、智能体(agent)等功能模块的交互体验。
字节跳动方面表示,本次全面升级标志着即梦AI网页版正致力于将复杂的AI创作工具整合为直观、高效的一站式“AI片场”。它通过打包整合从灵感、画面、视频到长镜头的全流程能力,助力创作者将每一个天马行空的创意,转化为异彩纷呈的视觉作品。
