百度视频生成模型"蒸汽机"完成大幅升级
记者 | 肖芳
编辑 | 文姝琪
百度最新推出的视频生成模型"蒸汽机"在面世50天后迎来重大版本迭代。
此次升级最显著的突破在于实现了多人多声线同步视频生成技术。更新后的模型可以直接输出带声音、口型匹配的完整视频,无需再进行后期配音工序。即使在多人物交互的复杂场景中,模型也能确保声音表情与肢体动作的高度协调。此外,视频分辨率、帧率等画质指标均有提升,镜头语言的运用也更为多样化。
除技术突破外,百度对该模型的商业化应用进行了大幅让利。根据百度商业体系研发负责人刘林在发布会公布的信息,"蒸汽机"Turbo版本生成5秒720p高清有声视频的单次成本降至1.4元。据行业数据显示,同类产品生成同等规格无声视频的均价约为2元。这意味着百度将视频生成成本压缩至市场价的七折。
与百度其他AI产品相比,"蒸汽机"展现出更快的迭代速度和更激进的市场策略。百度副总裁陈一凡在接受采访时表示,1.0版本主要满足市场需求,而2.0版本则实现了需求驱动与技术优化的双轮驱动。
值得一提的是,"蒸汽机"并非由百度基础技术部门开发,而是出自移动生态事业群旗下的商业研发团队。该模型主要面向广告主和代理商群体,旨在为商业视频内容制作提供智能化解决方案。
