百度旗下视频生成模型迎来一项重要技术突破,其自主研发的“文心精炼”系统首次实现了AI长视频的即时交互生成功能。通过创新应用流式视频技术,这一系统成功打破了传统AI视频生成大约10秒的时长限制,能够实现不限时长内容的输出,生成效率显著超越国内同类产品。
用户操作流程得到深度优化,只需上传单张图片并输入文字提示即可启动创作。系统独有的实时预览功能完整展示模型推理过程,生成过程中用户可随时暂停操作,或在任意时间节点修改提示词,对视频情节走向、画面细节及转场效果进行动态调整。这种交互模式将传统AI视频的“单向输出”转变为“双向共创”,为用户提供仿佛拥有无限画布般的持续创作体验。
此次技术升级同步推出两大创新功能:交互式数字人与开放世界动态构建系统。数字人支持多模态沉浸式互动,已应用于智能导购、在线教育、情感陪伴等多个场景;开放世界系统则赋予用户完全操控权,可在AI生成的虚拟游戏地图、数字旅游景点及宇宙探索场景中进行自主探索与互动。
自今年5月启动持续迭代计划以来,该模型已陆续实现音视频同步生成、多角色对话生成、移动端适配等关键技术突破。本次长视频实时交互功能的落地,不仅拓展了影视预演、互动娱乐、个性化营销等领域的应用场景,更进一步推动AIGC技术从基础素材生成向深度内容共创平台转型。
