先直接给出结论。
今天这次实践,并非单纯“又制作了一个AI视频”,而是成功打通了 OpenClaw 与 libtv-skill 的完整链路——而且是从初始失败中逐步跑通的。
起初输入的指令很基础:“生成10秒内,美女在海边散步。”听起来很普通,对吧?但紧接着就遇到一连串阻碍:提示“VIP专属模型请先开通会员”、“系统异常”……令人头疼。
但这里最关键的并非报错本身,而是第一次真切体会到:OpenClaw 作为总调度,libtv-skill 作为执行引擎。它并非简单地“帮您点击一个按钮”,而是将您的一句自然语言,自动转化为完整的工作流。

libtv-skill 究竟发挥了什么作用?许多人认为它仅仅是“生成图片和视频”。但实际上,在今天的实战中,它至少执行了以下步骤:创建会话(create session)、自动向后端生成引擎发送消息、轮询任务状态(query session)、处理失败重试和模型切换、返回可直接交付的链接(图片/视频)。你看到的只是一句指令,背后却是一整套任务编排流程。
LibTV 官方网站:https://www.liblib.tv " GitHub 项目地址:https://github.com/libtv-labs/libtv-skills
今日实测成功路径(可直接复用)
第1步:直接生成视频(失败)——首先遇到会员权限限制,这一步非常真实。

第2步:调整策略,先生成参考图(成功)——先获取一张高质量写实图片,画面、光线与构图均稳定。

第3步:基于图片生成5秒视频(二次尝试)——首次仍被权限限制,开通会员后重新执行。
第4步:成功输出视频(完成闭环)——最终获得mp4成片链接,整条链路闭环达成。

为什么说“长视频自动化已成功跑通”?
因为核心不在于5秒还是5分钟,而在于是否打通了以下四个层次:指令理解层(用户自然语言输入)、执行编排层(OpenClaw 统一调度)、生成能力层(libtv-skill 模型驱动)、结果交付层(可追踪、可下载、可复用)。今天这四层已经全部打通。因此从5秒扩展到5分钟,本质上属于工程扩展,而非从零到一的突破。
真正的分水岭已经到来
过去大家比拼的是谁更擅长写提示词(prompt),接下来比拼的是:谁能稳定地将内容进行“批量生产”。不是偶尔生成惊艳图片,而是每天持续产出成片。不是玩具,而是流水线。
可以负责任地说:OpenClaw 与 libtv-skill 构成的这条视频自动化链路,已经具备实际应用价值。今天只是从5秒起步——下一步将是标准化模板与长视频批量化生产。这才是AI内容生产领域真正的硬核技术。
