智谱技术团队今日悄然发布了一项重磅更新——最新版视频生成模型CogVideoX v1.5现已正式上线并开源。相较于前代,本次升级幅度显著:支持生成5秒或10秒时长、768P分辨率、16帧的视频,并且图生视频(I2V)模型完全解除了尺寸限制,任意比例均能处理。更重要的是,图生视频的质量与复杂语义理解能力实现了肉眼可见的飞跃。

据官方介绍,CogVideoX v1.5将同步登陆“清影”平台,并与同期推出的CogSound音效模型深度融合。至此,“新清影”的功能亮点如下:
- 品质全面升级:图生视频的整体质量、画面美学表现、运动合理性,以及对复杂提示词的语义理解能力,均较上一代显著增强。
- 超高清分辨率:支持直接生成10秒、4K分辨率、60帧的超高清视频——这已不仅关乎“流畅”,更具备了工业级输出的实力。
- 灵活比例适配:任意画面比例均可生成,从竖屏短视频到横屏宽银幕,完美适配多种播放场景,极具灵活性。
- 多通道生成:同一文本或图片可一次性输出4个不同侧重点的视频,大幅提升创作效率。
- 智能音效同步:最令人瞩目的是,新清影能够生成与画面内容精准匹配的音效——从此告别“默片”时代,AI视频真正实现了有声有色。
