智谱新清影发布：10秒4K60帧视频自带音效_AI热点日报

智谱新清影发布：10秒4K60帧视频自带音效

类型：热点整理2026-06-28

智谱发布CogVideoXv1 5并开源，集成CogSound音效模型，支持生成10秒4K60帧超高清视频，图生视频质量、复杂语义理解显著提升，任意比例及多通道输出，告别无声默片。

智谱技术团队今日悄然发布了一项重磅更新——最新版视频生成模型CogVideoX v1.5现已正式上线并开源。相较于前代，本次升级幅度显著：支持生成5秒或10秒时长、768P分辨率、16帧的视频，并且图生视频（I2V）模型完全解除了尺寸限制，任意比例均能处理。更重要的是，图生视频的质量与复杂语义理解能力实现了肉眼可见的飞跃。

告别“默片”：智谱发布新清影，可生成 10 秒 4K60 帧 / 自带音效视频

据官方介绍，CogVideoX v1.5将同步登陆“清影”平台，并与同期推出的CogSound音效模型深度融合。至此，“新清影”的功能亮点如下：

品质全面升级：图生视频的整体质量、画面美学表现、运动合理性，以及对复杂提示词的语义理解能力，均较上一代显著增强。
超高清分辨率：支持直接生成10秒、4K分辨率、60帧的超高清视频——这已不仅关乎“流畅”，更具备了工业级输出的实力。
灵活比例适配：任意画面比例均可生成，从竖屏短视频到横屏宽银幕，完美适配多种播放场景，极具灵活性。
多通道生成：同一文本或图片可一次性输出4个不同侧重点的视频，大幅提升创作效率。
智能音效同步：最令人瞩目的是，新清影能够生成与画面内容精准匹配的音效——从此告别“默片”时代，AI视频真正实现了有声有色。

来源：https://www.1ai.net/22785.html

告别“默片”：智谱发布新清影，可生成 10 秒 4K60 帧自带音效视频

延伸阅读

补充最近整理过的热点入口。

智谱新清影发布：10秒4K60帧视频自带音效

相关热点

延伸阅读