Make-2：AI视频生成的新里程碑_AI热词解释_游乐网

Make-2：AI视频生成的新里程碑

类型：技术模型2026-05-19

Make-2是谷歌DeepMind团队推出的文本到视频生成模型，通过创新的双向扩散架构实现更长、更连贯的视频生成。

本次查询：Make-2

中文解释：Make-2视频生成模型

常见场景：AI视频生成 / 内容创作 / 影视预可视化

Make-2是谷歌DeepMind开发的先进文本到视频生成模型，通过双向扩散技术生成长达120秒、动作连贯的高质量视频。

Make-2在视频连贯性上取得显著突破，解决了早期AI视频生成中常见的物体变形、动作断裂问题。其生成的视频在时间一致性上接近专业水准，标志着文本到视频技术从“能看”到“可用”的关键转折，为影视、广告等内容创作领域提供了实用工具。

Make-2采用双向扩散架构，同时从视频首尾向中间生成内容，确保全局时间一致性。模型训练时引入大规模视频-文本配对数据，学习物理运动和场景变化的真实规律。相比单向生成模型，这种双向处理能更好地保持角色外观、场景布局的稳定性，避免视频后半段出现逻辑矛盾。

短视频内容创作：自媒体博主快速生成背景视频素材；影视概念预可视化：导演用文本描述快速预览场景效果；教育课件制作：将抽象概念转化为动态演示视频；广告原型设计：快速测试不同创意方案的视觉呈现；游戏开发：生成NPC动画或场景过渡片段。

Make-2不是简单的视频延长工具，而是从零生成完整视频的端到端系统。与Runway Gen-2等逐帧生成模型不同，Make-2通过全局规划确保视频整体叙事连贯。虽然支持120秒生成，但实际效果仍受文本描述具体程度影响，复杂多角色交互场景仍可能出错。

来源：AI 热词解释频道整理

Make-2 谷歌DeepMind 视频生成扩散模型多模态AI