
2025年7月,阿里开源的视频生成模型通义万相Wan2.2凭借强大功能在海外引发广泛关注。一位名为Lord Bebo的用户近日分享演示视频,展示了其突破性新特性:借助面部映射技术,用户可在视频中完全隐藏真实面貌,仅凭声音与动作便能实时驱动另一张面孔,创造出高度逼真的数字分身。
根据最新技术资料显示,通义万相Wan2.2仅需单张图像配合一段音频,即可生成高质量人物动态视频,输出分辨率不受限制。模型泛化性能出众,支持卡通形象、动物等非真人角色的生动呈现。通过音频驱动技术,能精准控制人物面部微表情与肢体动作细节,动态表现更显自然流畅。
在运动控制方面,新版显著提升了镜头移动的稳定性,可实现专业级运镜效果。同时,系统在指令理解与执行能力上实现跨越式提升,能从容应对包含复杂场景变换与视觉特效的生成需求。对于输入图像中的原始特征,包括艺术风格、人物特质、品牌标识或文字内容,系统在生成过程中均能保持高度一致性。
值得一提的是,Wan2.2引入了电影级视觉控制机制,支持专业镜头语言描述,涵盖光影构图、色彩调性、画面构图等要素,使输出画面风格丰富多样,细节呈现细腻入微。整体动态范围更大且运行稳定,语义理解能力进一步增强,能更精准地还原用户创作意图。
