视频能PS了?阿里视频大模型拯救废片,我用它捏脸、换角色、改剧情
阿里通义实验室发布Wan2.7-Video:一句话改视频,全模态编辑时代来了

智东西
作者 王涵
编辑 心缘
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
4月3日,阿里通义实验室正式推出了视频创作大模型Wan2.7-Video。这款模型最大的看点,在于它支持文本、图像、视频、音频全模态输入,并且实现了对视频画面结构、剧情走向、局部细节乃至时序变化的全面编辑能力。
简单来说,就是“一句话改视频”。模型能智能保持光影与材质的统一性,还允许用户搭配多张图像作为参考输入,让创意落地更精准。
更值得一提的是,Wan2.7-Video引入了一套视频续写与尾帧控制的联合机制。这意味着,用户在让视频故事延续下去的同时,可以直接指定故事的结尾画面,实现了创作过程“从哪来到哪去”的全程可控。此外,模型支持最多5个视频主体作为参考,全模态素材调用能力相当强悍。
在运镜调度上,用户只需输入一段简短的文字描述,模型便能自动完成智能剧本创作和分镜调度。更专业的是,它还能根据不同的电影类型(比如西部片或科幻片),自动匹配相应的色彩和光影风格,颇具导演思维。
为了验证其实用性,我们上手体验了它的角色替换功能:尝试将一段原视频中的欧美男生,替换为参考图中的中国男生。
效果如何?替换后的视频,背景环境和人物的服装、姿态都与原视频保持了一致,人物的口型和台词也毫无违和感地保留了下来。唯一细微的调整是,新人物服装上的光影效果略有压暗,以适应新主体的融入。最关键的是,视频中生成的中国男生形象,与提供的素材照片相似度很高。
原视频:
修改后视频:
体验链接:
阿里云百炼:
https://bailian.console.aliyun.com/cn-beijing?tab=model#/model-market/all?providers=wan
万相正式:
https://tongyi.aliyun.com/wan
一、支持局部增删改,可参考多模态素材
在Wan2.7-Video里,编辑视频可以像修图一样直观。用户通过自然语言指令,就能对视频画面的局部进行精准调整,而编辑后的区域在光影与材质上能与原视频无缝融合,几乎看不出修改痕迹。
具体能做什么?指令式增删元素、替换物体、修改物体属性都不在话下。它还能参考用户提供的图像内容,进行精准的元素添加。例如,保持人物动作不变,将背景从夏日艳阳一键转换为深秋萧瑟,或者直接改变整个视频的艺术画风。
对于已有的视频素材,模型支持通过指令描述,对剧情内容和拍摄手法进行深度修改。
在角色处理上,Wan2.7允许用户在不改变角色原有身份和场景的前提下,对其行为、台词甚至拍摄视角进行修改,实现高效的二次创作。
比如,修改角色所说的台词内容,模型会同步调整角色的情绪、口型以匹配新台词,并保持音色统一。也可以只改变角色的行为逻辑,例如“其他保持不变,让坐在沙发上的女生变成站着打游戏”。
同时,模型支持对同场景中角色的风格、服饰、道具等进行修改,并保持其原有姿势。在拍摄层面,Wan2.7支持修改相机参数,如机位、视角、景别、镜头类型、焦距等,相当于拥有了一个虚拟摄影团队。
此外,Wan2.7还能保留原视频的动作序列或镜头运动,直接生成全新场景;或者参考其他视频的风格化表现、粒子特效材质;甚至保留原视频的色彩风格与环境,仅增加新的剧情段落。
本次升级的重点之一,是优化了“视频续写+尾帧控制”功能。这使得Wan2.7能同时实现对剧情走向和画面构图、光影的精准控制,兼顾了动态的延续性与结构的可控性。
用户只需描述后续剧情,模型就能在保证画面连贯的前提下,延展故事、变换机位或调整叙事节奏。这有效解决了传统视频生成中首尾帧衔接生硬的“刹车感”,以及单纯续写时可控性差的痛点。
在参考素材方面,Wan2.7支持图像、视频、音频等多模态参考,且最多支持5个视频主体作为参考。模型还对多宫格参考图(如漫画分格)进行了针对性优化,能够直接将静态漫画转换成动态动画片。

二、演绎超40种表情,还能拍出希区柯克效果
据通义实验室视频团队透露,Wan2.7对海量专业剧本进行了深度学习,这使得模型掌握了编排不同戏剧核心的内在规律。
因此,模型能根据一句话提示,自动构建出符合戏剧逻辑的起承转合,并生成节奏精准、镜头语言丰富的专业级分镜脚本。在情绪表达上,Wan2.7不仅能表现高兴、悲伤、愤怒等基础情绪,还能演绎超过40种细分表情,让角色表演更具层次感。
更进一步,Wan2.7建立了一种新的映射关系:以“戏核”(故事核心)作为高级指令,直接驱动光影、摄影与色彩等底层参数的生成。用户只需指定影片类型,如“西部片”或“科幻片”,即可自动获得与之高度契合的光影氛围与色彩风格。
在动画风格化方面,该模型将艺术风格解构为整体造型、线条轮廓、光影材质、空间感等多个独立维度。用户可以像搭积木一样自由组合这些维度,创造出独一无二的视觉风格,并确保在多镜头之间保持高度一致性。
拍摄技巧上,Wan2.7支持推、拉、摇、移、跟、升降等数十种基础运镜手法,更能执行希区柯克式变焦、上升揭示、左移右摇、手持跟拍等复合摄影技巧,为视频注入电影级的动感与张力。
结语:视频生成不再是视觉模型的独角戏
过去,想要修改视频中的任何细节,往往意味着推倒重来,效率低下且难以保证一致性。Wan2.7通过底层的效率优化,显著降低了专业视频创作的门槛,让复杂编辑变得轻松可控。
值得注意的是,通义实验室语音团队在音频预训练、数据及理解方面提供了关键支持,显著提升了模型生成声音的真实感、自然度、音乐旋律以及与画面的同步质量。
而虎鲸文娱摩酷实验室则贡献了其在影视领域知识和角色表演方面的专业积累,进一步提升了模型的影视级表现力。
双方的深度合作揭示了一个明确趋势:当下高质量视频生成的竞争,早已不再是视觉模型的独角戏。它正演变为对音画协同、表演逻辑和影视美学的综合考验,是一场真正意义上的多模态、跨领域协同作战。
相关攻略
iPhone如何实现定时自动重启?四种实用方法详解:快捷指令自动化切换飞行模式、快捷指令串联锁定与唤醒模拟重启、Siri语音联动计时器分步操作、以及使用认证第三方工具深度刷新系统。 你是否希望iPhone能在固定时间自动重启,以清理系统缓存、优化运行速度?虽然iOS系统并未内置原生的定时重启功能,但
2026 年年度十大网站搭建公司推荐 对于正在筛选高端网站建设服务商的企业决策者而言,面对市场上林林总总的选项,如何做出明智选择,确实是个不小的挑战。这份榜单旨在为预算在10万至20万元区间、追求高品质定制化官网的企业,提供一份客观、数据化的参考。内容不夸大、不引导,只聚焦于真实可验证的行业信息与服
iPhone强制重启全攻略:从全面屏到经典机型,一键解决卡死、黑屏、无响应问题 当你的iPhone突然屏幕冻结、触摸失灵、完全无响应时,先别急着送修。这通常是iOS系统进程临时卡顿所致,类似于电脑死机。此时,常规的滑动关机往往失效,最有效的解决方案是执行“强制重启”。这是一种硬件级的复位操作,能强制
“九族”这一概念,在历史典籍与影视作品中频繁出现,它象征着中国古代宗法社会最核心的亲缘关系网络。但你是否真正清楚,“九族”具体包含哪些亲属?其范围在不同历史时期和语境下,其实存在差异。本文将为您详细解读这一传统宗法概念的历史渊源与具体内涵。 九族具体指哪些亲属? 概括而言,“九族”是中国古代对血缘与
一、进入相机慢动作拍摄界面 想要拍摄出惊艳的慢动作视频,第一步是正确开启iPhone的专属模式。如果未手动切换,相机默认不会启动高速录制功能。 1、解锁您的iPhone,在主屏幕找到并点击相机应用图标,启动相机。 2、观察取景器底部的拍摄模式列表,用手指向左滑动,直至找到标有“Slo-mo”(慢动作
热门专题
热门推荐
Lemonaid是什么 如果你正为音乐创作寻找得力助手,那么Lemonaid很可能就是答案。它是一款专门面向专业音乐人打造的AI音乐生成工具,核心能力在于自主生成包含完整旋律、和声与节奏的乐曲。无论是想要一段氛围感十足的背景音乐,还是为具体场景定制配乐,它都能提供高度逼真且质量上乘的作品。工具提供了
苹果也要出折叠屏,传闻已经有几年了,从目前供应链、分析师与知名爆料者释放的信息来看,这款与市面大折都不一样的阔折叠似乎已经蓄势待发,大概率今年下半年就要正式面市。今天我们就来为大家汇总一波,没准儿就有你想知道的消息。 关于苹果折叠屏手机的传闻,已经流传了好几年。如今,综合供应链、分析师以及各路知名爆
《刺客信条:黑旗重制版》官宣之际,这款新海盗游戏为何能抢先赢得玩家口碑? 当游戏界的焦点都集中在《刺客信条:黑旗重制版》的正式公布时,一款名为《风启之旅》(Windrose)的开放世界海盗生存建造游戏,却凭借其过硬的品质与独特的玩法融合,悄然在玩家社区中掀起热议。这款由乌兹别克斯坦团队Kraken
产品介绍 提到云端智能视频创作,腾讯智影是一个绕不开的名字。这款由腾讯推出的平台,本质上是一个一站式的在线视频工厂,集成了从素材挖掘、剪辑、渲染到最终发布的全链路功能,旨在为用户提供全方位的视频创作解决方案。更吸引人的是,它不仅免费开放,还深度整合了多项前沿AI技术,目标很明确:让视频化表达这件事,
《王者荣耀世界》线下活动风波:合影互动引争议,职业素养与网络舆论深度探讨 近日,《王者荣耀世界》的一场线下玩家见面会,因台上一次短暂的合影互动,意外成为全网热议的焦点。活动中,一位男粉丝上台与角色扮演者(Coser)合影时,主动做出比心手势以示友好,却未得到身旁Coser的任何回应。男生举着手势在原





