12月2日,千问APP正式接入万相系列最新模型Wan2.5,视频创作能力再度升级。新版本在动作精度和肢体协调性方面实现全面提升,并成为业内率先支持音视频同步输出的移动端AI助手。
阿里万相2.5是目前业界少数具备音画同步能力的视频模型之一。该模型同时支持理解、生成等多种任务,能够处理文本、图像、视频、音频等多模态的输入和输出。在权威大模型评测平台LMArena上,万相的图生视频能力位列全球第三,稳居国内前列。
在千问APP上,用户只需上传一张照片并输入一段文字描述,无需使用模板即可生成一段肢体动作自然、口型匹配精准的1080P高清唱跳视频,最长支持10秒时长。测试表明,无论是真人照片、萌宠、二次元角色,还是文物、卡通形象,千问APP都能精准支持。
去年年初,阿里推出的照片跳舞功能迅速风靡全网,激发了广大网友的创作热情,萌娃、萌宠跳舞视频在全平台广泛传播。此次千问APP接入万相2.5后,不仅在视频创作效果上全面提升,还进一步降低了创作门槛,支持用户自定义上传照片和输入文字。例如,用户只需输入一张图片和一段“小猫一边唱歌,一边跳舞”的文字描述,千问APP便能精准生成视频,让静态形象瞬间“活”起来。

这一功能上线后,再次点燃了网友的创作热情,社交平台上涌现出一批更具创意的“照片唱跳”内容。例如,用户可先通过千问APP将两张图片融合,生成一张“中世纪名画”风格的合照,再输入“图中的人物一边唱歌、一边跳舞,镜头要有动态感”等文字,即可实现合唱、群舞的视频效果,且能保持高质量的动感表现和极强的主体一致性。

据悉,千问App公测仅一周,下载量就已突破1000万次,超越众多应用成为史上增长最快的AI应用之一。
(审核:王瑞瑶)
