12月2日,千问APP正式接入万相系列最新模型Wan2.5,其视频创作能力再次迎来升级。新版本在动作精度与肢体协调性方面均有全面提升,并成为业内首个支持音视频同步输出的移动端AI助手。

阿里万相2.5是目前业界少数具备音画同步能力的视频模型之一,该模型能够同时处理理解与生成等多类任务,支持文本、图像、视频、音频多种模态的输入和输出。在权威大模型评测平台LMArena上,万相的图生视频能力位列全球第三,在国内持续保持领先地位。
在千问APP中,用户仅需上传一张照片并输入一段文字描述,无需使用模板,即可生成一段肢体动作自然、口型匹配精准的1080P高清唱跳视频,最长可支持10秒时长。测试表明,无论是真人照片、萌宠、二次元角色,还是文物、卡通形象,千问APP均可流畅支持。
去年年初,阿里推出的照片跳舞功能迅速在国内外走红,激发了网友的创作热情,兵马俑、萌娃、萌宠跳舞视频在全网广泛传播。此次千问APP接入万相2.5后,不仅全面提升了视频创作效果,还进一步降低了视频创作门槛,支持用户自定义上传照片并输入文字指令。例如,用户只需输入一张图片和一段“小猫一边唱歌,一边跳舞”的文字,千问APP便能精准生成视频,让静态形象瞬间“活”起来。
这一功能上线后,再次点燃了网友的创作热情,社交平台上涌现出一批更具创意的“照片唱跳”内容。例如,用户可先通过千问APP将两张图片融合,生成一张“中世纪名画”风格的合照,再输入“图中的人物一边唱歌、一边跳舞,镜头要有动态感”等文字,即可实现合唱、群舞的视频效果,并能够保持高质量的动感表现和极强的主体一致性。
据悉,千问App公测仅一周,下载量就已突破1000万次,超越ChatGPT、Sora、DeepSeek,成为史上增长最快的AI应用。
