12月2日,千问APP正式接入万相系列最新模型Wan2.5,视频创作能力迎来全面升级。模型在动作精度和肢体协调性方面均有显著提升,成为首个支持音视频同步输出的移动端AI助手。
阿里万相2.5是目前业界少数具备音画同步能力的视频模型之一,该模型兼具理解与生成等多任务处理能力,支持文本、图像、视频、音频多种模态的输入与输出。在权威大模型评测平台LMArena上,万相模型的图生视频能力位列全球第三,稳居国内榜首。
在千问APP上,用户仅需上传一张照片并输入一段文字,无需使用模板,即可生成一段肢体动作自然、口型匹配精准的1080P高清唱跳视频,最长支持10秒时长。测试结果显示,无论是真人照片、萌宠、二次元角色,还是文物、卡通形象,千问APP均可精准支持。
去年年初,阿里推出的照片跳舞功能迅速风靡全网,激发了广大网友的创作热情。兵马俑、萌娃、萌宠跳舞视频在社交平台广泛传播。此次千问APP接入万相2.5后,不仅显著提升了视频创作效果,更进一步降低了创作门槛,支持用户自定义上传照片和输入文字。例如,用户只需输入一张图片和“小猫一边唱歌,一边跳舞”的指令,千问APP便能精准生成视频,让静态形象瞬间“活”起来。
这一功能上线后,再次点燃了网友的创作热情,社交平台上涌现出大量更具创意的“照片唱跳”内容。比如,用户可先通过千问APP将两张图片融合,生成一张具有“中世纪名画”风格的合照,再输入“图中的人物一边唱歌、一边跳舞,镜头要呈现动态感”等描述,即可实现合唱、群舞的视频效果,且能保持高质量的动感表现和极强的主体一致性。
据悉,千问App公测仅一周,下载量便突破1000万次,超越ChatGPT、Sora、DeepSeek成为史上增长最快的AI应用。
