12月16日,阿里云官方宣布,新一代万相2.6系列模型正式发布。该系列模型面向专业影视制作与图像创作场景进行了全面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型。这款视频生成模型同时支持音画同步、多镜头生成及声音驱动等多种功能。
即日起,所有人都可以直接在万相平台体验万相2.6,企业用户还能通过阿里云百炼调用模型API。
据介绍,通义万相在模型结构上集成了多项创新技术,可对输入的参考视频进行多模态联合建模与学习,全面获取具有时序信息的主体情绪、姿态和多角度视觉特征,同时提取音色、语速等声学特征,在生成阶段将这些信息作为参考条件加以控制,实现从画面到声音在多个感官维度上的一致性保持与迁移。目前,万相可支持单人和多人的表演生成。
此次发布的万相2.6进一步提升了画质、音效、指令遵循等能力,单次视频生成时长达到国内领先的15秒。万相2.6还新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人物与物体合拍的视频创作,还能自动实现多镜头切换等专业任务,全面满足专业影视级场景的制作需求。
面向广告设计、短剧制作等专业场景,用户只需输入连续提示词,万相便能生成一段拥有完整叙事逻辑的短片,让每个人都能轻松体验导演的创作过程。
目前,万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等十余种视觉创作能力,并已广泛应用于AI漫画、广告设计和短视频创作等多个领域。
