阿里通义万相2.6发布:电影级视频模型首推角色扮演功能
12月16日,阿里巴巴旗下的通义千问宣布推出新一代通义万相2.6系列模型,该版本在专业影视制作与图像创作领域实现了突破性升级。
作为国内首个支持角色扮演功能的视频生成模型,其创新性地融合了音画同步、多镜头生成、声音驱动等核心技术,构建了当前全球功能最完整的视频生成解决方案。

通义万相在模型结构上集成了多项创新技术,能够对输入的参考视频进行多模态联合建模与学习,分析具有时序信息的主体情绪、姿态以及多角度全面的视觉特征。

同时,模型会提取音色、语速等声学特征,并在生成阶段作为参考条件进行控制,从而实现了从画面到声音的全感官、全维度一致性的保持与迁移。目前万相已可支持单人及多人的表演生成。

此次发布的万相2.6进一步提升了画质、音效、指令遵循等能力,单次视频生成长度达到了国内领先的15秒。
万相2.6还新增了角色扮演和分镜控制功能,不仅能一键生成单人、多人、人物与物象合拍的高质量视频,还能自动实现多镜头切换等专业影视任务,充分满足专业影视级场景的创作需求。
万相官网访问地址:
https://tongyi.aliyun.com/wan/
相关攻略
阿里今日重磅发布,其QoderWorker桌面智能体(Agent)现已面向所有用户全面开放,并同步推出了Mac与Windows双平台版本。官方将其定位为“人人可用”的桌面AI助手,用户无需进行任何复杂的本地环境部署,即可在个人电脑上获得一个“真正能解决问题、执行任务的专属AI助理”。 那么,这款桌面
AI生图领域,审美疲劳和色彩失控一直是用户心中的两根刺。今天,阿里巴巴发布的Wan2 7-Image统一模型,似乎正是冲着解决这些痛点而来。它打出的旗号是更具“活人感”,并带来了几项相当硬核的升级。 简单来说,这个模型的核心目标很明确:告别千篇一律的“AI标准脸”,实现真正的“千人千面”;引入精准的
5月20日,阿里云年度峰会上,一项重磅发布引发行业关注:基于平头哥最新一代AI芯片“真武M890”打造的128卡超节点服务器集群正式亮相。 该系统的核心技术突破,在于其搭载了名为ICN Switch 1 0的高性能互联芯片。它将芯片间的通信时延大幅降低至百纳秒级别,从而使得128颗AI芯片能够以前所
4月7日,阿里巴巴旗下AI助手通义千问宣布,其核心的“深度研究”专业能力迎来重磅升级。本次升级不仅新增了财经分析等关键模块,更接入了覆盖A股、港股、美股等市场超过1 3万支股票的实时行情数据,以及近百万家上市公司的财报与公告信息。在当前AI高阶功能普遍转向付费订阅的行业趋势下,千问团队选择将此次升级
宇树科技与阿里酝酿合作,机器人现身西溪园区 最近科技圈里有个消息传得挺热:宇树科技和阿里巴巴,这两家分别在机器人和电商领域举足轻重的公司,可能正在联手谋划一项重要的出海战略。这事儿要是成了,对行业格局的影响,恐怕不小。 消息的源头,是几张颇有故事感的现场照片。宇树科技最新的机器人产品R1,近日出现在
热门专题
热门推荐
公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。
理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小
5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给
比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”
Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构





