万相2.6系列模型发布：支持角色扮演与多镜头生成功能

首页

热心网友

转载

2025-12-16

12月16日，阿里巴巴集团旗下的通义万相团队正式推出新一代万相2.6系列模型。这一版本被定义为国内首个支持角色扮演功能的视频生成模型，同时整合了音画同步、多镜头生成及声音驱动等多项核心能力。

据了解，万相2.6在技术层面通过多模态联合建模，能够对输入视频的时序信息、主体特征及声学要素进行协同学习，旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解，将原始素材构建为包含多镜头切换的专业叙事段落。

此次升级重点提升了画质、音效与指令遵循能力，单次生成视频时长最高支持15秒。新增的角色扮演功能允许用户上传个人视频并结合提示词，模型可自动完成分镜设计、角色演绎与配音，生成具备电影感运镜的短片。该能力主要面向广告设计、短剧制作等专业场景。

目前，万相模型家族已具备文生图、图像编辑、文生视频等十余种视觉创作能力。即日起，用户可通过通义万相平台正式体验万相2.6，企业用户也可通过阿里云百炼平台调用模型API。

新一代万相2.6系列模型发布：支持角色扮演、多镜头生成功能

来源:https://tech.ifeng.com/c/8p89MNIaSN4

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：阿里万相2.6上线，国内首推角色扮演功能下一篇：定义AI时代电商营销新模式的核心路径

热门推荐

免费在线OCR工具TextIn使用指南与功能详解

在文档数字化与智能处理领域，一款高效精准的在线工具能极大提升工作效率。今天重点评测的TextIn Tools，正是这样一个集OCR识别、格式转换于一体的全能型免费平台。它由上海合合信息科技开发，该公司在人工智能文字识别领域拥有超过17年的技术积累，实力深厚。我们熟悉的“扫描全能王”、“名片全能王”等

热心网友

05.19

AI在线PPT美化工具智能优化演示文稿设计

还在为制作PPT而烦恼吗？排版耗时、素材难寻、风格杂乱……这些常见困扰，或许一个智能工具就能高效化解。 WPS智能PPT，是一款基于先进人工智能技术的在线演示文稿辅助平台。其核心优势在于：用户仅需输入文本内容，内置的AI引擎便能自动进行视觉设计与美化，快速生成多种风格的精美版式供您挑选。这极大地简化

热心网友

05.19

超办AI平台：集成主流大模型的一站式解决方案

在追求高效办公的今天，各类AI工具不断涌现，但能够真正实现“一站式”智能集成的平台却屈指可数。本文将深入介绍的“超办AI”，正是这样一个致力于将多种AI能力深度融合，直接赋能日常工作效率的集成化平台。超办AI是什么？一站式AI办公平台详解简而言之，超办AI是一个智能办公解决方案平台。其核心理念非

热心网友

05.19

论文关键词如何激发学术灵感与创新思路

学术灵感：AI驱动的中文论文写作辅助工具全解析在科研写作过程中，从选题构思到初稿完成，研究者往往需要投入大量时间与精力。是否存在一种高效工具，能够在研究起点——即灵感激发与论文框架构建阶段——提供实质性帮助？本文将深入探讨的“学术灵感”平台，正是这样一款专注于中文论文写作场景的AI智能助手，旨在提

热心网友

05.19

造物云AI在线3D营销设计平台：一站式创意解决方案

在视觉营销主导的数字化时代，一个名为“造物云”的在线3D营销设计平台正在重塑内容生产的规则。它本质上是一个基于浏览器的云端设计工具，其核心价值在于，让用户无需依赖复杂的专业软件或高昂的硬件，就能独立创作出具有商业摄影品质的3D渲染图片和动态视频。这为品牌营销、电商展示和社交媒体内容创作开辟了高效的新

热心网友

05.19

万相2.6系列模型发布：支持角色扮演与多镜头生成功能

相关攻略

热门专题

最新APP

热门推荐