阿里万相2.6上线,国内首推角色扮演功能
12月16日消息,阿里发布新一代万相2.6系列模型。该模型面向专业影视制作与图像创作场景进行了全面升级。全新的万相2.6是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。万相2.6已同步上线阿里云百炼、万相正式版。

附最新介绍如下:
万相2.6视频生成升级亮点
角色扮演
万物皆可入戏。万相2.6能参考输入视频中的角色外观和音色,实现角色扮演,按照提示词生成单人、多人、人与物合拍的视频。
多镜头叙事
万相2.6可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性。
自然音画同步
多人对话场景稳定生成,真实自然的人声表达,声音质感提升,更好听的音乐和歌曲生成。
15s长视频生成
生成视频最长15秒(参考生视频10秒),提升画面时空内容容量,支持更完整叙事。
音频驱动生成
万相2.6可根据用户输入的文本和音频,驱动生成视频,并实现多镜头演绎。
万相2.6文生图升级亮点
艺术风格的高度美学与可控性
精准捕捉艺术灵魂:对各类风格关键词理解深入,还原度更高,画面整体风格统一且完整。
风格融合自然流畅:支持多种艺术风格有机融合,过渡平滑,创作出独具一格的视觉作品。
细节刻画生动丰富:对“肌理、色彩、笔触”等细节的呈现更为到位,赋予图像故事感与表现力。
真人像质感,光影细节到位
在写实人像生成中,人物神态自然、肤质真实,有效削弱“AI感”。模型综合优化构图与光影,呈现更具表现力的人像视角。
文字生成,图表、插画与海报设计
可依据中英文长文本内容,结合美学设计与图文协调性,精准生成海报、图文说明、信息图表等,实现内容与视觉的高度统一。
万相2.6图像生成升级亮点
图文混排输出
多张图片和文字一体化生成,具备逻辑推理能力,实现有层次、有逻辑的可视化叙事。
多图融合生成
多张图片的任意参考、组合或替换,融合多重视觉灵感,生成全新创意图像。
商用级一致性保持
保持角色、风格或元素的高度一致,拓展商业级使用场景。
美学要素迁移
提取参考图的颜色、风格、构图等创意灵感,实现美学参考生成。
镜头和光影精准控制
可指定镜头视角、近远景及光影细节,实现对画面空间与氛围的精确调控。
热门专题
热门推荐
在文档数字化与智能处理领域,一款高效精准的在线工具能极大提升工作效率。今天重点评测的TextIn Tools,正是这样一个集OCR识别、格式转换于一体的全能型免费平台。它由上海合合信息科技开发,该公司在人工智能文字识别领域拥有超过17年的技术积累,实力深厚。我们熟悉的“扫描全能王”、“名片全能王”等
还在为制作PPT而烦恼吗?排版耗时、素材难寻、风格杂乱……这些常见困扰,或许一个智能工具就能高效化解。 WPS智能PPT,是一款基于先进人工智能技术的在线演示文稿辅助平台。其核心优势在于:用户仅需输入文本内容,内置的AI引擎便能自动进行视觉设计与美化,快速生成多种风格的精美版式供您挑选。这极大地简化
在追求高效办公的今天,各类AI工具不断涌现,但能够真正实现“一站式”智能集成的平台却屈指可数。本文将深入介绍的“超办AI”,正是这样一个致力于将多种AI能力深度融合,直接赋能日常工作效率的集成化平台。 超办AI是什么?一站式AI办公平台详解 简而言之,超办AI是一个智能办公解决方案平台。其核心理念非
学术灵感:AI驱动的中文论文写作辅助工具全解析 在科研写作过程中,从选题构思到初稿完成,研究者往往需要投入大量时间与精力。是否存在一种高效工具,能够在研究起点——即灵感激发与论文框架构建阶段——提供实质性帮助?本文将深入探讨的“学术灵感”平台,正是这样一款专注于中文论文写作场景的AI智能助手,旨在提
在视觉营销主导的数字化时代,一个名为“造物云”的在线3D营销设计平台正在重塑内容生产的规则。它本质上是一个基于浏览器的云端设计工具,其核心价值在于,让用户无需依赖复杂的专业软件或高昂的硬件,就能独立创作出具有商业摄影品质的3D渲染图片和动态视频。这为品牌营销、电商展示和社交媒体内容创作开辟了高效的新





