首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
千人千面,告别AI标准脸,阿里发布Wan2.7-Image

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

热心网友
41
转载
2026-04-17

告别“标准脸”与“色彩盲盒”:阿里Wan2.7-Image如何重塑AI生图体验

4月1日,阿里巴巴正式发布了图像生成与编辑统一模型Wan2.7-Image。这款新模型直指当前AI生图领域的两大核心痛点——千篇一律的“标准脸”审美疲劳和难以预测的“色彩盲盒”效应。它带来的,是真正意义上的“千人千面”生成能力,能捏出富有“活人感”的形象,并通过全新的“调色盘”功能,实现了对色彩的精准控制。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

从功能上看,Wan2.7-Image覆盖了文生图、图生组图、图像指令编辑和交互式编辑等全链路创作能力。更值得一提的是,在人类偏好盲测中,其“文生图”能力已经超越了GPT-Image1.5及国内主流模型。尤其在文本渲染、照片级真实感和世界知识表现等关键指标上,已接近Nano Banana Pro的水平。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

图说:Wan2.7-Image的人类偏好盲测评分位列国内第一。

捏出“活人感”:从骨相到眼眸的全面定制

为了彻底告别那些似曾相识的“AI脸”,Wan2.7-Image在虚拟形象捏脸功能上做了深度强化。它支持从骨相轮廓、眼眸神态到五官细微处的全方位定制。用户只需在提示词中调整脸型(比如鹅蛋脸、圆脸、方脸等)或眼部特征(如杏仁眼、深邃眼窝、丹凤眼等),就能轻松实现“千人千面”的生成效果。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

告别“色彩盲盒”:专业级调色盘来了

对于艺术家、设计师和商业海报制作而言,精准的颜色控制是刚需。但以往的AI生图,色彩输出往往像个“盲盒”,结果难以预料。Wan2.7-Image这次带来了全新的“调色盘”功能,堪称色彩控的福音。用户可以通过HexCode色值,一键提取或直接输入参考图中的各种颜色及其占比。无论是马蒂斯画作中浓郁的红色系、梵高笔下的明媚黄色系,还是毕加索时期的清冷蓝色系,都能作为参考,生成同色系的图片。你甚至可以自由调控画面中颜色的数量和占比,真正实现配色方案的自定义。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

印刷级文字渲染:超长文本不再“糊”

超长文字的渲染一直是AI生图的难点,容易出现文字模糊、内容错乱甚至直接缺失的问题。Wan2.7-Image凭借其长上下文文本编码器,能够有效解析超长序列。这使得它对超长文字段落、复杂表格乃至数学公式的渲染,都能达到印刷级精度。模型支持12种语言,最高可处理3K tokens的超长文本输入,足以直接输出一整页A4纸篇幅的论文内容。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

高效组图生成与精准交互编辑

除了单图生成,Wan2.7-Image还具备强大的组图生成能力,可一次性生成多达12张风格一致的图片。这个功能对于需要批量制作同风格系列图、PPT配图、分镜脚本、电商模特套图或多视角建筑图的工作流来说,效率提升是显而易见的。

如果说生图能力是创作的基石,那么编辑功能则赋予了创作者最终的掌控力。Wan2.7-Image原生支持的交互式编辑模块,真正做到了“哪里不爽点哪里”。用户可以通过精准框选,在指定区域内添加、对齐、移动元素或Logo,实现像素级的意图对齐,让修改变得直观而高效。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

多主体一致性与丰富实用功能

在处理复杂场景时,Wan2.7-Image的多主体一致性功能最高支持输入9张图片作为参考源。无论是制作合影、电影海报,还是设计家具组合图,都能确保风格与特征的高度统一。此外,其他常用的图像编辑能力,如镜头视角控制、光影处理、材质参考、照片修复、虚拟试衣等数十种实用功能,在Wan2.7-Image上也能够更稳定地输出,让用户彻底告别“抽卡”式的不确定创作体验。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

技术突破:从“像素拟合”到“语义认知”

Wan2.7-Image不仅“会画”,更“懂画”。其更强的理解能力,源于模型架构与训练过程中的多项技术突破。

在训练数据层面,超大规模的异构数据底座不仅涵盖了全域品类的视觉素材,还整合了理解类数据。在模型架构上,它采用了领先的生成与理解统一架构,通过共享隐空间来实现语义映射,让文字与画面的对应关系更直接,模型无需费力“猜测”。更重要的是,在训练流程中引入多模态指令(如文字+图片),使得模型实现了从单纯的“像素拟合”到“底层语义认知”的关键飞跃。

此外,在数据工程维度,团队根据图像的布局、文字、光影、拍摄角度和用途等,构建了多维精细标注体系。配合先进的分阶段训练策略与多任务优化,模型即使在长尾场景下也能保持极高的生成稳健度。基于更大规模数据及尺寸训练而成的Wan2.7-Image-Pro也已同步上线,其在图像构图稳定性和语义理解精准度上表现更为出色。

赋能千行百业:从影视创作到电商营销

Wan2.7-Image的强大功能拥有广泛的应用前景。对于短剧与影视团队,其千人千面的捏脸系统与分镜生成能力,可以低成本完成角色设定、动作模仿与特效预览。自媒体与内容创作者则可以轻松生成多种风格的封面图、穿搭展示图。在电商领域,仅凭一张模特图,就能裂变生成特写图、不同场景的卖点图,从而大幅降低拍摄成本。教育和科研从业者也能直接调用模型,快速生成论文配图、信息图表乃至儿童绘本。值得一提的是,针对时下热门的“龙虾热”,Wan2.7-Image现已支持skill调用,让“龙虾画画”成为可能,全面解锁了生成式模型的应用想象力。

目前,用户已可通过https://tongyi.aliyun.com/wan/、wan.video 以及阿里云百炼平台体验Wan2.7-Image,千问App也即将完成接入。

(公众号:)

来源:https://www.leiphone.com/category/industrynews/LoaWIsiReImVC66N.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

安币充币地址使用前必查:到账确认、测试转账与Memo标签详解
web3.0
安币充币地址使用前必查:到账确认、测试转账与Memo标签详解

安币充币地址直接复制使用是基础操作,但需注意网络匹配、地址格式正确性及到账确认时间。不同币种网络选择错误可能导致资产丢失。大额转账前建议先小额测试,并留意部分币种所需的Memo标签,确保信息完整无误。

热心网友
05.10
币安新手必看:10个最常用买币入口快速上手指南
web3.0
币安新手必看:10个最常用买币入口快速上手指南

对于刚接触币安的新用户,面对众多功能按钮难免感到困惑。本文聚焦于最核心的买币需求,梳理出十个最常用且关键的页面入口,包括快捷买币、现货交易、资金划转、订单查询及资产总览等。掌握这些入口,用户便能高效完成从法币兑换到数字货币买卖、资产管理的基础操作,快速上手平台核心功能。

热心网友
05.10
币安App下载安装全攻略 清理缓存与权限设置详解
web3.0
币安App下载安装全攻略 清理缓存与权限设置详解

本文详细介绍了在不同系统版本下安全下载必安App的几种可靠方法,包括通过官方应用商店、官网直接下载以及使用第三方可信平台。重点强调了下载前清理旧缓存和浏览器数据的重要性,并提供了具体的操作步骤。同时,文章也解释了如何正确授予浏览器下载权限,确保安装过程顺畅,避免因权限问题导致下载失败或安装包损坏。

热心网友
05.10
索尼新专利一键剪辑功能让视频制作更轻松高效
游戏评测
索尼新专利一键剪辑功能让视频制作更轻松高效

索尼近期披露了一项于2023年提交的专利申请,揭示了PlayStation平台一项极具前瞻性的技术探索:通过人工智能为玩家自动创建专属的“游戏精彩时刻集锦”。 根据专利文档说明,该AI系统将全程监测玩家的游戏进程,实时分析画面内容与操作数据,智能识别出那些值得珍藏的瞬间——例如一场酣畅淋漓的Boss

热心网友
05.10
科博会观察AR产品如何通过会展场景实现产业落地
科技数码
科博会观察AR产品如何通过会展场景实现产业落地

北京科博会上,亮亮视野展示了AR眼镜在会展导览、实时翻译等场景的应用。企业指出,会展是AR技术从实验室走向产业落地的关键试炼场,能通过密集客流检验产品性能,推动迭代升级。未来,AR眼镜有望助力会展向智能交互平台演进,提升信息获取与跨语言交流效率。

热心网友
05.10