首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
告别千人一面:阿里Wan2.7图像模型如何破解AI标准脸

告别千人一面:阿里Wan2.7图像模型如何破解AI标准脸

热心网友
93
转载
2026-04-01

4月1日,阿里巴巴发布图像生成与编辑统一模型Wan2.7-Image。直击当前 AI 生图领域“标准脸”审美疲劳和“色彩盲盒”等痛点,该模型可实现“千人千面”,捏出“活人感”,全新的“调色盘”功能可精准控制色彩。

Wan2.7-Image具备文生图、图生组图、图像指令编辑和交互式编辑等全链路能力。在人类偏好盲测中,“文生图”能力超过GPT-Image1.5和国内主流模型,在文本渲染、照片级成像和世界知识指标上,接近Nano Banana Pro。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

图说:Wan2.7-Image的人类偏好盲测评分位列国内第一。

为告别千篇一律的“AI脸”,Wan2.7-Image强化了虚拟形象捏脸功能,支持从骨相、眼眸到五官细微处的全方位定制,比如更换提示词中的脸型(鹅蛋脸、圆脸、方脸、长方脸等)、眼部特征(杏仁眼、深邃眼窝、圆眼、丹凤眼等),实现“千人千面”。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

艺术家和设计师需精准控制颜色,商业海报对配色还有严格要求,但AI生图往往是“色彩盲盒”。Wan2.7-Image全新支持“调色盘”功能,用户可通过HexCode,一键提取或输入参考图的各种颜色和占比,从马蒂斯浓郁的红色系、梵高明媚的黄色系,到毕加索清冷的蓝色系,都能参考生成同色系的图片,并可自由调控颜色的数量和占比,自定义配色方案。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

超长文字渲染是AI生图的痛点,容易文字模糊、内容错乱甚至直接漏写。凭借长上下文文本编码(Long Context Text Encoder)解析超长序列,Wan2.7-Image对超长文字、表格和复杂公式的渲染可达印刷级,支持12种语言,最高3K tokens的超长文字输入,可输出一页A4纸的论文。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

此外,Wan2.7-Image还具备强大的组图生成能力,可生成多达12张,用于批量制作同风格系列图、PPT配图、分镜脚本、电商模特套图及多视角建筑图。

如果说生图能力是创作的基石,那么编辑功能则赋予了创作者掌控力。Wan2.7-Image原生支持交互式编辑模块,更懂创作者的需求——“哪里不爽点哪里”,用户可通过精准框,在指定区域元素添加、对齐、移动元素或logo,实现像素级意图对齐。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

Wan2.7-Image的多主体一致性最高支持输入9张图片作为参考源。对于合影、电影海报及家具组合图等,可保持风格与特征的统一。其他常用的图像编辑能力,如镜头视角控制、光影处理、材质参考、照片修复、虚拟试衣等数十种实用功能,Wan2.7-Image也能更稳定地输出,告别“抽卡”式创作。

千人千面,告别AI标准脸,阿里发布Wan2.7-Image

不只会生图,还更懂图,Wan2.7-Image更强的理解能力源于模型架构与训练过程中的技术突破。

在训练数据上,超大规模的异构数据底座不仅涵盖全域品类的视觉素材,还整合了理解类数据;在模型架构上,模型采用了领先的生成与理解统一模型架构,共享隐空间(Latent Space)来实现语义映射,文字紧挨着画面,模型不需费力去猜文字对应的画面;在训练流程中引入多模态指令(比如文字+图片),使得模型实现了从单纯“像素拟合”到“底层语义认知”的飞跃。

此外,在数据工程维度,根据图像的布局、文字、光影、拍摄角度和用途等,模型团队构建了多维精细标注体系。配合先进的分阶段训练策略与多任务优化,模型在长尾场景下仍然保持了极高的生成稳健度。基于更大规模数据及尺寸训练而成的Wan2.7-Image-Pro也同步上线,生成图像的构图更加稳定,语义理解更强更精准。

Wan2.7-Image的强大功能可应用于多个行业。对于短剧与影视团队,借助千人千面的捏脸系统与分镜生成能力,可低成本完成角色设定、动作模仿与特效预览;对于自媒体与内容创作者,可轻松生成多风格封面、OOTD穿搭;在电商领域,只需单张模特图,即可裂变生成特写图、不同场景的卖点图,大幅降低拍摄成本;教育和科研从业者可直接调用模型生成论文配图、信息图表与儿童绘本。对于时下大火的“龙虾热”,Wan2.7-Image 现已支持skill调用,让龙虾画画,全面解锁生成模型的应用场景。

即日起,用户可在https://tongyi.aliyun.com/wan/、wan.video 和阿里云百炼体验Wan2.7-Image,千问App也即将接入。

(公众号:)

来源:https://www.leiphone.com/category/industrynews/LoaWIsiReImVC66N.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

商汤大装置稳居中国MaaS市场第一梯队持续领跑
AI资讯
商汤大装置稳居中国MaaS市场第一梯队持续领跑

IDC报告显示,商汤“万象”平台以11 3%份额位居中国大模型私有化市场第二。平台通过一站式模型服务、全生命周期专家支持及低代码工具链,满足企业安全、性能与成本需求,推动AI在政务、交通、能源等行业落地,降低技术门槛,加速价值实现。

热心网友
05.20
实用AI工具盘点与选择指南提升工作效率
AI教程
实用AI工具盘点与选择指南提升工作效率

市场上有多种高效AI工具可供选择。WPSAI能智能处理文档,Grammarly辅助写作纠错,AIPPT工具快速生成演示文稿,ChatGPT进行对话与创作,DeepL提供精准翻译。CanvaAI助力设计,GitHubCopilot和TabNine提升编程效率,AI去背工具简化图像编辑。这些工具覆盖写作、设计、编程等场景,能显著提升工作效率。

热心网友
05.20
对话Bitget AI负责人:AI交易如何无限逼近满分却难达完美
AI资讯
对话Bitget AI负责人:AI交易如何无限逼近满分却难达完美

BitgetAI负责人Bill博士指出,AI在交易平台中已能高效整合信息、辅助决策,提升效率。当前产品注重个性化建议与安全易用的交互,如通过Telegram提供自然对话辅助。AI虽无法完全替代顶尖交易员,但其价值在于赋能用户、优化流程。未来竞争关键将在于安全体系、成本控制及持续学习用户习惯的能力。

热心网友
05.20
2026年热门AI软件工具精选与推荐指南
AI教程
2026年热门AI软件工具精选与推荐指南

2024年,AI工具正深度融入工作流程,提升效率与创意。WPSAI集成于办公软件,助力文档创作与优化;ChatGPT作为多功能对话模型,辅助编程与文案;GoogleBard擅长信息整合与自然对话;BoardMix结合白板与AI,可生成思维导图等可视化内容;NewBing融合搜索与对话,兼具创意与可信来源;NotionAI能自动处理会议纪要等文本任务;Gram

热心网友
05.20
代币化美股热度飙升 加密券商能否颠覆传统金融格局
web3.0
代币化美股热度飙升 加密券商能否颠覆传统金融格局

代币化美股热度上升,投资者可通过区块链交易相关资产,挑战传统券商模式。其优势包括降低门槛、提升流动性和全天候交易,但也面临监管不明确等风险。未来能否颠覆传统金融,取决于技术发展与合规进程。

热心网友
05.20