12月25日IT之家消息,阿里通义Qwen团队在12月23日上线推出全新图像编辑模型Qwen-Image-Edit-2511。该模型在Qwen-Image-Edit-2509的基础上,优化了多方面性能:减轻了图像在编辑时可能出现的整体漂移现象,提升了画面中人物特征与风格的一致性,集成了LoRA风格化能力,增强了针对工业设计场景的创意生成效果,并强化了对空间几何关系的推理能力。
作为通义家族在视觉生成领域的最新探索,此模型专门针对“图像编辑”场景进行了深度优化。与传统的文生图模型不同,它的核心目标是解决“在保持原图主体结构不变的前提下,对特定区域进行精准修改”这一实际应用难题,为开发者和设计师提供了一款更加高效的AI辅助工具。
Qwen-Image-Edit-2511的一大亮点在于其强大的指令遵循能力。用户无需掌握复杂的Photoshop图层技术,也不必手动绘制选区,只需输入“将画面中的猫换成狗”或“移除背景中的路人”这样的自然语言指令,模型即可自动理解意图并执行操作。
该模型通过深度融合视觉编码器与语言模型,能够精准识别图像中的语义对象,确保在修改目标物体的同时,最大程度地保留原图的光影、纹理与背景风格的一致性。
Qwen-Image-Edit-2511进一步改善了人物一致性表现,能在保留主体身份特征和视觉风格的前提下,基于输入的人像进行富有想象力的编辑。IT之家附上相关图片如下:




新模型还增强了多人合影场景下的一致性表现——能够将两张独立的人物图像高保真地融合为一张协调的群像照片:

Qwen-Image-Edit-2511将部分精选的热门LoRA风格直接集成到基础模型中,无需额外微调即可启用其效果。例如,在光照增强LoRA支持下,用户可以开箱即用地实现逼真的光照控制效果:

Qwen-Image-Edit-2511引入了更强的几何推理能力,例如,可以为设计或标注目的直接生成辅助构造线:

