阿里近期推出了专用于图片编辑的 AI 模型——Qwen-Image-Edit。作为 Qwen-Image 系列的全新版本,它聚焦于图片编辑场景,精准解决用户修图需求。实际体验下来,一句话总结:这就是 AI 版的 Photoshop,只要会打字就能轻松完成 P 图。
在深入细节前,先提炼几个核心亮点:
- 精准的语义编辑功能,能在保持原图一致性的前提下灵活修改元素
- 强大的文字处理能力,完美实现中文图文排版与内容调整
- 从宏观风格转换到微观细节调整的全方位修图能力,覆盖各类场景

最受瞩目的首个亮点:AI 精准修改、增加与删除元素,效果令人惊艳
让 AI 实现精准修图并非易事,但 Qwen 这一版本的表现异常出色,远超预期。
如上示例,用户只需输入简单指令,即可随意修改图片中的元素,且每次修改都能基于前一次结果进行,保持原有形象基本不变。例如输入“新增一顶草帽”或“将吊带换成白色 T 恤”,模型都能准确执行。
这类操作在不少修图工具中容易翻车——修改过程中人物形象往往彻底改变。而 Qwen 这一版本的表现,可以说是我试用过的 AI 修图工具中最稳定、最可靠的。
不过,尽管效果惊艳,一个常见问题依然存在:修出的图片容易显得过度“AI 化”,即磨皮过重,原图真实的皮肤质感常被削弱。好消息是,用户可以通过二次指令轻松补救。例如加入提示词“增加真实的皮肤质感”,皮肤细节就能大幅改善。当然,亮度调整方面目前还不够精准,但稍用修图软件微调一下,效果便非常理想。
这些操作背后,正是官方所说的“语义编辑”能力——在保持原始图像基本不变的前提下,对内容进行智能修改。更有趣的是,它甚至能让形象转换视角,几乎覆盖任意角度。比如输入“45度侧面照,抬头,右手放在帽顶上”,就能生成一幅全新构图。虽然仍略带“AI 痕迹”,但已非常接近自然效果。
角色形象统一方面,动物和卡通形象的处理轻松自如
人像处理固然是高难度任务,但换成动物或卡通形象,就变得轻而易举。一张图可以生成多个形象,且保持原始样貌基本统一——也就是我们常说的“表情包”制作。
例如输入“这只土拨鼠在怀里抱着一把吉他,手在拨动琴弦”,就能生成一张生动的表情包。官方还展示了更多案例,可以预见,这个功能将成为表情包创作的利器。
Qwen 这一版本的奇妙之处,在于它不仅能进行宏观修改——比如“改成吉卜力风格”,也能精细到移除一根头发,令人叹为观止。
最后一个亮点:几近完美的文字处理能力,真正让我刮目相看
前面提到的功能已足够强大,但文字处理这一项,才是让 AI 修图进入全新维度的关键突破。
众所周知,文字处理在 AI 图像生成与编辑领域一直是老大难问题。此前没有任何工具能完美解决。但 Qwen 这次几乎给出了满分答案。
我分别尝试了以下操作:在书本上添加文字、在图片右侧增加竖排文字、修改指定文字颜色。每一个命令都精准执行,毫无偏差。
更夸张的是,一句话就能生成一本杂志封面。例如输入“将这张图改成 VOGUE 杂志封面风格”,效果令人震惊——它不仅加上“VOGUE”封面字体,还对原始图像重新构图,甚至删除原有背景,换成更符合高级时尚杂志的纯色背景。它还似乎给人物重新补了妆?最神奇的是,人物形象基本保持不变。
这一刻,连设计师或许都要重新思考自己的职业定位了。
AI 生图、AI 修图已经屡见不鲜,国内外都有优秀产品。但能做到如此精准的控制,尤其是对中文文字的精准处理,这应该是目前第一个。
```