2月10日,千问团队发布了新一代图像生成基础模型Qwen-Image-2.0。这一模型集成了文生图与图生图的融合能力,在文字渲染精准度、图像视觉质感以及深层语义理解等多个维度实现了显著优化。

据悉,Qwen-Image-2.0能够处理长达1k token的复杂指令输入,可生成包含专业PPT、设计海报、叙事漫画等多种类型的信息图。在画质方面,模型支持2K高分辨率输出,显著提升了人物肖像、自然风光、建筑场景等写实题材的细节表现力。此外,该模型还能实现“画中画”等复杂构图,并在各类图像编辑任务中,延续文生图阶段优异的文字渲染效果与整体质感。
根据近期在AI Arena平台进行的盲测数据显示,Qwen-Image-2.0在文生图与图生图的多项基准测试中,表现均优于同类模型。其中,在AI Arena的文生图评测中,它取得了1029分,位列全球第三。

而在图片编辑任务中,它以1034分的成绩,仅次于Nano Banana Pro。此次发布的模型结构更为轻量化,在保持高性能的同时,进一步提升了图像生成速度。

