2月10日,阿里巴巴正式推出新一代图像生成与编辑模型Qwen-Image-2.0。
作为千问大模型的图像生成底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中获得1029分,超越了Seedream4.5、Flux2-Max等模型,仅次于Nano Banana Pro与GPT Image1.5。
Qwen-Image-2.0支持长达1K token的文字输入和2K高分辨率,能够精准呈现复杂的指令,轻松生成专业的PPT图表与信息图,其质感足以媲美专业摄影师的作品;同时,千问新模型拥有极强中文汉字渲染能力,数百字的古代文献几乎都能完整地融入图片之中。

Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全面升级,首次将图像生成和编辑统一整合到一个模型之中,通过更轻量的模型架构,实现了生图与修图性能的大幅提升。
Qwen-Image-2.0的生图质感尤为细腻,从老人额头的皱纹,到浩瀚的宇宙星空,模型生成的人物、风景、建筑等常见图片都极其逼真。
在权威评测AI Arena中,千问新模型在图像生成环节获得1029分,位列第三;在图片编辑环节获得1034分,仅次于Nano Banana Pro。

在中文汉字渲染方面,Qwen-Image-2.0的表现极为突出,不仅能够以多种字体准确呈现汉字,而且书写工整规范,效果优于Nano Banana Pro。
千问新模型将输入提示词扩展至1K token,可以详尽描述任务要求,实现更专业的文字渲染,轻松驾驭专业PPT、高级海报、多格漫画等复杂图片,例如以小楷字体近乎完整地渲染《兰亭集序》数百字的全文配图,以及用自然语言生成论文格式配图的复杂PPT等。

基于Qwen-Image-2.0模型,用户可与AI协同创作出更丰富、更实用的图片,例如用一句话生成宫保鸡丁的做法流程图、杭州两日游攻略图、4x6的多格漫畫組合图、儿童绘本插图、写实风格的电影海报,以及极为逼真的绿色丛林场景等等;
同时,用户也可上传多张图片进行编辑,生成诸如九宫格多手势自拍、真人配字表情包、双人逼真AI合影、诗词配图等创意作品。

