来源:科技日报
科技日报记者 崔爽
2月10日,阿里巴巴正式推出新一代图像生成与编辑模型Qwen-Image-2.0。
据介绍,作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中获得1029分,超越了Seedream4.5、Flux2-Max等模型。该模型支持1K以上词元的超长文字输入和2K高分辨率,能够精确渲染复杂的指令,生成专业的PPT及信息图;同时,它具备出色的中文汉字渲染能力,即便是数百字的古文,也能近乎完整地呈现在图片中。

值得一提的是,Qwen-Image-2.0首次将图像生成和编辑功能统一到一个模型中,借助更轻量的模型架构,大幅提升了生图和改图的能力。
在中文汉字渲染方面,Qwen-Image-2.0表现尤为突出,不仅能够以多种字体精准呈现汉字,而且书写效果丰富且准确。新模型将输入提示词扩展到1K以上词元,可详尽描述任务需求,实现更专业的文字渲染,生成专业PPT、高级海报、多格漫画等复杂图片。例如,可以近乎完美地以小楷字体渲染《兰亭集序》数百字的全文配图,也能根据自然语言描述生成带有论文格式配图的复杂PPT等。

基于Qwen-Image-2.0模型,用户可与AI协同创作出更丰富实用的图片,例如一句话生成宫保鸡丁的做**程图等。用户也可以上传数张图片进行编辑,生成诸如九宫格多手势自拍、双人AI合影等创意图像。
据了解,阿里云百炼平台现已开通API邀测,开发者也可以通过Qwen Chat免费体验这一新模型。
(Qwen-Image-2.0生图效果展示)
