阿里开源Qwen-Image-Layered图像生成模型,支持PS式分图层编辑
IT之家12月22日消息,今天下午,阿里巴巴正式开源了全新的图像生成模型 Qwen-Image-Layered。该模型首次在内部实现了媲美 Photoshop 级别的图层理解与图像生成能力。它采用自主研发的创新架构,能够将图片“拆解”成多个独立的图层,其操作逻辑类似于使用 Photoshop 进行分层作图与修图。据称,该技术能够实现近乎“零漂移”的 AI 图像精准编辑,从根本上解决了 AI 生图一致性差的业界难题,加速了大模型在专业设计领域的实际应用落地。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
给定一张图像,Qwen-Image-Layered 可将其分解为若干个 RGBA 图层:

分解完成后,所有的编辑操作将仅仅作用于目标图层,使其与其他内容在物理上相互隔离,从而从根本上确保了编辑后视觉效果的统一性。
它可以完成以下几类操作:
对首个图层进行重新着色,同时保证其余所有内容保持不变。

将第二个图层中的女孩形象替换为男孩。

将文字内容修改为“Qwen-Image”。

干净地删除画面中不需要的物体。

对物体进行缩放而不会引发形变或导致画面失真。

在画布范围内自由移动物体位置。

用户可以根据实际需求,将同一张图像分解为 3 层或 8 层等不同精细度的图层。

IT之家附上相关链接如下:
技术报告:https://arxiv.org/abs/2512.15603 Github:https://github.com/QwenLM/Qwen-Image-Layered ModelScope:https://www.modelscope.cn/models/Qwen/Qwen-Image-Layered Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Layered Demo:https://www.modelscope.cn/studios/Qwen/Qwen-Image-Layered
相关攻略
一、通过DashScope API直连企业后端服务 对于技术底子扎实、拥有成熟开发团队的企业来说,通过DashScope API直接对接,是最为灵活和高效的选择。这种方式相当于给你的ERP、CRM或OA系统装上一个“智能大脑”,无需改动用户界面,就能在后台悄无声息地完成工单分类、合同解析等复杂任务。
千问3 6系列新成员登场:轻量高效的Qwen3 6-35B-A3B模型正式开源 就在4月17日,AI开源社区迎来了一位引人注目的新成员。昨晚,千问3 6系列的中等尺寸模型——Qwen3 6-35B-A3B,正式宣布开源。 官方发布的信息显示,这款模型的设计思路相当巧妙。它虽然拥有35B的参数量,但实
应对限流的五类策略:从指数退避到熔断机制 遇到接口返回“429 Too Many Requests”或“Ratelimit reached”这类提示,意味着你的请求频率已经踩到了平台设定的红线。别慌,这通常不是服务的终点,而是优化调用策略的起点。下面这五类经过验证的策略,能帮你有效提升请求成功率和系
Hermes Agent 由美国知名开源 AI 研究实验室 Nous Research 开发,并非商业公司产品。该项目于 2026 年 2 月以 MIT 协议开源,不隶属于任何科技巨头,其设计理念强调与 Hermes 系列模型解耦,具备模型无关性。 在探索 AI Agent 技术时,若遇到“Herm
阿里 Qwen3 6-Plus 模型发布,编码智能体能力全面跃升 4月2日,阿里方面传来新消息:其最新的大模型Qwen3 6-Plus正式亮相,并已通过阿里云百炼平台开放API调用。与上一代相比,这次更新可不是小修小补,而是实现了一次全方位的“能力跃升”。 这次升级,可以说精准地切中了开发者的核心诉
热门专题
热门推荐
在数字货币快速发展的今天,如何选择一个靠谱的交易平台,往往是新手投资者迈出的第一步。面对市场上琳琅满目的交易所APP,从安全性、易用性到功能特色,究竟该怎么选?下面,我们就来梳理一下2026年主流的数字资产交易平台,帮你从多个维度看清它们的核心特点,无论是想尝试简单的现货买卖,还是计划涉足合约交易,
从音乐人到AI药物研发创业者:Aloe Blacc的跨界创业之路 近日,美国知名创作歌手Aloe Blacc做客TechCrunch旗下知名播客Equity,分享了他从音乐界成功跨界至AI驱动抗癌药物研发领域的独特经历。尤为引人关注的是,他创立的AI医药公司至今未进行任何外部融资。在访谈中,他深入阐
AI文生视频:从“猎奇玩具”到“生产力工具”的疾速进化 还记得几年前全网疯传的“威尔·史密斯吃意大利面”吗?那段画面扭曲、动作诡异的视频,一度成为AI文生视频技术稚嫩期的经典注脚——与其说是创作,不如说是一场数字世界的“恐怖谷”体验,离实际应用相距甚远。 然而,技术的演进速度总是超乎想象。过去一年,
百度开源文生图模型ERNIE-Image:消费级显卡畅享顶级文字生成效果 2024年4月15日,百度文心大模型团队正式宣布开源其参数规模达80亿的文生图模型ERNIE-Image。该模型最引人注目的优势在于,仅需24GB显存的消费级GPU即可实现高效部署与运行。同时,团队还发布了推理加速版本ERNI
欧亿交易所现货交易时间:如何理解其全球化设计逻辑? 在数字资产交易的世界里,交易时间的设定绝非小事。它直接关系到投资者的操作空间能否打开,以及整个市场的流动性是否充沛。作为行业内的头部平台,欧亿交易所(OYEX)在现货交易时间上的安排,可以说是一份深思熟虑的“全球时区解决方案”。它的设计,精准地瞄准





