首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里开源Qwen-Image-Layered图像生成模型,支持PS式分图层编辑

阿里开源Qwen-Image-Layered图像生成模型,支持PS式分图层编辑

热心网友
53
转载
2025-12-22

IT之家12月22日消息,今天下午,阿里巴巴正式开源了全新的图像生成模型 Qwen-Image-Layered。该模型首次在内部实现了媲美 Photoshop 级别的图层理解与图像生成能力。它采用自主研发的创新架构,能够将图片“拆解”成多个独立的图层,其操作逻辑类似于使用 Photoshop 进行分层作图与修图。据称,该技术能够实现近乎“零漂移”的 AI 图像精准编辑,从根本上解决了 AI 生图一致性差的业界难题,加速了大模型在专业设计领域的实际应用落地。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

给定一张图像,Qwen-Image-Layered 可将其分解为若干个 RGBA 图层:


分解完成后,所有的编辑操作将仅仅作用于目标图层,使其与其他内容在物理上相互隔离,从而从根本上确保了编辑后视觉效果的统一性。

它可以完成以下几类操作:

对首个图层进行重新着色,同时保证其余所有内容保持不变。


将第二个图层中的女孩形象替换为男孩。


将文字内容修改为“Qwen-Image”。


干净地删除画面中不需要的物体。


对物体进行缩放而不会引发形变或导致画面失真。


在画布范围内自由移动物体位置。


用户可以根据实际需求,将同一张图像分解为 3 层或 8 层等不同精细度的图层。


IT之家附上相关链接如下:

技术报告:https://arxiv.org/abs/2512.15603 Github:https://github.com/QwenLM/Qwen-Image-Layered ModelScope:https://www.modelscope.cn/models/Qwen/Qwen-Image-Layered Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Layered Demo:https://www.modelscope.cn/studios/Qwen/Qwen-Image-Layered

来源:https://www.163.com/dy/article/KHDB60FU0511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里Qwen团队开源大规模网页世界模型WebWorld系列
AI
阿里Qwen团队开源大规模网页世界模型WebWorld系列

在AI智能体(Agent)技术发展中,如何让模型像人类一样流畅地操作网页,一直是一个核心挑战。传统方法高度依赖与真实网页环境的直接交互,不仅成本高、效率低,还面临网络延迟、访问限制和安全风险等诸多问题。是否存在一种方案,能让AI在一个安全、可控且高效的“虚拟环境”中学习网页交互呢? 近期,阿里巴巴Q

热心网友
05.14
Qwen3.6辅助运维实战:Docker配置与K8s故障排查指南
AI
Qwen3.6辅助运维实战:Docker配置与K8s故障排查指南

在生产环境中部署Qwen3 6大模型以支持运维自动化、智能问答等场景时,常会遇到容器启动异常、服务不可用等问题。这些故障往往并非模型自身缺陷,而是由Docker资源配置不当、Kubernetes调度策略不匹配或vLLM推理引擎参数未优化所引发。本文将系统性地解析Qwen3 6在容器化部署中的典型问题

热心网友
05.14
HermesAgent多模态实测:截图识别与代码生成能力深度解析
AI
HermesAgent多模态实测:截图识别与代码生成能力深度解析

当HermesAgent处理截图生成代码时,关键在于优化多模态调用链路。具体方案包括:将图像请求定向至专用视觉模型以提升理解准确性;对截图进行预处理并加入结构化提示;通过MCP协议引入DOM树作为中间层,实现从截图到代码的可靠转换;最后建立视觉反馈闭环,比对结果以校验元素映射的准确性。

热心网友
05.13
阿里巴巴Qwen团队首创P-GenRM个性化大模型奖励机制
AI
阿里巴巴Qwen团队首创P-GenRM个性化大模型奖励机制

你是否曾感觉,与AI助手对话时,它似乎总在用一种“标准模式”回应你?有些人偏爱直击要点的答案,有些人则希望得到详尽展开;有人欣赏专业严谨的表述,有人则喜欢轻松幽默的交流。这种对个性化体验的渴求,一直是人工智能领域亟待突破的核心挑战之一。 传统的AI奖励机制,好比一把刻度的尺子,试图用统一的标准去丈量

热心网友
05.13
Qwen3-ASR语音识别系统发布:革命性技术让机器精准听懂人类语言
AI
Qwen3-ASR语音识别系统发布:革命性技术让机器精准听懂人类语言

这项由阿里巴巴通义实验室Qwen团队开展的研究,论文编号arXiv:2601 21337v1,堪称语音识别领域的一次重大突破。它就像给机器装上了一对超级敏锐的“耳朵”,不仅能准确听懂52种不同语言和方言,还能在嘈杂环境中精准识别人声,甚至连歌声都能完美转录成文字。 想象一下这样的场景:你在喧闹的咖啡

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领克GT概念跑车北京车展首发 百公里加速仅2秒
科技数码
领克GT概念跑车北京车展首发 百公里加速仅2秒

领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。

热心网友
05.14
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
科技数码
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售

微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4

热心网友
05.14
中芯国际一季度净利润13.61亿元 同比增长0.4%
科技数码
中芯国际一季度净利润13.61亿元 同比增长0.4%

中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。

热心网友
05.14
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
AI
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭

热心网友
05.14