首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
通义千问Qwen-Image-Edit开源上线:精准提升角色一致性

通义千问Qwen-Image-Edit开源上线:精准提升角色一致性

热心网友
93
转载
2025-12-25

12月25日,IT之家报道称,通义千问团队在12月23日正式推出了全新的图像编辑模型Qwen-Image-Edit-2511。该版本在上一代Qwen-Image-Edit-2509的基础上,针对图像漂移问题进行了优化,提升了人物角色的一致性,集成了LoRA微调能力,增强了工业设计内容的生成效果,并进一步强化了几何推理能力。

作为通义家族在视觉生成领域的最新力作,该模型专门为“图像编辑”场景进行了深度优化。它不像传统的文生图模型那样侧重创造全新画面,而是致力于解决一个行业难题:如何在保持图片主体结构不变的前提下,对画面中的指定区域进行精准修改。这一特性为开发者和设计师提供了一个效率更高的AI辅助工具。

Qwen-Image-Edit-2511最引人注目的亮点在于其强大的指令遵循能力。用户无需掌握复杂的Photoshop图层技术,也不必手动绘制选区,只要输入类似“把照片里的猫换成狗”或“移除背景中的路人”这样的自然语言指令,模型就能自动理解意图并完成编辑操作。

该模型通过深度融合视觉编码器与语言模型,能够精确识别图像中的语义对象,确保在修改目标物体的同时,最大限度地保留原图的光影、纹理及背景的整体一致性。

Qwen-Image-Edit-2511显著改善了人物编辑的一致性。在保留主体身份特征和视觉风格的前提下,能够基于输入的人像进行充满创意的编辑。以下是相关效果展示图片:

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

新模型在多人合影场景中的表现也得到了增强——它能将两张独立的人物图像高保真地融合为一张协调的群体合照:

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

Qwen-Image-Edit-2511将部分精选热门LoRA直接集成到基础模型中,无需额外微调即可开箱启用其效果。例如,在光照增强LoRA加持下,用户可以直接实现逼真的光照控制:

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

Qwen-Image-Edit-2511引入了更强大的几何推理能力。例如,模型可以直接为设计或标注目的生成辅助构造线:

修图AI模型Qwen-Image-Edit-2511开源上线:提升角色一致性

来源:https://tech.ifeng.com/c/8pNB6iNROdL
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

悟空编程率先接入国产大模型Qwen3.6 Plus
AI资讯
悟空编程率先接入国产大模型Qwen3.6 Plus

4月2日,阿里巴巴正式推出新一代大语言模型Qwen3 6-Plus,并宣布其企业级AI旗舰应用“悟空”率先完成接入。此次升级不仅是模型的迭代,更标志着AI在企业级应用场景中的核心能力实现了关键性跨越。 官方信息显示,Qwen3 6-Plus在代码生成、智能体协作、逻辑推理及原生多模态理解等核心维度均

热心网友
05.20
GitHub最受欢迎OCR项目PaddleOCR使用指南
AI资讯
GitHub最受欢迎OCR项目PaddleOCR使用指南

近日,开源技术圈迎来一项标志性进展:百度依托文心大模型打造的PaddleOCR项目,在GitHub上的Star数量突破73 3K,首次超越谷歌旗下长期占据领先地位的Tesseract OCR(73 2K)。这意味着,全球最受开发者欢迎的OCR开源项目正式易主,标志着大模型驱动的技术范式正在重塑行业格

热心网友
05.20
Cursor会倒闭吗分析其商业模式与未来前景
AI资讯
Cursor会倒闭吗分析其商业模式与未来前景

Cursor的命运,悬在两个速度之间:AI自主编码成熟的速度,和Cursor自我蜕变的速度。 这家公司正处在一个奇特的矛盾点上:它依然蒸蒸日上,却又似乎正在走向绝望。关于这家一度是“Vibe Coding”代名词的明星公司,市场同时存在着两种截然相反却又似乎都能成立的观点。 数据描绘的是一幅烈火烹油

热心网友
05.20
Claude周末复刻30年前经典游戏完整教程
AI资讯
Claude周末复刻30年前经典游戏完整教程

近日,Reddit上一则热帖引发了广泛关注。游戏开发商Beamable的首席执行官Jon Radoff,利用一个周末的时间,借助AI助手Claude,成功复活了自己19岁时开发的一款名为《未来往昔传奇》(Legends of Future Past)的MUD(多用户地下城)游戏。这款诞生于1992年

热心网友
05.20
Anthropic解封创始人账号 上周封禁OpenClaw系误会
AI资讯
Anthropic解封创始人账号 上周封禁OpenClaw系误会

上周,Anthropic刚宣布对OpenClaw采取限制措施,这周,事情就发展到了一个新阶段——连OpenClaw项目的核心人物Peter Steinberger的个人账户也遭到了封禁。这场风波究竟会如何演变? 今天一早,OpenClaw创始人Peter Steinberger在社交平台X上发文确认

热心网友
05.20

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

刑事案件电子数据取证密码获取程序拟明确
业界动态
刑事案件电子数据取证密码获取程序拟明确

公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。

热心网友
05.23
小鹏G9降价12万背后何小鹏的豪赌与挑战
业界动态
小鹏G9降价12万背后何小鹏的豪赌与挑战

理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小

热心网友
05.23
魏建军感谢于东来支援环塔拉力赛 红牛千箱胖东来厨师助阵
业界动态
魏建军感谢于东来支援环塔拉力赛 红牛千箱胖东来厨师助阵

5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给

热心网友
05.23
2026年比特币官方APP下载入口及官网安全访问指南
web3.0
2026年比特币官方APP下载入口及官网安全访问指南

比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”

热心网友
05.23
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解
AI资讯
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解

Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构

热心网友
05.23