首页 游戏 软件 资讯 排行榜 专题
首页
AI
腾讯混元AI放出“终极P图神器”,网友疯狂体验

腾讯混元AI放出“终极P图神器”,网友疯狂体验

热心网友
61
转载
2026-01-28


智东西
作者 王涵
编辑 云鹏

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智东西1月28日报道,今天,腾讯混元图像3.0图生图版本正式开源。在最新的LMArena图片编辑榜单上,腾讯混元图像3.0图生图位列全球第七,也是前七名里面唯一开源的模型。


▲LMArena图片编辑榜单(来源:LMArena)

LMArena最新X祝贺混元图像3.0图生图“在图片编辑榜单中与Nano-Banana和Seedream-4.5等表现相当”。


▲LMArena最新祝贺推文(来源:X)

混元图像3.0图生图支持增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑功能,还可以将多张照片中的元素提取出来合成新图片。

1月26日,该模型在元宝上线,已经被网友玩出“花”了:


智东西也第一时间上手体验,发现该模型可以保持前后素材元素风格的一致性,对照片细节把握准确,思考响应速度也较快,可玩性确实很高。


▲混元图像3.0图生图开源页面(来源:Hugging Face)

开源地址:

Github:

https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Hugging Face:

https://huggingface.co/tencent/HunyuanImage-3.0-Instruct

Hugging Face(蒸馏版):

https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil

一、融合理解、推理与生成:混元图像3.0图生图“先思考后编辑”

据最新介绍,混元图像3.0图生图采用混合专家原生多模态架构,总参数规模达80B,激活参数约13B。

训练过程中,混元团队构建了千万量级的图生图数据,覆盖80多个任务,并注入了思维链数据,使模型能够学会先分析用户图像和意图,再输出详细编辑指令。

后训练阶段则采用自研MixGRPO算法,对齐用户偏好,大幅提升了指令响应和非编辑区域保持一致的效果。


▲混元图像3.0图生图架构

在多模态方面,混元图像3.0图生图版本基于混元图像3.0的原生多模态架构构建,将文本理解、视觉理解与图像生成融合于同一模型中。

作为原生多模态模型,混元图像3.0图生图核心创新在于其“先思考,后编辑”的工作流程。

当接收到用户输入的图片和提示词后,模型会首先理解图像内容,然后基于提示词进行推理,确定需要编辑的区域、详细步骤以及需要保留的区域,最终形成更加详细的编辑指令。


▲混元图像3.0图生图思考过程

混元图像3.0图生图支持增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑功能,还可以将多张照片中的元素提取出来合成新图片。

对于普通用户,该模型可用于制作表情包、虚拟人物合拍、社交分享等日常场景。对于专业用户,它能够助力电商海报设计、游戏角色定制、创意图片制作等专业领域,提升创作效率。

二、体验混元图像3.0图生图:一句话快速P图、一键实现产品实穿效果

1月26日,混元图像3.0图生图版已经上线元宝,可以在元宝中直接对话使用。

智东西第一时间上手体验,发现该模型可以保持前后素材元素风格的一致性,对照片细节把握准确,思考响应速度也较快。

例如,我们上传一张《蒙娜丽莎的微笑》的图片和一只小猫的照片,让元宝把这只小猫P到蒙娜丽莎的怀里:


不到一分钟,元宝就完成了P图,P后的图片中的小猫元素和蒙娜丽莎与原图保持一致,且手臂部分的前后透视关系也十分准确。

我们还可以让元宝给我们换一套妆造,替我们去颐和园滑冰:


可以看到,仅凭借“颐和园”三个字,该模型就准确地生成了颐和园的佛香阁作为背景。冰面的裂纹和在冰上滑冰的人群都十分逼真。

此外,在电商领域,用户还可以直接用豆包生成产品图。该模型可以参考指定风格,快速生成所需的电商海报,且可以自由更换海报背景:


用户还能直接将产品合成到模特身上,生成自然真实的产品上身效果图,能够大幅减少电商设计的工作量:


结语:腾讯混元开源家族再壮大,“视觉生成时代”加速到来

据腾讯混元最新分享,截止目前,腾讯混元的图像、视频衍生模型数量总数达到3000个,视频模型社区下载量超过500万,混元3D系列模型社区下载量超过300万。

混元图像3.0图生图模型的开源,在壮大了腾讯开源家族的同时,也为全球开发者社区提供了一个图像生成的新选择,或许将加速AI图像编辑向更广泛日常应用的落地。

一个功能更全面、创作更便捷、人人可参与的视觉生成时代正在加速到来。

来源:https://www.163.com/dy/article/KKCRITU3051180F7.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯汤道生:混元3.0发布引领AI应用向智能体模式迁移
科技数码
腾讯汤道生:混元3.0发布引领AI应用向智能体模式迁移

3月27日,2026腾讯云城市峰会首站落地上海。现场,腾讯云发布了Agent产品全景图,已推出面向个人、企业和开发者的多款Agent产品,并宣布即将发布混元3 0。值得一提的是,腾讯集团高级执行副总

热心网友
03.28
DeepSeek-V4与姚顺雨大模型联袂发布,下月震撼登场
AI
DeepSeek-V4与姚顺雨大模型联袂发布,下月震撼登场

新智元报道编辑:艾伦【新智元导读】3 月 12 日,据《白鲸实验室》独家爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026 年 4 月)发布。3 月 11 日,O

热心网友
03.15
腾讯混元强化学习框架详解:如何精调世界模型
科技数码
腾讯混元强化学习框架详解:如何精调世界模型

新京报贝壳财经讯(记者韦英姿)3月10日,腾讯混元3D团队宣布开源业界首个面向世界模型的强化学习后训练框架WorldCompass。腾讯混元3D团队表示,这是此前发布的混元世界模型1 5 最新强化学

热心网友
03.10
腾讯云在德国法兰克福新增可用区,混元3D正式落地欧洲
科技数码
腾讯云在德国法兰克福新增可用区,混元3D正式落地欧洲

3月3日,澎湃新闻记者获悉,2026世界移动通信大会(MWC)期间,腾讯云宣布将在德国法兰克福新增一个云可用区。随着腾讯混元3D大模型和腾讯云音视频、刷掌(掌纹识别)等技术在海外的加速应用,此举也将

热心网友
03.03
腾讯云一站式AI漫画解决方案:双引擎驱动AIGC创作提效
业界动态
腾讯云一站式AI漫画解决方案:双引擎驱动AIGC创作提效

随着2025年“漫剧”市场迎来史诗级爆发,内容消费需求呈指数级增长。近日,腾讯云联合DataEyeL!NK在深圳南山举办AI漫剧生态交流会,并推出一站式AI漫剧解决方案。该方案深度融合了腾讯云领先的

热心网友
02.10

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02