游乐游手机版
首页/AI热点日报/热点详情

腾讯混元文生图开源模型上线三款ControlNet精准控图插件

类型:热点整理2026-07-05
腾讯混元文生图大模型(HunyuanDiT)近日再次迎来重要更新——与社区协作一次性推出了三款全新的ControlNet插件,涵盖tile(高清放大)、inpainting(图像修复与扩充)以及lineart(线稿生图)功能。这一系列新工具的发布,进一步补全了混元DiT在ControlNet生态上的

腾讯混元文生图大模型(HunyuanDiT)近日再次迎来重要更新——与社区协作一次性推出了三款全新的ControlNet插件,涵盖tile(高清放大)、inpainting(图像修复与扩充)以及lineart(线稿生图)功能。这一系列新工具的发布,进一步补全了混元DiT在ControlNet生态上的关键短板。换言之,从美术创意到建筑设计,从商业摄影到美妆电商,当前这套方案几乎能够覆盖超过80%的实际应用场景。对于开发者和内容创作者而言,这意味着更精准的图像生成控制能力,以及更为灵活的创作自由度。

接下来逐一介绍这三款插件的实际能力。Tile插件专注于画面信息扩充,可实现超清放大——直接输出4K乃至8K级别清晰度,特别适用于对画质细节要求极高的场景,例如高精度印刷或大尺寸展示。Inpainting插件则扮演智能橡皮擦与填充器的角色,能够依据用户需求填充图片中被涂抹或受损的区域,支持换背景、替换主体人物,甚至处理大面积重绘任务,生成效果相当自然。而Lineart插件能够利用多种类型的线条生成真人、动漫或建筑图像,在建筑效果图生成和手稿上色等应用场景中尤为实用,设计师可直接将线稿与模型结合,产出完整画面。

可精准控图!腾讯混元文生图开源模型上线三款ControlNet插件

实际上,在此之前混元DiT已发布了基于canny(边缘)、depth(深度)、pose(人体姿势)等条件的ControlNet模型,并开放了推理使用权限,甚至将ControlNet的训练方案也一并开源。这意味着开发者不仅可以直接使用现成的插件,还能根据自身需求训练定制化的ControlNet模型——灵活性达到了全新高度。

再来回顾混元DiT的版本迭代历程。今年5月,该模型宣布全面升级并正式开源,成为业界首个中文原生的DiT架构文生图开源模型。随后,其开发者生态持续完善,专属加速库发布后推理效率显著提升,生图耗时大幅缩短,推理代码也相继开源。到了7月,混元DiT升级至1.2版本,专门开源了小显存版本,仅需6GB显存即可运行,极大降低了个人电脑本地化部署的门槛。

截至目前,混元DiT在GitHub上的Star数已突破3.1k,成为最受欢迎的国产DiT开源模型。这一成绩的背后,是持续的开源动作与不断强化的控制能力。从底层模型到上层插件,从训练方案到推理加速,整套生态正在快速成型。

对于需要精准控图的团队和个人而言,这套工具链的实际价值十分可观——无需再在高清细节与快速出图之间反复权衡,也不必为控制力不足而担忧。一句话总结:开源、可控、低门槛,这条路走得相当稳健。

来源:https://www.1ai.net/18104.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。