LiblibAI使用LoRA模型进行图像生成训练从入门到精通_AI热点日报

LiblibAI使用LoRA模型进行图像生成训练从入门到精通

类型：热点整理2026-07-01

想在LiblibAI平台上成功训练出一个能稳定生成高质量图像的LoRA模型，其实并不神秘，但确实需要按照规范流程，踏踏实实地处理好素材、底模和参数这三个关键环节。任何一个步骤被跳过或疏忽，都可能导致loss崩溃，或者生成的画面出现颜色偏差，甚至完全不可用。首先来说素材准备。不少人一开始就随手塞进一

想在LiblibAI平台上成功训练出一个能稳定生成高质量图像的LoRA模型，其实并不神秘，但确实需要按照规范流程，踏踏实实地处理好素材、底模和参数这三个关键环节。任何一个步骤被跳过或疏忽，都可能导致loss崩溃，或者生成的画面出现颜色偏差，甚至完全不可用。

LiblibAI LoRA训练教程

首先来说素材准备。不少人一开始就随手塞进一大堆杂乱图片，结果训练出的模型根本认不准目标特征，这是最常见的问题根源。

第一步，将所有图片统一裁剪为标准的正方形。无论你使用Photoshop，还是在线裁剪工具如birme.net，都可以。目标尺寸建议设为768×768或1024×1024。千万不要将长图直接拉伸填充成正方形，那样会导致线条扭曲、比例完全失调。

文件命名也要讲究规范。统一采用半角下划线连接数字序号与英文描述词，例如01_ink_wash_scholar.jpg。严禁使用中文、空格、冒号等全角字符，LiblibAI平台无法识别这些符号。

每张图片还需要单独配备一个同名的txt标签文件。标签内容用英文逗号分隔，可以添加权重，但不要写颜色词。例如写成(long_hair:1.2)即可，没必要写成black_long_hair，颜色词反而会干扰模型的学习效果。

特别提醒：如果你使用的是iCloud下载的图片，务必先检查文件格式。苹果系统有时会自动将图片转换为HEIC格式，LiblibAI平台不支持这种格式。必须手动另存为JPEG后再上传。

基础模型选错了，后续工作基本白费。进入“赛博丹炉”后，点击左侧的“训练LoRA”，然后根据训练目标选择相应的基模：

在简易参数面板中，“单次张数”设为15，“循环轮次”设为8即可。模型效果预览所用的提示词，一定要包含触发词，例如ink_wash, scholar figure, soft ink gradient，否则预览出来的图像可能与你的训练素材毫无关联。

此外，务必关闭“混合精度训练”开关。在LiblibAI的云端环境中，这个选项极易引发NaN Loss，通常训练到第3轮就会崩溃。很多人训练中途莫名中断，十有八九就是栽在这个坑里。

许多人对高级参数一上来就胡乱调整。其实按以下顺序操作即可：

第一步：展开“高级参数”面板，将Repeat设为5到8。如果手头素材不足20张，直接拉满到8也没问题。

第二步：学习率填写3e-4（风格类）或4e-4（角色类）。调度策略选择cosine with warmup。千万不要使用固定学习率，否则loss会剧烈震荡，模型根本学不到有效特征。

第三步：Batch Size根据你的GPU型号设置。A10卡填2，V100卡填4。同时调整梯度累积值，确保Batch Size乘以梯度累积的结果落在8到12之间。这个区间在LiblibAI环境下是较为稳定的平衡点。

第四步：启用正则图功能。上传5到10张与训练素材风格相同但不含主体特征的背景图，目的是帮助模型约束泛化边界，防止学习出现偏差。

这一步绝对不能省略。平台提供的自动裁剪和自动打标功能都只能作为辅助工具，最终把关必须靠人工。

自动裁剪后，逐张检查裁剪框是否完整包裹了主体。特别是手部、发梢、衣摆等容易漏切的细节，一旦被裁掉，模型就学不全这些特征。

自动打标生成的tags往往包含大量冗余信息。像“sky”“floor”“blurry background”等无关背景词汇，必须手动删除。保留3到5个核心特征词即可。否则模型会把背景当作有效特征，最终学习效果会很奇怪。

所有参数确认无误后，点击“开始训练”，系统会自动分配GPU资源并启动训练。训练过程中要实时观察loss曲线。正常的走势是：前100步快速下降，之后缓慢收敛，最终稳定在0.22到0.28之间。

如果发现loss在0.4以上反复波动，且持续超过200步，那就别犹豫，立即暂停训练。返回检查：标签文件里是否混入了中文逗号？图片中是否夹杂了非正方形的图？触发词是否漏写了？逐一排查这些问题，基本就能找到原因。

来源：https://www.php.cn/faq/2740821.html?uid=1431639

ai

补充最近整理过的热点入口。