想在LiblibAI平台上成功训练出一个能稳定生成高质量图像的LoRA模型,其实并不神秘,但确实需要按照规范流程,踏踏实实地处理好素材、底模和参数这三个关键环节。任何一个步骤被跳过或疏忽,都可能导致loss崩溃,或者生成的画面出现颜色偏差,甚至完全不可用。

首先来说素材准备。不少人一开始就随手塞进一大堆杂乱图片,结果训练出的模型根本认不准目标特征,这是最常见的问题根源。
准备20–50张同风格正方形图片
第一步,将所有图片统一裁剪为标准的正方形。无论你使用Photoshop,还是在线裁剪工具如birme.net,都可以。目标尺寸建议设为768×768或1024×1024。千万不要将长图直接拉伸填充成正方形,那样会导致线条扭曲、比例完全失调。
文件命名也要讲究规范。统一采用半角下划线连接数字序号与英文描述词,例如01_ink_wash_scholar.jpg。严禁使用中文、空格、冒号等全角字符,LiblibAI平台无法识别这些符号。
每张图片还需要单独配备一个同名的txt标签文件。标签内容用英文逗号分隔,可以添加权重,但不要写颜色词。例如写成(long_hair:1.2)即可,没必要写成black_long_hair,颜色词反而会干扰模型的学习效果。
特别提醒:如果你使用的是iCloud下载的图片,务必先检查文件格式。苹果系统有时会自动将图片转换为HEIC格式,LiblibAI平台不支持这种格式。必须手动另存为JPEG后再上传。
选对基础模型并关闭混合精度
基础模型选错了,后续工作基本白费。进入“赛博丹炉”后,点击左侧的“训练LoRA”,然后根据训练目标选择相应的基模:
- 人像或ACG风格,选择SD1.5;
- 写实场景,选择SDXL;
- PVC、金属等材质感强的内容,选择Foundation1.0。
在简易参数面板中,“单次张数”设为15,“循环轮次”设为8即可。模型效果预览所用的提示词,一定要包含触发词,例如ink_wash, scholar figure, soft ink gradient,否则预览出来的图像可能与你的训练素材毫无关联。
此外,务必关闭“混合精度训练”开关。在LiblibAI的云端环境中,这个选项极易引发NaN Loss,通常训练到第3轮就会崩溃。很多人训练中途莫名中断,十有八九就是栽在这个坑里。
高级参数逐步调优
许多人对高级参数一上来就胡乱调整。其实按以下顺序操作即可:
第一步:展开“高级参数”面板,将Repeat设为5到8。如果手头素材不足20张,直接拉满到8也没问题。
第二步:学习率填写3e-4(风格类)或4e-4(角色类)。调度策略选择cosine with warmup。千万不要使用固定学习率,否则loss会剧烈震荡,模型根本学不到有效特征。
第三步:Batch Size根据你的GPU型号设置。A10卡填2,V100卡填4。同时调整梯度累积值,确保Batch Size乘以梯度累积的结果落在8到12之间。这个区间在LiblibAI环境下是较为稳定的平衡点。
第四步:启用正则图功能。上传5到10张与训练素材风格相同但不含主体特征的背景图,目的是帮助模型约束泛化边界,防止学习出现偏差。
裁剪与打标必须人工校验
这一步绝对不能省略。平台提供的自动裁剪和自动打标功能都只能作为辅助工具,最终把关必须靠人工。
自动裁剪后,逐张检查裁剪框是否完整包裹了主体。特别是手部、发梢、衣摆等容易漏切的细节,一旦被裁掉,模型就学不全这些特征。
自动打标生成的tags往往包含大量冗余信息。像“sky”“floor”“blurry background”等无关背景词汇,必须手动删除。保留3到5个核心特征词即可。否则模型会把背景当作有效特征,最终学习效果会很奇怪。
启动训练并监控loss曲线
所有参数确认无误后,点击“开始训练”,系统会自动分配GPU资源并启动训练。训练过程中要实时观察loss曲线。正常的走势是:前100步快速下降,之后缓慢收敛,最终稳定在0.22到0.28之间。
如果发现loss在0.4以上反复波动,且持续超过200步,那就别犹豫,立即暂停训练。返回检查:标签文件里是否混入了中文逗号?图片中是否夹杂了非正方形的图?触发词是否漏写了?逐一排查这些问题,基本就能找到原因。
