LiblibAI人物模型训练教程_AI热点日报

LiblibAI人物模型训练教程

类型：热点整理2026-07-01

训练人物LoRA模型时，有几项硬性规范必须严格遵循：图片数量严格控制在20至50张之间，确保同角度、同光照条件、主体居中并采用正方形裁剪；英文触发词置于前列，底模选择SD1 5，同时务必关闭混合精度；Repeat与Epoch的组合需与图片数量精确匹配，loss值须在5分钟内快速跌破0 7，并稳定维持

训练人物LoRA模型时，有几项硬性规范必须严格遵循：图片数量严格控制在20至50张之间，确保同角度、同光照条件、主体居中并采用正方形裁剪；英文触发词置于前列，底模选择SD1.5，同时务必关闭混合精度；Repeat与Epoch的组合需与图片数量精确匹配，loss值须在5分钟内快速跌破0.7，并稳定维持在0.22至0.28区间才算达标——稍有偏差，都可能直接导致生成效果失败。

LiblibAI训练人物模型教程

若想在LiblibAI平台上成功训练出一个能够稳定还原特定人物形象的LoRA模型，上述条件就是必备的准入门槛。20至50张同角度、同光照、背景干净的正方形图像，英文标签中触发词前置，底模锁定SD1.5，关闭混合精度功能，Repeat与Epoch的组合必须依据图片数量精确计算——只要少一张，loss曲线就可能直接崩成一条直线，彻底失去修复可能。

准备符合要求的人物训练集

人物LoRA训练对图像一致性要求极为严苛，即便仅有3张图混入1张侧脸或虚焦画面，生成时就会出现五官错位、肢体变形等问题。因此，数据集的首要规则就是：纯净，并且要纯净到极致。

具体实施可分为四个步骤：

第一步：使用手机或相机拍摄15至20张正面半身照，人物需占据画面70%以上，背景选择纯色（白墙或灰布为佳），避开反光、阴影以及多人同框场景。

第二步：将所有图片统一裁剪为正方形，分辨率锁定768×768。不建议使用1024×1024分辨率——SD1.5底模对高分辨率图像适配性较差，容易触发特征漂移，反而得不偿失。

第三步：文件重命名采用半角下划线格式，例如01_zhaoxiaoming_face.jpg、02_zhaoxiaoming_smile.jpg。空格、中文括号、全角逗号等字符均不允许出现。

第四步：上传前使用文本编辑器清除每张图的EXIF信息，特别是GPS坐标和设备型号。LiblibAI的打标模块可能会误读这些字段，生成类似“iPhone_15_Pro”的错误标签，从而干扰训练效果。

上传并完成裁剪打标

这一步不可直接跳过自动裁剪进入训练阶段——否则AI会将背景杂物误当作主体特征进行学习。

操作方法有两种可选：

方法一：点击「裁剪打标」→ 选择「聚焦裁剪」→ 等待系统自动框出人脸区域 → 逐张确认框线是否完整覆盖眉眼鼻嘴。若偏移超过2像素，需手动拖拽校准，切勿偷懒。

方法二：如果原图已居中且无干扰元素，可切换「中央裁剪」直接启用，但必须逐张检查裁剪后人物是否完整——若脖子被切掉一半，训练出来的将是缺失肩部的模型。

打标完成后，务必逐张点开自动生成的标签，删除所有形容词和场景词，仅保留触发词加1girl或1boy。例如，原标签“young Chinese woman, studio lighting, soft smile”需精简为“zhaoxiaoming, 1girl”。多出一个逗号都可能影响权重分配，导致模型学习方向偏离。

关键参数设置（标准模式+故障修复）

新手直接套用标准模式可覆盖80%的人物训练场景，但一旦loss值卡在0.8不下降，就需要切换到高级参数进行手动调整。

具体参数设置逻辑如下：

① 进入「简易参数」面板，底模选择SD1.5（人物/ACG专用），单次张数设为15，循环轮次设为8，模型效果预览提示词填写“zhaoxiaoming, front view, high detail, sharp focus”。

② 关闭「混合精度训练」开关——这是LiblibAI云端最容易触发NaN Loss的元凶。关闭该功能后，loss曲线才有可能平稳下降至0.25左右。

③ 若训练中途报错或loss出现震荡，立即点开「高级参数」：Repeat设为6（适用于20张图），Epoch设为5，学习率填写4e-4（人物类需比风格类高一个档次），梯度累积设为3，确保Batch Size乘以梯度累积等于9。

④ 必须启用正则图，数量设为训练图总数的20%。系统会自动从图库抽样——如果禁用该功能，在小数据集下极易出现过拟合，导致生成图全是训练图像的翻版。

启动训练与实时监控

点击训练按钮并非万事大吉，前5分钟必须密切关注loss曲线，一旦发现异常需立即中断并重新调整参数。

点击「立即训练」后，页面会自动跳转至任务看板，左侧显示实时loss值，右侧滚动输出训练日志。

前3分钟内loss应快速跌破0.7。如果loss停滞在0.95以上，说明触发词未生效或图片分辨率存在错误，需立即暂停排查问题。

loss下降至0.3后开始平缓波动，此时可刷新页面查看预览图。若第1张预览图出现五官模糊或双下巴现象，说明打标时删除了过多关键词，需要退回重新标注。

当loss稳定在0.22至0.28区间并持续10分钟时，训练将自动结束，模型生成完毕——一切顺利的话，就可以导出模型用于图像生成了。

来源：https://www.php.cn/faq/2746234.html?uid=1431639

AI训练

延伸阅读

补充最近整理过的热点入口。