游乐游手机版
首页/AI热点日报/热点详情

LiblibAI人物模型训练教程

类型:热点整理2026-07-01
训练人物LoRA模型时,有几项硬性规范必须严格遵循:图片数量严格控制在20至50张之间,确保同角度、同光照条件、主体居中并采用正方形裁剪;英文触发词置于前列,底模选择SD1 5,同时务必关闭混合精度;Repeat与Epoch的组合需与图片数量精确匹配,loss值须在5分钟内快速跌破0 7,并稳定维持

训练人物LoRA模型时,有几项硬性规范必须严格遵循:图片数量严格控制在20至50张之间,确保同角度、同光照条件、主体居中并采用正方形裁剪;英文触发词置于前列,底模选择SD1.5,同时务必关闭混合精度;Repeat与Epoch的组合需与图片数量精确匹配,loss值须在5分钟内快速跌破0.7,并稳定维持在0.22至0.28区间才算达标——稍有偏差,都可能直接导致生成效果失败。

LiblibAI训练人物模型教程

若想在LiblibAI平台上成功训练出一个能够稳定还原特定人物形象的LoRA模型,上述条件就是必备的准入门槛。20至50张同角度、同光照、背景干净的正方形图像,英文标签中触发词前置,底模锁定SD1.5,关闭混合精度功能,Repeat与Epoch的组合必须依据图片数量精确计算——只要少一张,loss曲线就可能直接崩成一条直线,彻底失去修复可能。

准备符合要求的人物训练集

人物LoRA训练对图像一致性要求极为严苛,即便仅有3张图混入1张侧脸或虚焦画面,生成时就会出现五官错位、肢体变形等问题。因此,数据集的首要规则就是:纯净,并且要纯净到极致。

具体实施可分为四个步骤:

第一步:使用手机或相机拍摄15至20张正面半身照,人物需占据画面70%以上,背景选择纯色(白墙或灰布为佳),避开反光、阴影以及多人同框场景。

第二步:将所有图片统一裁剪为正方形,分辨率锁定768×768。不建议使用1024×1024分辨率——SD1.5底模对高分辨率图像适配性较差,容易触发特征漂移,反而得不偿失。

第三步:文件重命名采用半角下划线格式,例如01_zhaoxiaoming_face.jpg02_zhaoxiaoming_smile.jpg。空格、中文括号、全角逗号等字符均不允许出现。

第四步:上传前使用文本编辑器清除每张图的EXIF信息,特别是GPS坐标和设备型号。LiblibAI的打标模块可能会误读这些字段,生成类似“iPhone_15_Pro”的错误标签,从而干扰训练效果。

上传并完成裁剪打标

这一步不可直接跳过自动裁剪进入训练阶段——否则AI会将背景杂物误当作主体特征进行学习。

操作方法有两种可选:

方法一:点击「裁剪打标」→ 选择「聚焦裁剪」→ 等待系统自动框出人脸区域 → 逐张确认框线是否完整覆盖眉眼鼻嘴。若偏移超过2像素,需手动拖拽校准,切勿偷懒。

方法二:如果原图已居中且无干扰元素,可切换「中央裁剪」直接启用,但必须逐张检查裁剪后人物是否完整——若脖子被切掉一半,训练出来的将是缺失肩部的模型。

打标完成后,务必逐张点开自动生成的标签,删除所有形容词和场景词,仅保留触发词加1girl或1boy。例如,原标签“young Chinese woman, studio lighting, soft smile”需精简为“zhaoxiaoming, 1girl”。多出一个逗号都可能影响权重分配,导致模型学习方向偏离。

关键参数设置(标准模式+故障修复)

新手直接套用标准模式可覆盖80%的人物训练场景,但一旦loss值卡在0.8不下降,就需要切换到高级参数进行手动调整。

具体参数设置逻辑如下:

① 进入「简易参数」面板,底模选择SD1.5(人物/ACG专用),单次张数设为15,循环轮次设为8,模型效果预览提示词填写“zhaoxiaoming, front view, high detail, sharp focus”。

② 关闭「混合精度训练」开关——这是LiblibAI云端最容易触发NaN Loss的元凶。关闭该功能后,loss曲线才有可能平稳下降至0.25左右。

③ 若训练中途报错或loss出现震荡,立即点开「高级参数」:Repeat设为6(适用于20张图),Epoch设为5,学习率填写4e-4(人物类需比风格类高一个档次),梯度累积设为3,确保Batch Size乘以梯度累积等于9。

④ 必须启用正则图,数量设为训练图总数的20%。系统会自动从图库抽样——如果禁用该功能,在小数据集下极易出现过拟合,导致生成图全是训练图像的翻版。

启动训练与实时监控

点击训练按钮并非万事大吉,前5分钟必须密切关注loss曲线,一旦发现异常需立即中断并重新调整参数。

点击「立即训练」后,页面会自动跳转至任务看板,左侧显示实时loss值,右侧滚动输出训练日志。

前3分钟内loss应快速跌破0.7。如果loss停滞在0.95以上,说明触发词未生效或图片分辨率存在错误,需立即暂停排查问题。

loss下降至0.3后开始平缓波动,此时可刷新页面查看预览图。若第1张预览图出现五官模糊或双下巴现象,说明打标时删除了过多关键词,需要退回重新标注。

当loss稳定在0.22至0.28区间并持续10分钟时,训练将自动结束,模型生成完毕——一切顺利的话,就可以导出模型用于图像生成了。

来源:https://www.php.cn/faq/2746234.html?uid=1431639

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。