想在LiblibAI上训练出一套画风统一、输出稳定的固定风格模型?核心在于训练数据、底模选择与参数设置三者必须严格对齐,缺一不可。任何一项出现偏差,都会导致最终生成的画面出现风格漂移或混杂——打个比方,就像炖汤时盐放多了或火候没控好,味道总是能尝出来差异。
正式动手之前,请确认你已准备好20到50张同源、同风格且分辨率一致的高质量图片。每张图片的命名同样有讲究,必须严格遵循“数字_描述词.jpg”的格式,例如“03_watercolor_cat.jpg”。这看似是一个小细节,但规范的命名是后续训练流程顺畅运行的基础。
选对底模:写实、插画、二次元,三类风格匹配原则
底模绝不是随便选一个就能出效果的。它决定了模型底层的渲染逻辑与“审美偏好”。用错了底模,哪怕你的数据集再精准、参数调得再细致,最终模型生成时,还是会自动回退到那个底模的默认倾向上——这就好比选错了画笔,再怎么调色也难以画出你想要的效果。
写实风格,首选F.1或xl-ill系列底模。这两个底模均经过大量真实人像与材质数据的微调,天生就擅长细腻的皮肤渲染和自然光模拟。请留意一个硬性标准:严禁使用SD1.5或Anything V5这类动漫向底模来训练写实图像。否则,训练到中途,你会看到loss值突然跳升,生成的图要么是塑料感明显的五官,要么直接崩坏变形。
插画风格,优先选择Foundation1.0或者SDXL的插画专用分支。这类底模内置了手绘笔触的建模能力,对水彩、厚涂、矢量扁平化等非摄影类表现有天然的支撑。如果你的目标是儿童绘本风,那还需要额外上传一些明确带有边线、高对比色块的样本图,让模型去学习这种特殊的风格语言。
二次元风格,则锁定SD1.5+ACG预设或SDXL Anime底模。特别要注意模型详情页是否标注了“厚涂”“日系”“2.5D”这些关键词。不建议直接用像Flux_超级毛发这类强细节LoRA作为底模直接开始训练,它更适合作为后期注入模块,而非底层的“地基”。
数据集处理:剪裁与分辨率强制统一
数据准备就绪后,接下来进入处理环节。
第一步:将所有训练图上传至「我的训练」→「新建训练任务」→「上传数据集」。
第二步:在剪裁选项里,根据你的训练目标来选择方式。如果是头像类(如角色立绘),选「聚焦剪裁」,系统会自动框选脸部区域;如果是全身构图或场景插画,就选「中央裁剪」;若原始图已是标准比例且主体居中,可直接勾选「不剪裁」。
第三步,也是最关键的一步:分辨率设置必须与底模严格匹配。SD1.5系列统一设为512×512或512×768;SDXL系列必须用1024×1024或1024×1536;F.1写实底模推荐1024×1344(竖版人像)或1280×768(横版场景)。分辨率差一个像素,训练时就会触发隐式重采样,结果就是纹理模糊、边缘锯齿——这无疑是妥妥的翻车现场。
第四步:点击「开始预处理」,等待平台完成自动归一化。这时页面会显示每张图的处理状态,失败图会标红并提示原因,最常见的是EXIF旋转信息未清除或Alpha通道残留。
参数配置:三类风格对应的关键数值组合
参数设置直接决定了训练效果,不同风格之间的参数差异相当显著。
方法一:写实风格(以F.1底模为例)
设置学习率1e-5,Epochs设12,Batch Size选2。触发词里必须包含realistic、photorealistic、8k。CFG Scale在训练阶段固定为3.5,不可调高——一旦调高,皮肤会过锐显得失真;调低了又会丢失毛孔与皮脂的光泽感。方法二:插画风格(以Foundation1.0底模为例)
学习率可以放宽至5e-5,Epochs设8到10,Batch Size可设3。触发词加入watercolor、ink outline、flat shading。这里有一个关键步骤:必须启用「颜色保真增强」开关(在高级参数区),否则训练完成后生成图饱和度会整体偏低15%到20%,看起来灰扑扑的。方法三:二次元风格(以SD1.5+ACG预设为例)
学习率设8e-5,Epochs设15,Batch Size选4。触发词必含anime、thick brush、cel shading。特别注意:务必关闭「面部修复」选项——这个功能会强行校正五官比例,破坏二次元特有的夸张结构,比如大眼小嘴、长颈窄肩这些标志性特征。训练启动与过程监控
所有设置确认无误后,点击「启动训练」按钮。训练开始后,页面会自动跳转到实时监控面板。
重点观察loss曲线。前3轮可能会出现波动,这属于正常现象,但从第4轮起,它应该进入一个持续缓降的通道。如果第6轮之后,loss进入平台期超过2轮,且数值大于0.18,那说明数据集可能存在着风格混杂的问题——比如混入了一两张写实图。此时不要犹豫,立即中断训练,回去重新清洗数据。
每完成1个Epoch,系统会自动生成1张预览图,使用你在「模型效果预览提示词」栏填写的句子进行测试。例如:“masterpiece, best quality, (银发少女:1.2), 厚涂质感, 暗黑哥特风”。如果到了第5轮,预览图仍然明显偏离训练图的风格,不要等待结束,立即终止训练,检查一下触发词权重是否被后台自动压缩了。
完整完成15轮训练,通常耗时22到38分钟(取决于图片数量与服务器负载)。完成后,模型会自动保存至「我的模型」→「LoRA」分类下,名称为“训练任务名_时间戳”。
