想要在LiblibAI中生成真正具有“人味儿”的高质量真人照片——皮肤透光、细节清晰、光影自然,而不是那种一眼就能识破的数字玩偶,关键在于不要盲目堆砌复杂参数,而是要彻底放弃AI自带的“画皮”逻辑。说白了,你需要用摄影棚的专业思维来指挥它。

默认的渲染模型往往会走一条“安全”却僵化的路径:高对比度、强平滑处理、塑料质感。要绕过这个捷径,就必须从选择基础模型开始,每一步都按照摄影工业和真实光学逻辑来配置。否则,即使分辨率再高,产出的也只是高清假人。
选对写实基础模型,奠定真实感基础
基础模型决定了图像的“基因”属性。像ReVAnimated、Anything V5这类动漫向模型,其底层纹理生成逻辑自带强风格化滤镜,后期即便加入再多realistic提示词也难以彻底矫正。
因此,第一步是前往“模型广场”,筛选类型为“Photorealistic”或“写实”。首选且优先加载的是F.1超清纯感人像写实(INS风格+纯欲网红)或xl-ill-写实风格。这两个模型均经过数万张哈苏/飞思中画幅人像数据的微调,原生支持皮肤次表面散射模拟。
还有一个小细节:点击模型卡片右下角的“详情”,滑动到底部,确认“兼容LoRA”和“支持ControlNet”这两项都已亮起绿灯。如果任何一项缺失,后面的所有精修操作都会失效,这一点务必牢记。
另外特别提醒,像“墨幽人造人V1080”这类模型,虽然高清,但默认倾向“极致摄影大片感”,自带强烈的电影级锐化和色调压缩,不适合追求自然光源下无修饰的真实皮肤质感,因此请将其划出纯写实任务的候选名单。
构建三段式物理提示词,精准控制光影
在真实人像摄影中,光影不是修饰项,而是建模工具。因此提示词必须按照“主体→光源→材质”的顺序来组织,否则模型会退回默认的漫反射光照,结果就是一片平光。
第一步,锁定主体与构图。例如:“中国28岁女性,齐肩黑发,穿米白亚麻衬衫,坐于浅灰布艺沙发,半身构图,眼神平视镜头。”注意,不要使用“beautiful”“elegant”这些主观模糊的形容词,而应用可测量的物理描述来替代。
第二步,定义光源的物理属性。“单点LED柔光灯从左上方30度角投射,色温4500K,光束角45°,桌面有清晰椭圆光斑,鼻翼右侧形成自然过渡阴影。”此处必须包含角度、色温、光型三要素,缺一不可。
第三步,则是关键中的关键:绑定皮肤的光学响应。“皮肤呈现真实皮脂反光,颧骨处有细微汗毛投影,下颌线可见绒毛边缘光,耳垂透光微红。”这一步是在激活模型对生物组织光学特性的理解。如果跳过,结果大概率是千篇一律的磨皮塑料脸。
强制校准关键参数,避免塑料质感
参数中最大的陷阱就是CFG Scale。默认值7到12会让模型过度服从提示词,反而牺牲物理合理性,造成阴影生硬、高光炸裂。
解决方案有两种:如果使用F.1模型,CFG必须严格设为3.5;如果选用FLUX写实系列模型,CFG则必须设为0.51。
采样步数建议设为30(F.1的推荐起点),低于20步会残留明显噪点。分辨率必须严格匹配模型的训练尺度,F.1建议使用1024×1024或1280×832,非整除尺寸会触发自动拉伸,导致画面失真。
叠加皮肤真实感LoRA,强化质感细节
在“LoRA”模块中,搜索并启用skin_realism_enhancer,权重设为0.6。这个LoRA专为激活皮肤次表面散射通道设计。权重低于0.4则效果不明显,高于0.8又会导致局部过透光,耳垂泛红不正常。
注意:必须在已加载F.1或xl-ill模型的前提下才能启用它,否则LoRA无法注入到对应的特征层里。
使用ControlNet双通道锁定结构,参考图生成真人图
如果基于参考图生成真人图,必须启用ControlNet的深度图(depth)加平铺(tile)双控制。
具体操作:上传一张至少512×512像素的JPG/PNG参考图后,在ControlNet区域选择“depth”模型,权重设为0.7,像素引导强度设为1.0。同时,再叠加一个“tile”模型,权重设为0.4,其作用是保留原始纹理颗粒与噪点分布。如果只启用depth,皮肤会显得油亮像蜡像,必须用tile来补足胶片感。
最后,去噪强度应严格控制在0.45到0.55之间,此区间能很好平衡结构保真与语义延展性。
