说到用已有照片生成新风格、新构图或者局部重绘,很多新手上来就直接在文生图界面硬传,结果上传按钮灰显、参考图被忽略、生成结果跟原图八竿子打不着——原因很简单:没进对模式。
没错,LiblibAI的图生图功能不是自动激活的,它藏在另外一个专属模式下。想上传自己的图片,必须先手动切换,否则即便拖进文件也只是个自欺欺人的空壳操作。
确认并进入图生图功能入口
先弄清楚一件事:LiblibAI有文生图、图生图、ComfyUI等多个平行入口,图生图功能不会在文生图界面自动激活,必须手动切换,否则所有上传操作无效。
具体怎么做?登录LiblibAI正式网站后,先点击顶部导航栏的【创作】选项。在模型选择页的“CHECKPOINT”区域,下拉选定一个支持图生图的模型——像F.1 Kontext、Seedream 4.0或者Qwen-Image。注意,选对模型这一步很关键,选不对的话,图生图按钮根本不会出现。
接下来在页面中部找到并点击【图生图】标签。注意右上角是否显示“图像到图像”字样——如果显示的还是“文本到图像”,说明模式没切成功,需要重新点击。最后检查左侧是否出现带虚线边框的上传区域,且右上角提示“当前模式:图像到图像”。到这一步,才算真正准备好。
准备并上传合规参考图
那么,什么样的参考图才合规?经验表明,分辨率至少要在512×512像素以上,低于这个值AI基本无法识别主体结构,生成的图会出现肢体断裂、五官错位。格式方面,只认PNG、JPG或WEBP,GIF、BMP、TIFF这些格式上传时没反应,也不报错,就这么静默失败。单张文件大小严格控制在10MB以内,超限的话进度条会卡在99%,预览区一片空白。遇到这种情况,可以用TinyPNG这类工具做无损压缩后再试。
实际占比如何?数据说,这三类问题占图生图失败案例的76%——相当惊人的比例。换句话说,准备一张合规的参考图,就已经跨过了图生图的最大障碍。点击上传区域或直接拖拽图片至虚线框内,等进度条走完、左侧预览图稳定显示。注意,如果预览图模糊、拉伸或带黑边,说明图片本身就不符合要求,这时候千万不能点生成。
设置关键生成参数
去噪强度和提示词,堪称图生图的左右手:一个管“形似”,一个管“神似”。两者一旦失衡,轻则风格跑偏,重则构图崩坏。
基础稳妥的做法是:将“去噪强度”滑块设定在0.4–0.6之间。数值低于0.3,画面会僵硬得像贴图;高于0.7,人物可能直接变脸、建筑塌陷、背景全换,原图结构基本丢失。如果你需要保留原图90%以上的构图——比如只想换服装或加配饰——那去噪强度调到0.2–0.3就够用了,同时在提示词里明确写清楚:“保持原构图、仅修改人物上衣为亮红色皮夹克、保留背景和姿势不变”。
提示词怎么写?越具体越好。要的是“赛博朋克城市夜景、霓虹灯牌泛蓝光、雨天湿滑路面反光”这类具象描述,而不是“好看”“高级感”“氛围感”这些AI根本听不懂的空泛词汇。如果还需要强化局部特征,可以在提示词中加入位置限定词,比如“人物面部添加微笑表情”“背景天空替换为极光效果”。但注意,位置词必须真实对应参考图中的物理区域,否则AI会胡乱修改。
启用蒙版进行局部重绘
当你只想改裙子、换发型、修瑕疵,而其他部分必须原封不动时,蒙版就是唯一可靠的路径。盲目全局重绘,结果往往是细节丢失、光影错乱,得不偿失。点击工具栏中的【创建蒙版】按钮,在图像上用画笔涂抹需要重绘的区域即可。边缘要覆盖完整,但不能溢出到想保留的部位。
调整画笔大小也是个关键细节:按住Ctrl(Windows)或Cmd(Mac)滚动鼠标滚轮,小区域如耳钉、睫毛用5–15像素,大区域如整条裙摆可以用80–120像素。误涂部分用橡皮擦除,或者按Ctrl+Z撤销。涂抹完成后,务必在提示词中写明该区域的新内容,比如“金色机械义眼”“破损皮夹克”,否则AI默认重绘为随机内容,那结果完全不可控。
批量上传五图横向对比
刷新一下认知:同一组提示词下,不同参考图带来的生成差异,远大于参数微调。批量上传能快速锁定最优输入源,省去反复试错的时间。在上传区域连续点击或拖拽最多五张参考图,系统会自动并列排布在预览区,每张图下方显示编号1–5。
操作要点是:保持提示词与核心参数(去噪强度、采样步数、CFG Scale)完全一致,只更换参考图源——这样对比结果才具备归因价值。点击【开始生成】后,五张图并行提交至队列,大约12–18秒后全部返回。这时候横向比较,很容易直观判断出哪张参考图最能达成目标效果。
