先讲几个关键要点。这篇文章介绍了一套完整的图像编辑服务操作流程,从服务启动到最终出图,每个环节都藏着一些容易被忽略的细节。把这些细节梳理清楚,能大幅减少反复调试的时间成本。
首先要确认 LongCat-Image-Edit 服务已经成功启动并正常运行。怎么判断?最简单的方式是在终端执行一行命令:netstat -tuln | grep :7860。如果返回结果中显示“LISTEN”,说明服务已在本地绑定该端口,浏览器可以正常打开页面。如果没有任何输出,就需要先运行启动脚本 bash /root/build/start.sh。这一步必须完成,否则后续所有操作都无从谈起。

启动服务并确认端口可用
确保服务运行且端口处于监听状态的重要性,怎样强调都不为过。端口未开放,界面就无法加载,后续所有流程自然无法执行。因此,第一步就是运行这行命令,并确认返回结果。
上传图片的合规性检查与预处理
点击“Upload Image”按钮之前,先花几十秒检查手头图片是否满足三项硬性指标:
① 格式必须正确。JPG、PNG、WEBP 三种格式均可,但 BMP、TIFF 等格式会被系统直接拒绝上传,无需尝试。
② 文件大小不能超过 1MB。如果超出,最简单的处理方式是使用系统自带的画图工具打开,另存为 JPEG 格式,将质量滑块调整至 75% 左右,通常能压缩到 800KB 以内,画质损失也不明显。
③ 分辨率方面,短边不得超过 768 像素。例如一张 1024×768 的图片,短边为 768,刚好达标。如果短边超过该数值(比如 1024×1024),需要先进行裁切或缩放。这一步并非多余,而是为了避免触发显存溢出错误,导致生成流程中断。
提示词输入的结构化写法
很多人误以为提示词写得越长越详细就越好,实际情况并非如此。关键在于信息密度和指令的明确性。推荐两种可靠句式:
方法一:“把[具体对象]变成[新对象]”。示例:“把左下角的白色茶杯变成青花瓷茶杯”——对象位置、材质、风格均已指定,成功率最高。
方法二:“给[对象]添加[元素]”。示例:“给穿蓝衬衫的人物右肩添加一只卡通小鸟”——动词统一使用“添加”最稳定,避免使用“增加”“加入”等模糊表述。
还有一个小细节:提示词中不要混用中英文标点。中文逗号、句号必须使用全角符号,否则部分模型可能会解析出错,跳过后续内容。
参数调节的实用阈值设定
默认参数对大多数场景已经足够,但遇到细节失真或风格偏移问题时,仍需手动微调。
Steps(采样步数)设置为 40 是一个均衡值。低于 35 时容易产生边缘锯齿,高于 48 时生成时间翻倍,而效果提升却有限,得不偿失。
Guidance Scale(提示词引导系数)建议保持在 5.0 到 6.5 之间。低于 4.0 时 AI 容易忽略指令,高于 7.5 时则可能导致指令过度强化,引发局部扭曲变形。
随机种子留空即可,系统会自动随机生成。如果某次生成结果特别满意且希望复现,可将生成完成后显示的 Seed 数值复制出来,填入对应输入框,再点击“Generate”。
结果保存与异常处理
生成完成后,右侧会显示编辑后的图片。直接点击“Download”按钮即可保存为 PNG 格式。
如果页面卡在“Generating…”状态超过 2 分钟没有反应,不要等待,立即点击“Interrupt”按钮终止当前任务,然后刷新页面重新尝试。长时间挂起通常是由于显存临时不足,刷新后内存释放,一般即可恢复正常。
