游乐游手机版
首页/AI热点日报/热点详情

ComfyUI保姆级教程 像搭积木一样构建专属AIGC工作流

类型:热点整理2026-07-02
想搭建一套专属的AIGC工作流,从文字描述直接生成图片甚至动态图?其实没那么复杂。今天,我们就从一个相对“平民”的起点——公司发的Mac工作电脑出发,一步步带你用ComfyUI搭建起属于自己的文生图与文生动图管道。整个过程依赖的都是开源模型和工具,无需自己训练调参,上手门槛大大降低。 当然,如果你手

想搭建一套专属的AIGC工作流,从文字描述直接生成图片甚至动态图?其实没那么复杂。今天,我们就从一个相对“平民”的起点——公司发的Mac工作电脑出发,一步步带你用ComfyUI搭建起属于自己的文生图与文生动图管道。整个过程依赖的都是开源模型和工具,无需自己训练调参,上手门槛大大降低。

当然,如果你手头有性能更强的设备或者私有模型,效果自然会更好。为了方便大家快速上手,文末我也会分享自己搭建好的工作流文件。

实验环境:一台普通的办公电脑

本文所有操作均基于一台常见的公司配备的Mac电脑,具体配置如下:

  • 芯片:Apple M系列
  • 操作系统:macOS Monterey (12.3) 或更高版本
  • Python环境:Python 3.12(为兼容最新的AIGC能力,如文生视频)

环境是基础,现在我们从安装开始。

第一步:搭建基础环境

首先,我们需要安装核心的深度学习框架。这里以搭载Apple Silicon芯片的Mac为例。

安装PyTorch框架

PyTorch是目前构建和运行深度学习模型的主流框架之一,尤其在快速实验和原型设计方面备受青睐。它完全支持GPU加速,并且具备动态计算图等特性。

推荐使用conda来管理Python环境,这能有效避免后续的包依赖冲突。如果你还没有conda,可以通过以下命令安装Miniconda:

curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh
sh Miniconda3-latest-MacOSX-arm64.sh

安装好conda后,创建一个新的虚拟环境并安装PyTorch:

conda install pytorch torchvision torchaudio -c pytorch-nightly

安装完成后,运行一段简单的Python脚本来验证PyTorch是否已正确识别Mac的GPU(Metal Performance Shaders):

import torch
if torch.backends.mps.is_a vailable():
    mps_device = torch.device("mps")
    x = torch.ones(1, device=mps_device)
    print (x)
else:
    print ("MPS device not found.")

如果终端打印出一个张量(tensor),恭喜你,PyTorch环境已经就绪。

第二步:安装与启动ComfyUI

ComfyUI是一个基于节点(Node)的可视化Stable Diffusion工作流工具,它以高度的灵活性和可定制性著称。

通过Git将其克隆到本地:

git clone git@github.com:comfyanonymous/ComfyUI.git

进入目录,安装Python依赖包:

pip install -r requirements.txt

依赖安装完毕后,运行主程序:

python main.py

当看到类似“服务已启动于 http://127.0.0.1:8188" 的提示时,就说明ComfyUI已经成功在本地部署。用浏览器打开这个地址,你就能看到它的Web界面了。

不过,此时界面上还跑不起来任何东西,因为我们缺少最关键的“燃料”——AI模型。

第三步:获取并导入模型

模型决定了AI生成内容的质量和风格。目前主要有两个主流模型分享网站:

  • Hugging Face:地址:https://huggingface.co/ 。更偏向学术和权威,是许多前沿模型的首发地。
  • Civitai:地址:https://civitai.com/models 。社区氛围浓厚,下载速度通常较快,有大量风格化、娱乐性强的模型。

模型文件主要有两种格式:

  • .safetensors:仅包含张量数据,无执行代码,因此加载更快速、更安全。
  • .ckpt:序列化文件,可能包含代码,存在一定的潜在安全风险,加载时需注意来源。

下载好的模型文件,需要放置在ComfyUI目录下的 models/checkpoints 文件夹中,这样软件才能识别并加载它们。

第四步:理解ComfyUI的核心:节点与工作流

ComfyUI的一切都围绕“节点(Node)”展开。通过连接不同节点的输入输出,就像搭积木一样,构建出完整的AI生成流水线。

核心节点解析

一个基础的文生图工作流,通常离不开以下几类节点:

  • Load Checkpoint:工作流的起点,用于加载你下载的基础大模型。它会输出模型(MODEL)、文本编码器(CLIP)和图像解码器(VAE)三个部分,对应Stable Diffusion生成图片的三大步骤。
  • CLIP Text Encode (Prompt):输入提示词(Prompt)的地方。通常需要两个,一个填写希望画面中间出现的内容(正向提示词),另一个填写不希望出现的内容(负向提示词)。提示词讲究技巧:用逗号分隔关键词、重要词靠前、可用(keyword:1.2)的语法调整关键词权重。
  • Empty Latent Image:定义生成图片的尺寸(宽、高)和每次生成的数量(batch_size)。
  • KSampler:核心的采样器节点,控制生成过程。关键参数包括:随机种子(seed)、采样步数(steps)、指导强度(cfg)、采样器与调度器算法选择等。步数越高通常细节越好,但生成时间也越长。
  • Sa ve Image:生成图片的输出节点。

连线的规则

连接节点时,需遵循几条基本规则:

  1. 同类相连:只有相同颜色(或类型)的端口才能连接。连接时,可连接的端口会高亮显示,非常直观。
  2. 左进右出:节点左侧端口是输入(Input),右侧端口是输出(Output)。数据流向总是从左到右。
  3. 一进多出:一个输入端口只能接受一个输出源的连接,但一个输出端口可以分叉连接到多个输入端口上。

最好的学习方式就是动手拖拽和连接,ComfyUI的错误提示通常很清晰,能帮你快速定位问题。

第五步:进阶能力拓展

掌握基础后,你可以通过以下方式让工作流变得更强大。

引入LoRA模型

LoRA(低秩自适应)模型可以理解为给基础大模型加上一个风格“滤镜”。它体积小巧,可以微调生成结果,比如让画风更动漫、角色特征更固定等。下载的LoRA模型文件,需要放在 models/loras 目录下,然后在工作流中通过特定节点加载并调整权重即可生效。

安装插件与自定义节点

ComfyUI的社区生态非常活跃,有大量插件(Custom Node)可以扩展其功能,例如实现文生视频、高清修复、面部修复等。

安装插件通常很简单,以安装几个实用插件为例:

cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager
git clone https://github.com/AIGODLIKE/AIGODLIKE-ComfyUI-Translation.git
git clone https://github.com/Kosinkadink/ComfyUI-AnimateDiff-Evolved

安装后重启ComfyUI,在界面右侧就能看到新增的功能模块。其中,“ComfyUI Manager”提供了图形化的插件、模型管理界面,大大降低了使用门槛。

实现文生动图

想要让静态图片动起来?使用前面安装的“ComfyUI-AnimateDiff-Evolved”插件即可。它需要额外的运动模型,通常放置在插件自身的模型目录下(如 custom_nodes/ComfyUI-AnimateDiff-Evolved/models)。

搭建工作流时,在基础的文生图流程中插入动画扩散(AnimateDiff)相关节点,并配置好帧数、循环等参数,就能输出一段GIF或视频。当然,生成动图对电脑内存要求较高,在16GB内存的电脑上可能只能生成帧率较低的短片,性能更强的设备效果会更好。

效果展示与工作流分享

基于上述方法,可以生成从写实风景到动漫角色的各种图片,以及简单的动态效果。

为了方便大家快速复现和体验,这里分享两个已经搭建好的工作流配置文件,下载后可以直接在ComfyUI中加载使用:

  • 基础文生图工作流(含LoRA):下载链接
  • 文生动图工作流:下载链接

几点心得与总结

  1. 环境隔离是美德:强烈建议使用conda为AIGC项目创建独立的Python虚拟环境。这能彻底避免包版本冲突带来的无谓麻烦。
  2. 善用开源社区:在尝试文生动图插件时,曾遇到无法生成的问题。在排查无果后,我去该插件的GitHub仓库提交了Issue,很快得到了作者的回复和帮助。开源社区的互助精神是技术前进的重要动力。
  3. 拥抱变化,保持动手:AI技术日新月异,能亲手搭建、调试并看到生成结果,是理解其能力边界和潜力的最佳方式。每一次成功的生成,都是对创造力的一次扩展。
来源:https://www.53ai.com/news/OpenSourceLLM/2025030368049.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。