在使用 SD 进行超大尺寸绘制时,直接调分辨率绘制超高分辨率的图片(如 10000x768 的清明上河图)通常会爆显存。正常尺寸设置最高到 2048,无法直接设置 10000 的宽度。解决方法是先在 PS 中设置所需尺寸的画布并保存为 jpg 图片,然后将图片放入 ControlNet 中,点击右下角箭头将尺寸信息发送到生成设置,填入正反向提示词,并启用 Tiled Diffusion 插件(方案选择 Mixture of Diffusers)防止接缝产生。
在 ComfyUI 中,模型的安装部署方面,FLUX 模型建议选择 dev 版本,显卡可以的用 fp16,显卡不够用的选 fp8,模型下载后放入 ComfyUI/models/unet/文件夹中。若爆显存,“UNET 加载器”节点中的 weight_dtype 可设置为 fp8 降低显存使用量,但可能稍降质量。clip 模型(t5xxl_fp16.safetensors 和 clip_l.safetensors)放在 ComfyUI/models/clip/文件夹,也可用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率。Vae 模型下载后放入 ComfyUI/models/vae 文件夹。
在生成过程中,ComfyUI 处理 SDXL 模型比 webUI 更有效率。例如,ComfyUI 生成过程中显存占用率为 7 - 9GB,每次生成耗时 13 - 15s;webUI 显存占用率为 8 - 11GB,每次生成耗时 25s。此外,还可对 SDXL 进行风格控制,添加【新建节点】-【实用工具】-【SDXL Promot Styler Advanced】节点,通过右键增加输入点将文本提示词赋予 base 和 refiner 并切换风格。
如果你想用SD来画一幅超高分辨率的图片,比如10000x768的清明上河图,直接调分辨率画是不太可能的,因为这样一定会爆显存。而且正常的尺寸设置,最高也就到2048了,没法设置出10000的宽度来。我们首先需要在PS中设置一个这么大尺寸的画布,然后保存成jpg图片。然后将图片放入ControlNet当中,点击右下角的箭头,将当前图片尺寸信息发送到生成设置,可以看到,我们需要的尺寸就设置好了。填入正反向提示词,这里我使用了一个中国风lora。正向:masterpiece,best quality,qingming riverside map,painting,guofeng,chinese style,<lora:Chinese style illustration v2:1>,反向:lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry分别启用这两个插件,Tiled Diffusion中的方案选择Mixture of Diffusers,这一种方案可以协调分块扩散过程的混合方式,适合用来直接生成大图,防止接缝的产生。
FLUX.1[dev]FLUX.1[dev fp8]FLUX.1[schnell],选一个.建议选择dev版本的,显卡可以的用fp16,显卡不够用的选fp8.模型下载后,放入,这个文件应该放在你的:ComfyUI/models/unet/文件夹中。如果爆显存了,“UNET加载器”节点中的weight_dtype可以控制模型中权重使用的数据类型,设置为fp8,这将使显存使用量降低一半,但可能会稍微降低质量.默认下的weight_type,显存使用比较大.[heading4]clip[content]t5xxl_fp16.safetensors和clip_l.safetensors,放在ComfyUI/models/clip/文件夹里面.https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main可以使用t5xxl_fp8_e4m3fn.safetensors来降低内存使用率,但是如果你有超过32GB内存,建议使用fp16[heading4]Vae[content]下载后,放入ComfyUI/models/vae文件夹https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main[heading3][heading3]T5(/t5xxl_fp16.safetensors)的这个clip,[content]原本是有一个输入输出的。就是有一半是应该空着的。会导致提示词被吞的情况,就是可能会有一半的提示词被吞掉了。所以短提示的效果会比较差。我们在训练flux或者sd3时候,应该尽量的去用长提示词或者自然语言。不要用短提示词。因为T5自带了50%的删标。
在生成过程中,显存的占用率为7-9GB。从后台可以看到,每一次生成的耗时在13-15s之间。我使用同样的参数来测试一下webUI。在生成过程中,显存的占用率为8-11GB。从后台可以看到,每一次生成的耗时在25s之间。可以看出,comfyui在处理sdxl的模型是,确实要比webui更有效率一些。可能有些朋友已经被这个节点绕得有点晕了,但是还没结束。接下来,我们再试一试sdxl的风格控制,添加【新建节点】-【实用工具】-【SDXL Promot Styler Advanced】节点。我们可以看到,在这个节点上有两套正负向提示词,分别对应着base和refiner。点击右键,分别增加g和l作为输入点。这样,我们就可以通过这一个节点将文本提示词分别赋予到base和refiner上,同时也把风格的切换加进了工作流当中。点击这里的【style】就可以看到各种风格了,不过都是英文的。我这里有一份中英文对照的表,大家也可以参考一下,一共105种风格,我会把它放在网盘里。选一个黏土风格进行测试,尺寸设置为1280*768,用时15.11。同样的参数,我在webui里跑了一下,用时3分33秒。