Chat with Wiki - SD曝显存

Answer

在使用 SD 进行超大尺寸绘制时，直接调分辨率绘制超高分辨率的图片（如 10000x768 的清明上河图）通常会爆显存。正常尺寸设置最高到 2048，无法直接设置 10000 的宽度。解决方法是先在 PS 中设置所需尺寸的画布并保存为 jpg 图片，然后将图片放入 ControlNet 中，点击右下角箭头将尺寸信息发送到生成设置，填入正反向提示词，并启用 Tiled Diffusion 插件（方案选择 Mixture of Diffusers）防止接缝产生。

在 ComfyUI 中，模型的安装部署方面，FLUX 模型建议选择 dev 版本，显卡可以的用 fp16，显卡不够用的选 fp8，模型下载后放入 ComfyUI/models/unet/文件夹中。若爆显存，“UNET 加载器”节点中的 weight_dtype 可设置为 fp8 降低显存使用量，但可能稍降质量。clip 模型（t5xxl_fp16.safetensors 和 clip_l.safetensors）放在 ComfyUI/models/clip/文件夹，也可用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率。Vae 模型下载后放入 ComfyUI/models/vae 文件夹。

在生成过程中，ComfyUI 处理 SDXL 模型比 webUI 更有效率。例如，ComfyUI 生成过程中显存占用率为 7 - 9GB，每次生成耗时 13 - 15s；webUI 显存占用率为 8 - 11GB，每次生成耗时 25s。此外，还可对 SDXL 进行风格控制，添加【新建节点】-【实用工具】-【SDXL Promot Styler Advanced】节点，通过右键增加输入点将文本提示词赋予 base 和 refiner 并切换风格。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】超大尺寸绘制、分区控制，详解Tiled Diffusion & VAE插件功能

如果你想用SD来画一幅超高分辨率的图片，比如10000x768的清明上河图，直接调分辨率画是不太可能的，因为这样一定会爆显存。而且正常的尺寸设置，最高也就到2048了，没法设置出10000的宽度来。我们首先需要在PS中设置一个这么大尺寸的画布，然后保存成jpg图片。然后将图片放入ControlNet当中，点击右下角的箭头，将当前图片尺寸信息发送到生成设置，可以看到，我们需要的尺寸就设置好了。填入正反向提示词，这里我使用了一个中国风lora。正向：masterpiece,best quality,qingming riverside map,painting,guofeng,chinese style,<lora:Chinese style illustration v2:1>,反向：lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry分别启用这两个插件，Tiled Diffusion中的方案选择Mixture of Diffusers，这一种方案可以协调分块扩散过程的混合方式，适合用来直接生成大图，防止接缝的产生。

ComfyUI FLUX

FLUX.1[dev]FLUX.1[dev fp8]FLUX.1[schnell],选一个.建议选择dev版本的,显卡可以的用fp16,显卡不够用的选fp8.模型下载后,放入，这个文件应该放在你的：ComfyUI/models/unet/文件夹中。如果爆显存了,“UNET加载器”节点中的weight_dtype可以控制模型中权重使用的数据类型,设置为fp8，这将使显存使用量降低一半，但可能会稍微降低质量.默认下的weight_type,显存使用比较大.[heading4]clip[content]t5xxl_fp16.safetensors和clip_l.safetensors,放在ComfyUI/models/clip/文件夹里面.https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main可以使用t5xxl_fp8_e4m3fn.safetensors来降低内存使用率，但是如果你有超过32GB内存，建议使用fp16[heading4]Vae[content]下载后,放入ComfyUI/models/vae文件夹https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main[heading3][heading3]T5（/t5xxl_fp16.safetensors）的这个clip，[content]原本是有一个输入输出的。就是有一半是应该空着的。会导致提示词被吞的情况，就是可能会有一半的提示词被吞掉了。所以短提示的效果会比较差。我们在训练flux或者sd3时候，应该尽量的去用长提示词或者自然语言。不要用短提示词。因为T5自带了50%的删标。

【ComfyUI】使用ComfyUI玩SDXL的正确打开方式

在生成过程中，显存的占用率为7-9GB。从后台可以看到，每一次生成的耗时在13-15s之间。我使用同样的参数来测试一下webUI。在生成过程中，显存的占用率为8-11GB。从后台可以看到，每一次生成的耗时在25s之间。可以看出，comfyui在处理sdxl的模型是，确实要比webui更有效率一些。可能有些朋友已经被这个节点绕得有点晕了，但是还没结束。接下来，我们再试一试sdxl的风格控制，添加【新建节点】-【实用工具】-【SDXL Promot Styler Advanced】节点。我们可以看到，在这个节点上有两套正负向提示词，分别对应着base和refiner。点击右键，分别增加g和l作为输入点。这样，我们就可以通过这一个节点将文本提示词分别赋予到base和refiner上，同时也把风格的切换加进了工作流当中。点击这里的【style】就可以看到各种风格了，不过都是英文的。我这里有一份中英文对照的表，大家也可以参考一下，一共105种风格，我会把它放在网盘里。选一个黏土风格进行测试，尺寸设置为1280*768，用时15.11。同样的参数，我在webui里跑了一下，用时3分33秒。