Cascade 模型是 Stable Diffusion 家族的新成员,具有更高的效率、更大的参数和更快的速度,同时潜空间更小。它在提示对齐和美学质量方面都表现优秀,并且兼容 Controlnet、Lora 等技术。
相比于之前的模型,Cascade 模型的优点包括:
- 更高的效率和速度:训练成本降低 16 倍,同时速度更快。
- 更大的参数和潜空间:编码为 24x24,相比 SD1.5 不牺牲质量。
- 优秀的性能:在提示对齐和美学质量方面表现突出。
- 广泛的兼容性:兼容所有已知的技术,如微调、LoRA、ControlNet、IP Adapter、LCM 等。
然而,Cascade 模型也存在一些缺点,如推理时长较长,限制了许多场景的应用。此外,模型的幻象和错误率仍然较高,在多链路的复杂应用中可能不可行。