SD 模型-WayToAGI

回答

以下是关于 SD 模型的相关信息：

模型安装设置：二维码做好后进入 SD 版块，需下载两个 SD 的 ControlNET 模型和一个预处理器。可添加公众号【白马与少年】，回复【SD】获取。在【QR ControlNET】文件夹中，后缀为【.yaml】的放在“……\sd-webui-aki-v4.2\extensions\sd-webui-controlnet\models”路径下，后缀为【.safetensors】的放在“……\sd-webui-aki-v4.2\models\ControlNet”路径下。选择“cheeseDaddys ”模型，填入描绘梦幻森林的关键词，同时将迭代步数(Steps)设置到 15，采样选择 DPM++ 2M Karras，图像大小设置到 768*768。

核心基础原理：

SD 模型是生成式模型，输入可以是图片、文本以及两者的结合，输出是生成的图片。
属于扩散模型，其整体逻辑特点是过程分步化与可迭代，为生成过程引入更多约束与优化提供可能。
是基于 Latent 的扩散模型，将输入数据压缩到 Latent 隐空间中，大幅提高计算效率并降低显存占用，是破圈关键。
从 CTO 视角看，是一个优化噪声的 AI 艺术工具。

工作流程： Stable Diffusion（SD）模型由 Stability AI 和 LAION 等公司共同开发，参数量约 1B，可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。以文生图（txt2img）和图生图（img2img）任务为例，文生图任务是将一段文本输入到 SD 模型中，经过一定迭代次数，输出符合文本描述的图片；图生图任务在输入文本基础上再输入一张图片，SD 模型根据文本提示将输入图片重绘以更符合文本描述。输入的文本信息需转化为 SD 模型能理解的机器数学信息。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

【SD】今天就学会！专属AI二维码订制

二维码做好之后，我们进入SD的版块，需要下载两个SD的ControlNET模型和一个预处理器，我已经打包好了，可以添加我的公众号【白马与少年】，回复【SD】就发给你。在【QR ControlNET】的文件夹中，后缀为【.yaml】的放在“……\sd-webui-aki-v4.2\extensions\sd-webui-controlnet\models”这个路径下，后缀为【.safetensors】的放在“……\sd-webui-aki-v4.2\models\ControlNet”这个路径下。我这边随便选择一个“cheeseDaddys ”的模型，填入一段描绘梦幻森林的关键词。在这个美化二维码的过程中，关键词是非常重要的。接着，我们把迭代步数(Steps)设置到15，采样选择DPM++ 2M Karras，图像大小设置到768*768。

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

1.SD模型是生成式模型，输入可以是图片，文本以及两者的结合，输出是生成的图片。2.SD模型属于扩散模型，扩散模型的整体逻辑的特点是过程分步化与可迭代，这给整个生成过程引入更多约束与优化提供了可能。3.SD模型是基于Latent的扩散模型，将输入数据压缩到Latent隐空间中，比起常规扩散模型，大幅提高计算效率的同时，降低了显存占用，成为了SD模型破圈的关键一招。4.站在CTO视角，将维度拉到最高维，Rocky认为SD模型是一个优化噪声的AI艺术工具。

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

Stable Diffusion（SD）模型是由Stability AI和LAION等公司共同开发的生成式模型，总共有1B左右的参数量，可以用于文生图，图生图，图像inpainting，ControlNet控制生成，图像超分等丰富的任务，本节中我们以文生图（txt2img）和图生图（img2img）任务展开对Stable Diffusion模型的工作流程进行通俗的讲解。文生图任务是指将一段文本输入到SD模型中，经过一定的迭代次数，SD模型输出一张符合输入文本描述的图片。比如下图中输入了“天堂，巨大的，海滩”，于是SD模型生成了一个美丽沙滩的图片。SD模型的文生图（txt2img）过程而图生图任务在输入本文的基础上，再输入一张图片，SD模型将根据文本的提示，将输入图片进行重绘以更加符合文本的描述。比如下图中，SD模型将“海盗船”添加在之前生成的那个美丽的沙滩图片上。SD模型的图生图（img2img）过程那么输入的文本信息如何成为SD模型能够理解的机器数学信息呢？