以下是关于 SD 模型的相关信息:
模型安装设置: 二维码做好后进入 SD 版块,需下载两个 SD 的 ControlNET 模型和一个预处理器。可添加公众号【白马与少年】,回复【SD】获取。在【QR ControlNET】文件夹中,后缀为【.yaml】的放在“……\sd-webui-aki-v4.2\extensions\sd-webui-controlnet\models”路径下,后缀为【.safetensors】的放在“……\sd-webui-aki-v4.2\models\ControlNet”路径下。选择“cheeseDaddys ”模型,填入描绘梦幻森林的关键词,同时将迭代步数(Steps)设置到 15,采样选择 DPM++ 2M Karras,图像大小设置到 768*768。
核心基础原理:
工作流程: Stable Diffusion(SD)模型由 Stability AI 和 LAION 等公司共同开发,参数量约 1B,可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。以文生图(txt2img)和图生图(img2img)任务为例,文生图任务是将一段文本输入到 SD 模型中,经过一定迭代次数,输出符合文本描述的图片;图生图任务在输入文本基础上再输入一张图片,SD 模型根据文本提示将输入图片重绘以更符合文本描述。输入的文本信息需转化为 SD 模型能理解的机器数学信息。
二维码做好之后,我们进入SD的版块,需要下载两个SD的ControlNET模型和一个预处理器,我已经打包好了,可以添加我的公众号【白马与少年】,回复【SD】就发给你。在【QR ControlNET】的文件夹中,后缀为【.yaml】的放在“……\sd-webui-aki-v4.2\extensions\sd-webui-controlnet\models”这个路径下,后缀为【.safetensors】的放在“……\sd-webui-aki-v4.2\models\ControlNet”这个路径下。我这边随便选择一个“cheeseDaddys ”的模型,填入一段描绘梦幻森林的关键词。在这个美化二维码的过程中,关键词是非常重要的。接着,我们把迭代步数(Steps)设置到15,采样选择DPM++ 2M Karras,图像大小设置到768*768。
1.SD模型是生成式模型,输入可以是图片,文本以及两者的结合,输出是生成的图片。2.SD模型属于扩散模型,扩散模型的整体逻辑的特点是过程分步化与可迭代,这给整个生成过程引入更多约束与优化提供了可能。3.SD模型是基于Latent的扩散模型,将输入数据压缩到Latent隐空间中,比起常规扩散模型,大幅提高计算效率的同时,降低了显存占用,成为了SD模型破圈的关键一招。4.站在CTO视角,将维度拉到最高维,Rocky认为SD模型是一个优化噪声的AI艺术工具。
Stable Diffusion(SD)模型是由Stability AI和LAION等公司共同开发的生成式模型,总共有1B左右的参数量,可以用于文生图,图生图,图像inpainting,ControlNet控制生成,图像超分等丰富的任务,本节中我们以文生图(txt2img)和图生图(img2img)任务展开对Stable Diffusion模型的工作流程进行通俗的讲解。文生图任务是指将一段文本输入到SD模型中,经过一定的迭代次数,SD模型输出一张符合输入文本描述的图片。比如下图中输入了“天堂,巨大的,海滩”,于是SD模型生成了一个美丽沙滩的图片。SD模型的文生图(txt2img)过程而图生图任务在输入本文的基础上,再输入一张图片,SD模型将根据文本的提示,将输入图片进行重绘以更加符合文本的描述。比如下图中,SD模型将“海盗船”添加在之前生成的那个美丽的沙滩图片上。SD模型的图生图(img2img)过程那么输入的文本信息如何成为SD模型能够理解的机器数学信息呢?