Chat with Wiki - 你用的什么大模型

Answer

以下是关于大模型的相关信息：

在 SD 应用中，选择 ControlNet 模型时，将字体参考图放进 ControlNet 中，预处理器可选择 invert 等，注意控制类型的选择，选好预处理可点击预览按钮，然后选择 Control 模型，如 Depth 景深模型或 Scribble 涂鸦模型等，选择好后记得启用 ControlNet。选择生图大模型时，大模型决定最终风格，如生成真实场景下的字体，可选择如 lofi.v2 等大模型，不同大模型对 ControlNet 模型的控制力有不同适应度，需微调参数。
常用的模型网站有：Civitai|Stable Diffusion models,embeddings,hypernetworks and more、Models-Hugging Face、SD-WebUI 资源站、元素法典 AI 模型收集站-AI 绘图指南 wiki(aiguidebook.top)、AI 绘画模型博物馆(subrecovery.top)。下载模型后，大模型（Ckpt）放入 models\Stable-diffusion，VAE 模型放置在 models\Stable-diffusion 或 models\VAE 目录，Lora/LoHA/LoCon 模型放入 extensions\sd-webui-additional-networks\models\lora 或 models/Lora 目录，Embedding 模型放入 embeddings 目录。
大模型指的是用于表达 token 之间关系的参数多，主要是模型中的权重（weight）与偏置（bias），例如 GPT-3 拥有 1750 亿参数。以 Transform 为代表的大模型采用自注意力（Self-attention）机制来学习不同 token 之间的依赖关系，生成高质量 embedding。常见的将 Token 表示成稠密矩阵向量的算法有基于统计的 Word2Vec、GloVe，基于深度网络的 CNN、RNN/LSTM，基于神经网络的 BERT、Doc2Vec 等。

Content generated by AI large model, please carefully verify (powered by aily)

References

这里不是绝对唯一答案，因为很多CN模型能实现相似效果，或者更有故事性的效果的。以比较容易出效果为例：将字体参考图放进ControlNet中，预处理器选择invert（from white bg&black line)，注意控制类型就不要选择预设的了，因为很有可能处理模型不是一一对应的。invert比较适合完全还原字体的细节。当然如果字形本身识别度很高的话，也可以使用Canny等模型。选好预处理可以点击💥按钮预览一下。然后选择Control模型，可以选择Depth景深模型，也可以选择Scribble涂鸦模型，使用Canny描边的预处理这里也可以用Canny的模型，但控制力稍差。选择好之后，记得点击启用，开启ControlNet。[heading1]选择生图大模型[content]插件暂时简单的设置完毕，要选择生图模型了，大模型决定了我们的最终的风格，是真实系，是动画二次元，还是什么，这决定你对模型熟悉程度。生成一个真实场景下的字体，文章开始图片相似的风格，是我的目标，以此为例：经过一些尝试，我选了真人效果卓绝的大模型lofi.v2，（还有一些其他比较真实的模型都可以备选，只是会有一些参数变化需要注意）不同的大模型，会对CN模型的控制力有不同的适应度，所以需要微调参数。

SD新手：入门图文教程

模型能够有效地控制生成的画风和内容。常用的模型网站有：[Civitai|Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models-Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD-WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站-AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下，请注意，不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型（Ckpt）：放入models\Stable-diffusionVAE模型：一些大模型需要配合vae使用，对应的vae同样放置在models\Stable-diffusion或models\VAE目录，然后在webui的设置栏目选择。Lora/LoHA/LoCon模型：放入extensions\sd-webui-additional-networks\models\lora，也可以在models/Lora目录Embedding模型：放入embeddings目录

大模型入门指南

数字化的好处是便于计算机处理。但为了让计算机理解Token之间的联系，还需要把Token表示成稠密矩阵向量，这个过程称之为embedding([3])，常见的算法有：基于统计Word2Vec，通过上下文统计信息学习词向量GloVe，基于词共现统计信息学习词向量基于深度网络CNN，使用卷积网络获得图像或文本向量RNN/LSTM，利用序列模型获得文本向量基于神经网络BERT，基于Transformer和掩码语言建模（Masked LM）进行词向量预训练Doc2Vec，使用神经网络获得文本序列的向量以Transform为代表的大模型采用自注意力（Self-attention）机制来学习不同token之间的依赖关系，生成高质量embedding。大模型的“大”，指的是用于表达token之间关系的参数多，主要是指模型中的权重（weight）与偏置（bias），例如GPT-3拥有1750亿参数，其中权重数量达到了这一量级，而词汇表token数只有5万左右。参考：[How does an LLM"parameter"relate to a"weight"in a neural network?](https://datascience.stackexchange.com/questions/120764/how-does-an-llm-parameter-relate-to-a-weight-in-a-neural-network"How does an LLM"parameter"relate to a"weight"in a neural network?")