Chat with Wiki - 本地化部署

Answer

以下是关于本地化部署的相关内容：

SDXL 的本地化部署： SDXL 的大模型分为两个部分：

第一部分，base+refiner 是必须下载的，base 是基础模型，用于文生图操作；refiner 是精炼模型，用于对文生图生成的模型进行细化，生成细节更丰富的图片。
第二部分，SDXL 还有一个配套的 VAE 模型，用于调节图片的画面效果和色彩。

这三个模型的下载链接可关注公众号【白马与少年】，回复【SDXL】获取。

在 webUI 中使用 SDXL 大模型，需先在秋叶启动器中将 webUI 的版本升级到 1.5 以上。然后将模型放入对应的文件夹中，base 和 refiner 放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下；vae 放在“……\sd-webui-aki-v4.2\models\VAE”路径下。完成后启动 webUI，即可在模型中看到 SDXL 的模型。

正常使用方法：先在文生图中使用 base 模型，填写提示词和常规参数，尺寸可设为 1024*1024 进行生成。生成图片后，可将其发送到图生图中，大模型切换为“refiner”，重绘幅度开小一点，再次点击生成。

对于配置较高的电脑，如显卡为 4080ti，生成时间约在十秒左右。配置较低的需自行测试。

还可安装 refine 插件，在扩展列表中搜索 refine 并安装，重启后可在文生图界面直接使用 refine 模型进行绘画。

Google Gemma 的本地化部署： Google 发布的家用版小模型 Gemma 有 2b（20 亿参数）和 7b（70 亿参数）版本。

部署环境准备：

首先提一下 Ollama，它是一个开源的大型语言模型服务，可方便地部署最新版本的 GPT 模型并通过接口使用，支持热加载模型文件，无需重新启动即可切换不同的模型。
进入 ollama.com，下载程序并安装（支持 windows，linux 和 macos）。
查找 cmd 进入命令提示符，输入 ollama -v 检查版本，安装完成后版本应显示 0.1.26。
输入 cls 清空屏幕，然后直接输入 ollama run gemma 运行模型（默认是 2b），首次需下载，等待一段时间。若想用 7b，运行 ollama run gemma:7b。完成后即可直接对话，2 个模型都安装后，可重复上述指令切换。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】向未来而生，关于SDXL你要知道事儿

SDXL的大模型分为两个部分：第一部分，base+refiner是必须下载的，base是基础模型，我们使用它进行文生图的操作；refiner是精炼模型，我们使用它对文生图中生成的模型进行细化，生成细节更丰富的图片。第二部分，是SDXL还有一个配套的VAE模型，用于调节图片的画面效果和色彩。这三个模型，我已经放入了云盘链接中，大家可以关注我的公众号【白马与少年】，然后回复【SDXL】获取下载链接。想要在webUI中使用SDXL的大模型，首先我们要在秋叶启动器中将webUI的版本升级到1.5以上。接下来，将模型放入对应的文件夹中，base和refiner放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下；vae放在“……\sd-webui-aki-v4.2\models\VAE”路径下。完成之后，我们启动webUI，就可以在模型中看到SDXL的模型了。我们正常的使用方法是这样的：先在文生图中使用base模型，填写提示词和常规参数，尺寸可以设置为1024*1024，进行生成。我这边使用了一个最简单的提示词“1girl”，来看看效果。生成的图片大家可以看一下，我觉得是相当不错的。

【SD】向未来而生，关于SDXL你要知道事儿

我知道大家心里可能会想——“就这，还好吧，也没有那么惊艳吧？”，那么，我用同样的参数再给你画一幅sd1.5版本的图像，你就能看出进步有多大了。是不是没有对比就没有伤害？SDXL，真香！还没完，我们到现在还只使用了一个base模型，接下来，将图片发送到图生图当中，大模型切换为“refiner”，重绘幅度开小一点，再次点击生成。可以看到细节又提升了不少，可惜的是，现在还不能配合tile来使用。在生成时间上，我的显卡是4080ti，速度在十秒左右。所以sdxl对于高配电脑还是可以接受的，但配置较低的朋友需要自己去测试一下了。当然，有人可能会说，这个操作好麻烦，生成一张图要去两个界面来回倒腾。在这里，我给大家再介绍一款插件。我们来到扩展列表中，搜索refine，点击安装插件，然后重启。启用这个插件，就可以让我们在文生图的界面直接使用refine模型，进一步到位的绘画。我填写一段正向提示词：a girl looks up at the sky in the city of cyberpunk,close-up,wearing a helmet,fantasy elements,game original,starry_sky,点击生成，生产过程中的显存使用情况，显存基本跑满。

[应用开发] 本地部署Google Gemma

Google刚刚发布了家用版的小模型Gemma，分别为2b（20亿参数）和7b（70亿参数）版本。相对千亿参数的大模型，这种小模型可能不适合解决特别复杂的任务，但是从趋势上看应该是模型本地化提升基础操作效率的模板。类似之前国内发布的ChatGLM-6B。现在的部署环境比一年前要友好多了，首先提一下Ollama，Ollama是一个开源的大型语言模型服务，可以非常方便地部署最新版本的GPT模型并通过接口使用，支持热加载模型文件,无需重新启动即可切换不同的模型。除了Gemma，像小型的llama也支持本地部署。环境准备首先进入ollama.com，下载程序并安装（支持windows，linux和macos）查找cmd进入命令提示符，输入ollama -v检查版本，安装完成后版本应该显示0.1.26cls清空屏幕，接下来直接输入ollama run gemma运行模型（默认是2b），首次需要下载，需要等待一段时间，如果想用7b，运行ollama run gemma:7b完成以后就可以直接对话了，2个模型都安装以后，可以重复上面的指令切换。