Chat with Wiki - 本地部署

Answer

SDXL 的本地部署步骤如下：

模型下载：SDXL 的大模型分为两个部分，第一部分 base+refiner 是必须下载的，base 是基础模型用于文生图操作，refiner 是精炼模型用于细化图片生成细节更丰富的图片；还有一个配套的 VAE 模型用于调节图片的画面效果和色彩。您可以关注公众号【白马与少年】，回复【SDXL】获取下载链接。
版本升级：在秋叶启动器中将 webUI 的版本升级到 1.5 以上。
放置模型：将 base 和 refiner 放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下，vae 放在“……\sd-webui-aki-v4.2\models\VAE”路径下。
启动使用：启动 webUI 后即可在模型中看到 SDXL 的模型。正常使用时，先在文生图中使用 base 模型填写提示词和常规参数生成图片，然后将图片发送到图生图中切换大模型为“refiner”重绘。
插件使用：可在扩展列表中搜索 refine 安装插件并重启，启用后可在文生图界面直接使用 refine 模型绘画。

另外，关于本地部署资讯问答机器人，实现 Langchain+Ollama+RSSHub 的 RAG 步骤包括：

导入依赖库：加载所需的库和模块，如 feedparse 用于解析 RSS 订阅源，ollama 用于在 python 程序中跑大模型（使用前确保 ollama 服务已开启并下载好模型）。
从订阅源获取内容：从指定的 RSS 订阅 url 提取内容，通过专门的文本拆分器将长文本拆分成较小的块，并附带相关元数据，最终合并成列表返回。
为文档内容生成向量：使用文本向量模型 bge-m3，从 hf 下载好模型放置在指定路径，通过函数利用 FAISS 创建高效的向量存储。

Content generated by AI large model, please carefully verify (powered by aily)

References

SDXL的大模型分为两个部分：第一部分，base+refiner是必须下载的，base是基础模型，我们使用它进行文生图的操作；refiner是精炼模型，我们使用它对文生图中生成的模型进行细化，生成细节更丰富的图片。第二部分，是SDXL还有一个配套的VAE模型，用于调节图片的画面效果和色彩。这三个模型，我已经放入了云盘链接中，大家可以关注我的公众号【白马与少年】，然后回复【SDXL】获取下载链接。想要在webUI中使用SDXL的大模型，首先我们要在秋叶启动器中将webUI的版本升级到1.5以上。接下来，将模型放入对应的文件夹中，base和refiner放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下；vae放在“……\sd-webui-aki-v4.2\models\VAE”路径下。完成之后，我们启动webUI，就可以在模型中看到SDXL的模型了。我们正常的使用方法是这样的：先在文生图中使用base模型，填写提示词和常规参数，尺寸可以设置为1024*1024，进行生成。我这边使用了一个最简单的提示词“1girl”，来看看效果。生成的图片大家可以看一下，我觉得是相当不错的。我知道大家心里可能会想——“就这，还好吧，也没有那么惊艳吧？”，那么，我用同样的参数再给你画一幅sd1.5版本的图像，你就能看出进步有多大了。是不是没有对比就没有伤害？SDXL，真香！

【SD】向未来而生，关于SDXL你要知道事儿

还没完，我们到现在还只使用了一个base模型，接下来，将图片发送到图生图当中，大模型切换为“refiner”，重绘幅度开小一点，再次点击生成。可以看到细节又提升了不少，可惜的是，现在还不能配合tile来使用。在生成时间上，我的显卡是4080ti，速度在十秒左右。所以sdxl对于高配电脑还是可以接受的，但配置较低的朋友需要自己去测试一下了。当然，有人可能会说，这个操作好麻烦，生成一张图要去两个界面来回倒腾。在这里，我给大家再介绍一款插件。我们来到扩展列表中，搜索refine，点击安装插件，然后重启。启用这个插件，就可以让我们在文生图的界面直接使用refine模型，进一步到位的绘画。我填写一段正向提示词：a girl looks up at the sky in the city of cyberpunk,close-up,wearing a helmet,fantasy elements,game original,starry_sky,点击生成，生产过程中的显存使用情况，显存基本跑满。最终的生成图像用时36秒，效果我觉得非常好，很难想象这是曾经的sd能够直出的效果。然后，我用同样的提示词在midjourney里面进行了生成。从心里的实话来说，我觉得midjourney的美感把握和图像的细节绘制还是要更胜一筹的。但对于SD而言，它的优势并不在于美图直出，而是它强大的可操控性，只要继续在SDXL上去发展，它的未来是不可限量的。

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

|导入依赖库加载所需的库和模块。其中，feedparse用于解析RSS订阅源ollama用于在python程序中跑大模型，使用前请确保ollama服务已经开启并下载好模型|从订阅源获取内容下面函数用于从指定的RSS订阅url提取内容，这里只是给了一个url，如果需要接收多个url，只要稍微改动即可。然后，通过一个专门的文本拆分器将长文本拆分成较小的块，并附带相关的元数据如标题、发布日期和链接。最终，这些文档被合并成一个列表并返回，可用于进一步的数据处理或信息提取任务。|为文档内容生成向量这里，我们使用文本向量模型bge-m3。https://huggingface.co/BAAI/bge-m3bge-m3是智源研究院发布的新一代通用向量模型，它具有以下特点：支持超过100种语言的语义表示及检索任务，多语言、跨语言能力全面领先（M ulti-Lingual）最高支持8192长度的输入文本，高效实现句子、段落、篇章、文档等不同粒度的检索任务（M ulti-Granularity）同时集成了稠密检索、稀疏检索、多向量检索三大能力，一站式支撑不同语义检索场景（M ulti-Functionality）从hf下载好模型之后，假设放置在某个路径/path/to/bge-m3，通过下面函数，利用FAISS创建一个高效的向量存储。|实现RAG