Chat with Wiki - 我是小白，建立个人知识库，我应该怎么做

Answer

以下是建立个人知识库的一些方法：

使用 GPT 打造个人知识库：
- 将文本拆分成若干小文本块（chunk）。
- 通过 embeddings API 将小文本块转换成与语义相关的 embeddings 向量，并在向量储存库中保存这些向量和文本块作为问答的知识库。
- 当用户提出问题时，将问题转换成向量，与向量储存库中的向量比对，提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。
按照张梦飞的【知识库】FastGPT+OneAPI+COW 带有知识库的机器人完整教程：
- 地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/。
- 点击文件夹上方功能栏中的【终端】（注意不是左侧一级菜单里的终端，是文件夹上方那一行的终端电脑）。
- 粘贴进入，点击回车。点击后，关闭此弹窗。
- 执行命令：cp config-template.json config.json 。
- 刷新页面，在当前目录下找到 config.json 文件进行修改。
- 删除文件里的所有代码，复制提供的代码并粘贴到文件里，修改第 4、5 行的 API 和 key 后保存并关闭文件。
手把手教你本地部署大模型以及搭建个人知识库：
- 若要更灵活掌控知识库，可使用额外软件 AnythingLLM，其包含所有 Open WebUI 的能力，并额外支持选择文本嵌入模型和向量数据库。
- 安装地址：https://useanything.com/download 。
- 安装完成后进入配置页面，主要分为三步：选择大模型、选择文本嵌入模型、选择向量数据库。
- 在 AnythingLLM 中有 Workspace 的概念，可创建独有的 Workspace 与其他项目数据隔离。
- 首先创建一个工作空间，上传文档并在工作空间中进行文本嵌入，选择对话模式（Chat 模式：大模型根据训练数据和上传的文档综合给出答案；Query 模式：大模型仅依靠文档中的数据给出答案），完成配置后即可进行测试对话。

总之，建立个人知识库需要根据您的具体需求和技术水平选择合适的方法，并进行相应的操作和配置。

Content generated by AI large model, please carefully verify (powered by aily)

References

上面将文本转换成向量（一串数字）能大大节省空间，它不是压缩，可简单理解为索引(Index)。接下来就有意思了。比如我有一个大文本，可以先把它拆分成若干个小文本块（也叫chunk)，通过embeddings API将小文本块转换成embeddings向量,这个向量是跟文本块的语义相关。在一个地方（向量储存库）中保存这些embeddings向量和文本块，作为问答的知识库。当用户提出一个问题时，该问题先通过embeddings API转换成问题向量，然后将这问题向量与向量储存库的所有文本块向量比对，查找距离最小的几个向量，把这几个向量对应的文本块提取出来，与原有问题组合成为新的prompt(问题/提示词)，发送给GPT API。这样一来就不用一次会话中输入所有领域知识，而是输入了关联度最高的部分知识。一图胜千言，转一张原理图。再举一个极其简单的例子，比如有一篇万字长文，拆分成Chrunks包含：文本块1：本文作者：越山。xxxx。文本块2：公众号越山集的介绍：传播效率方法，分享AI应用，陪伴彼此在成长路上，共同前行。文本块3：《反脆弱》作者塔勒布xxxx。文本块4：“科技爱好者周刊”主编阮一峰会记录每周值得分享的科技内容，周五发布。...文本块n如果提问是”此文作者是谁？“。可以直观的看出上面的文本块1跟这个问题的关联度最高，文本块3次之。通过比较embeddings向量也可以得到这结论。那最后发送给GPT API的问题会类似于”此文作者是谁？从以下信息中获取答案：本文作者：越山。xxxx。《反脆弱》作者塔勒布xxxx。“这样一来，大语言大概率能回答上这个问题。

张梦飞：【知识库】FastGPT+OneAPI+COW带有知识库的机器人完整教程

[title]张梦飞：【知识库】FastGPT+OneAPI+COW带有知识库的机器人完整教程[heading1]六、创建知识库应用1、地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/7、点击文件夹上方功能栏中的【终端】（注意，不是左侧一级菜单里的终端，是文件夹上方那一行的终端电脑）8、粘贴进入，点击回车。点击后，关闭此弹窗。cp config-template.json config.json9、刷新页面。在当前目录下，找到config.json文件。如下图：10、双击这个文件，我画红框的地方是需要修改的地方。*因为这个地方对格式和符合要求比较严格，如果是小白，建议你直接复制我下方的配置。11、删除上图文件里的所有代码。复制下边的代码，粘贴到文件里。粘贴后，找到第4、5行，把刚才FastGPT里拿到API和key，根据要求粘贴到双引号里。这也是你唯一需要修改的地方。修改完之后，点击保存，关闭文件。

手把手教你本地部署大模型以及搭建个人知识库

如果想要对知识库进行更加灵活的掌控，我们需要一个额外的软件：AnythingLLM。这个软件包含了所有Open WebUI的能力，并且额外支持了以下能力选择文本嵌入模型选择向量数据库[heading2]AnythingLLM安装和配置[content]安装地址：https://useanything.com/download当我们安装完成之后，会进入到其配置页面，这里面主要分为三步1.第一步：选择大模型1.第二步：选择文本嵌入模型1.第三步：选择向量数据库[heading2]构建本地知识库[content]AnythingLLM中有一个Workspace的概念，我们可以创建自己独有的Workspace跟其他的项目数据进行隔离。1.首先创建一个工作空间1.上传文档并且在工作空间中进行文本嵌入1.选择对话模式AnythingLLM提供了两种对话模式：Chat模式：大模型会根据自己的训练数据和我们上传的文档数据综合给出答案Query模式：大模型仅仅会依靠文档中的数据给出答案1.测试对话当上述配置完成之后，我们就可以跟大模型进行对话了[heading1]六、写在最后[content]我非常推崇的一句话送给大家：看十遍不如实操一遍，实操十遍不如分享一遍如果你也对AI Agent技术感兴趣，可以联系我或者加我的免费知识星球（备注AGI知识库）