Chat with Wiki - 如何建立知识库

Answer

以下是建立知识库的详细步骤：

选择“Manage Your Knowledge Base”，进入知识库管理页面。
在页面左上角点击加号，添加新的知识库。
给知识库起一个易于分辨的名字。
点击添加文件，建议使用 Markdown 格式的文件。
等待 Flowith 对文件进行抽取等处理。
处理完毕后，可在知识库管理页面测试检索。

另外，还可以通过以下方式创建知识库并上传表格数据：

在页面顶部进入知识库页面，单击创建知识库。
在弹出的页面配置知识库名称、描述，单击确认（团队内知识库名称需唯一）。
在单元页面，单击新增单元。
在弹出的页面，选择表格格式，然后选择本地文件或 API 的方式完成数据上传。

在 Coze 中创建知识库：

来到个人空间，找到知识库导航栏，点击创建知识库。
选择知识库的格式（目前支持文档、表格、图片），填写相关信息。
可选择本地文档、自定义的文档切割等。
数据处理完成后，一个问答对会被切割成一个文档片。

关于使用知识库，可参考教程：大圣：胎教级教程：万字长文带你使用 Coze 打造企业级知识库

Content generated by AI large model, please carefully verify (powered by aily)

References

详解：flowith

来自flowith的朋友——玉树芝兰，王树义教授[heading4]构建[content]立即开始尝试构建知识库。方法是选择"Manage Your Knowledge Base"，进入知识库管理页面。然后选择左上角的加号，添加新的知识库。你可以随意给知识库起个名。但是强烈建议你起个自己后来能分辨的名字，不然使用的时候会不方便找寻。下面，你就可以点击添加文件。建议使用Markdown格式的文件。一般情况平时发布的文章，存储的都是这种格式。它其实就是带标记的纯文本，比较符合大语言模型的偏好。接着，你会看到Flowith开始忙活，逐个文件进行抽取（Extraction）等处理。你根本无需操心它是怎么做的。关上页面，等处理好了再说。过了一会儿，处理完毕。我点开其中某一个文件看看。处理过后它包含3个seeds，也就是因为长度关系，切分成了3个部分。你可以在知识库管理页面测试检索。例如我这里输入「卡片」，就可以过滤出与「卡片」直接相关的发布文章内容。这就是知识库的构建方法——新建、拖拽、等待、搞定。按照类似的逻辑，王教授分别构建了「《玉树芝兰》公众号文章」和「《玉树芝兰》知识星球文章」两个知识库。知识库构建好了，咱们尝试一下问答吧。

创建并使用知识库

你可以通过本地文件或API的方式上传结构化的表格数据到知识库中。上传后的数据会直接按照索引列进行分片。参考以下操作，创建知识库并上传表格数据。1.在页面顶部进入知识库页面，并单击创建知识库。2.在弹出的页面配置知识库名称、描述，并单击确认。一个团队内的知识库名称不可重复，必须是唯一的。1.在单元页面，单击新增单元。2.在弹出的页面，选择表格格式，然后选择一种上传方式完成数据上传。

这可能是讲 Coze 的知识库最通俗易懂的文章了

讲了一大堆，终于到了实战的环节了。这里我虽然使用Coze举例子，但是我希望可以帮助你举一反三，未来在接触到FastGPT、Dify等等AI Agent工具的时候都能快速的上手知识库组件。因为你了解了RAG的本质之后，无论什么知识库工具，本质都是一个皮而已！这些也是写这篇文章的目的：让你做到知其然，知其所以然[heading2]创建知识库[content]1.来到个人空间，找到知识库导航栏，点击创建知识库这里我想说明的是，知识库是共享资源，也就是你的多个Bot可以引用同一个知识库1.选择知识库的格式，填写一些信息目前（2024.06.08）Coze支持三种格式文档表格（CSV、Excel等）图片（其实就是上传一张图片，然后填写个图片文字说明）这里格式并不重要，重要的是你要看懂上个章节讲的：影响RAG输出质量的因素1.我这里选择本地文档（问答对可以选择表格）[购买后新人常见问题汇总.txt](https://bytedance.feishu.cn/space/api/box/stream/download/all/FNqobmfgBo5eGHxfZJ1cbOJ9n1H?allow_redirect=1)1.选择自定义的文档切割1.数据处理完成当数据处理完成后，你会发现，一个问答对被切割成一了一个文档片[heading2]使用知识库[content]关于使用知识库，大家可以看这篇教程：[大圣：胎教级教程：万字长文带你使用Coze打造企业级知识库](https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb)，这篇文章已经讲的很详细了，这里就不再赘述了