Chat with Wiki - 飞书文档如何作为知识库输入到coze平台

Answer

要将飞书文档作为知识库输入到 Coze 平台，主要有以下步骤：

在线知识库：
- 点击创建知识库，创建一个画小二课程的 FAQ 知识库。
- 选择飞书文档，选择自定义的自定义，输入###。
- 飞书的文档内容会以###区分开来，可以点击编辑修改和删除。
- 点击添加 Bot，添加好可以在调试区测试效果。
本地文档：
- 注意如何拆分内容，提高训练数据准确度，将海报的内容训练的知识库里面。
- 画小二这个课程 80 节课程，分为了 11 个章节，不能一股脑全部放进去训练。
- 正确的方法是首先将 11 章的大的章节名称内容放进来，章节内详细内容按固定方式进行人工标注和处理。
- 然后选择创建知识库自定义清洗数据。
发布应用：
- 点击发布，确保在 Bot 商店中能够搜到。

此外，创建知识库并上传文本内容有以下方式：

在线数据：
- 自动采集方式：适用于内容量大，需要批量快速导入的场景。
  - 在文本格式页签下，选择在线数据，然后单击下一步。
  - 单击自动采集。
  - 单击新增 URL。在弹出的页面完成输入要上传的网站地址、选择是否需要定期同步网站内容及周期等操作。
  - 当上传完成后单击下一步，系统会自动根据网站的内容进行内容分片。
- 手动采集方式：适用于需要精准采集网页上指定内容的场景。
  - 安装扩展程序，详情请参考安装 Coze Scraper。
  - 在文本格式页签下，选择在线数据，然后单击下一步。
  - 点击手动采集，然后在弹出的页面点击权限授予完成授权。
  - 在弹出的页面输入要采集内容的网址，然后单击确认。
  - 在弹出的页面上，点击页面下方文本标注按钮，开始标注要提取的内容，然后单击文本框上方的文本或链接按钮。
  - 单击查看数据查看已采集的内容，确认无误后再点击完成并采集。

Coze 的知识库功能不仅支持上传和存储外部知识内容，还提供了多样化的检索能力，主要包括两大核心能力：一是能够存储和管理外部数据；二是增强检索能力。Coze 支持从多种数据源，如本地文档、在线数据、Notion、飞书文档等渠道上传文本和表格数据。上传后，系统会自动将知识内容切分成多个片段进行存储，并允许用户自定义内容分片规则。Coze 还提供了多种检索方式来对存储的内容片段进行高效检索，例如全文检索可以通过关键词快速找到相关的内容片段并召回。基于这些召回的内容片段，大模型将生成最终的回复内容。Coze 支持上传文本内容及结构化表格数据，以适应各种使用场景。

Content generated by AI large model, please carefully verify (powered by aily)

References

【智能体】让Coze智能体机器人连上微信和微信群详细配置文档

本次创建知识库使用手动清洗数据，上节课程是自动清洗数据：[【智能体】用Coze在微信里搭建一个机器人，还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况，本节视频就尝试使用手动清洗数据，提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库，创建一个画小二课程的FAQ知识库知识库的飞书在线文档，其中每个问题和答案以###分割，暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来，这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件，这里要注意了~~~如何拆分内容，提高训练数据准确度，将海报的内容训练的知识库里面画小二这个课程80节课程，分为了11个章节，那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法，首先将11章的大的章节名称内容放进来，如下图所示。章节内详细内容格式如下如所示，如果你再分节的内容，依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据，这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到，如图所示可以搜索到画小二智能小助手，这个很重要，没有通过发布的获取不到API的。

创建并使用知识库

|上传方式|操作步骤||-|-||在线数据|扣子支持自动抓取指定URL的内容，也支持手动采集指定页面上的内容，上传到数据库。 自动采集方式：该方式适用于内容量大，需要批量快速导入的场景。 1.在文本格式页签下，选择在线数据，然后单击下一步。 2.单击自动采集。 3.单击新增URL。在弹出的页面完成以下操作： 3.1.输入要上传的网站地址。 3.2.选择是否需要定期同步网站内容，如果需要选择内容同步周期。 3.3.单击确认。 4.当上传完成后单击下一步。 系统会自动根据网站的内容进行内容分片。 手动采集：该方式适用于需要精准采集网页上指定内容的场景 1.安装扩展程序，详情请参考[安装Coze Scraper](https://www.coze.cn/docs/guides/scraper)。 2.在文本格式页签下，选择在线数据，然后单击下一步。 3.点击手动采集，然后在弹出的页面点击权限授予完成授权。 4.在弹出的页面输入要采集内容的网址，然后单击确认。 5.在弹出的页面上，点击页面下方文本标注按钮，开始标注要提取的内容，然后单击文本框上方的文本或链接按钮。 6.单击查看数据查看已采集的内容，确认无误后再点击完成并采集。 |

蓝衣剑客：四万字长文带你通学扣子

详细内容可至Coze官方手册了解：https://www.Coze.cn/docs/guides/knowledge[heading3]3.1知识库[content]Coze的知识库功能不仅支持上传和存储外部知识内容，还提供了多样化的检索能力。这一功能特别设计来解决大模型可能出现的幻觉问题和专业领域知识的不足，显著提升了大模型回复的准确性。Coze的知识库主要包括两大核心能力：一是能够存储和管理外部数据；二是增强检索能力。数据管理与存储Coze支持从多种数据源，如本地文档、在线数据、Notion、飞书文档等渠道上传文本和表格数据。上传后，系统会自动将知识内容切分成多个片段进行存储，并允许用户自定义内容分片规则，比如通过分段标识符或字符长度等方式进行内容分割。增强检索此外，Coze还提供了多种检索方式来对存储的内容片段进行高效检索，例如全文检索可以通过关键词快速找到相关的内容片段并召回。基于这些召回的内容片段，大模型将生成最终的回复内容。应用场景Coze支持上传文本内容及结构化表格数据，以适应各种使用场景。例如，在创建虚拟形象与用户交流时，你可以将相关语料保存在知识库中。后续Bot将通过向量匹配召回最相关语料，并模仿该虚拟形象的语言风格进行回答。在客服场景中，将用户常见问题和产品使用手册等信息上传至Coze知识库中，Bot可以利用这些信息精准地解答用户疑问。对于特定行业应用，如汽车领域，你可以创建包含各种车型详终参数的数据库，在用户查询特定车型信息时，Bot可通过召回相关记录进一步提供精确信息，如百公里油耗等详情。