要结合 API 建立本地知识库,以下是较为容易的操作步骤:
您也可以选择自定义上传方式:
|上传方式|操作步骤||-|-||API|获取在线API的JSON数据,将JSON数据上传至知识库。<br>1.在表格格式页签下,选择API,然后单击下一步。<br>2.单击新增API。<br>3.输入网址URL并选择数据的更新频率,然后单击下一步。<br>4.输入单元名称或使用自动添加的名称,然后单击下一步。<br>5.配置数据表信息后,单击下一步。<br>5.1.确认表结构:系统已默认获取了表头的列名,你可以自定义修改列名,或删除某一列名。<br>5.2.指定语义匹配字段:选择哪个字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。<br>6.查看表结构和数据,确认无误后单击下一步。<br>7.完成上传后,单击确定。||自定义|手动创建数据表结构和数据。<br>1.在表格格式页面下,选择自定义,然后单击下一步。<br>2.输入单元名称。<br>3.在表结构区域添加字段,单击增加字段添加多个字段。<br>4.设置列名,并选择指定列字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。<br>5.单击确定。<br>6.单击创建分段,然后在弹出的页面输入字段值,然后单击保存。|
你可以通过本地文件或API的方式上传结构化的表格数据到知识库中。上传后的数据会直接按照索引列进行分片。参考以下操作,创建知识库并上传表格数据。1.在页面顶部进入知识库页面,并单击创建知识库。2.在弹出的页面配置知识库名称、描述,并单击确认。一个团队内的知识库名称不可重复,必须是唯一的。1.在单元页面,单击新增单元。2.在弹出的页面,选择表格格式,然后选择一种上传方式完成数据上传。
本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。