以下是关于知识库的相关内容:
智能体创建:
概述: 扣子提供了几种存储和记忆外部数据的方式,以便 Bot 精准回复用户。知识库是大量知识分片,通过语义匹配为模型补充知识,以车型数据为例,每个知识库分段保存一种车型基础数据。同时还介绍了数据库、AI 便签、单词本等。
智能体“竖起耳朵听”: 扣子的知识库功能强大,可上传和存储外部知识内容,提供多种查找知识的方法,解决大模型有时出现的幻觉或专业领域知识不足的问题。在该智能体中使用了自己的知识库,收集了很多地道口语表达的短句,知识库可包含多种格式文件,此例中只用了文本格式,智能体回答用户时会先检索知识库内容。还可添加开场白提升体验。
本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。
扣子提供了以下几种方式来存储和记忆外部数据,这样Bot便可以使用这些外部数据来精准回复用户。知识库:是大量知识分片,通过语义匹配,给模型补充知识。以车型数据为例,每个知识库的分段中,保存了一种车型的基础数据。当用户问宝马X3的售价是多少?,能匹配到对应车型的分段,然后模型从中获取到售价信息。数据库:类似传统软件开发的数据库功能,以表格结构存储信息,通过NoSQL方式使用。目前提供的是关系型数据库,下面列举一些应用场景:AI便签:记录用户提交的便签,支持提交、查询操作,这些操作都是通过NL2SQL完成。单词本:记录用户背过哪些单词,其中哪些单词还没有记住等。
扣子的知识库功能很强大,它可以帮你上传和存储外面的知识内容,并且提供了很多种查找知识的方法。如果你的大模型有时候会出现幻觉,或者在某些专业领域知识不够,扣子的知识能力就能帮你解决这个问题,让你的大模型回复得更准确。在我的智能体里面,我用到了自己的知识库,我收集了很多关于地道口语表达的短句,知识库可以包含很多格式的文件,我只用了文本格式,有了自己的知识库,当智能体回答用户的时候会首先检索自己的知识库内容。👉开场白为了体验更好,我们还可以添加一段开场白,告诉用户我们是这个智能体是干什么的?我的开场白:想象一下,当你能够流畅地与世界各地的朋友交流,当你能够用英文表达内心的情感与思考,当你能够欣赏英文诗歌的韵律与美感,那种成就感与喜悦将会如泉水般涌上心头。英语口语,它不仅仅是一种交流的工具,更是一种文化的载体,一种思维的表达,一种与世界对话的桥梁。给我一个日常对话场景,我将还你一句地道口语表达...🎤那么,你的场景是...?