Coze 知识库目前存在一些不稳定的情况。例如,在国内版中,某些官方和第三方插件的 API 调用及返回结果不太稳定,可能导致部分信息无法完全显示。但对于以问答为主的客服场景,其表现相对稳定。同时,目前存在不稳定版本,需要不断调试完善。关于保密方面,文中未提及相关内容。
网址:Coze.cn2、创建[heading2]2、人设与回复逻辑设置[content][heading2]3、创建知识库[content]选择文本创建知识库选择飞书,因为我的很多资料都在飞书里面存着[heading3]3.1飞书知识库[content]在飞书里面选择对应的文件夹,一次做多智能选择20个文件(如果文件大于20个可以多建几个知识库)可以选择自动进行数据清洗,数据清洗不是要不数据清楚,而是把数据进行类结构化整理数据清洗进度内容中的图片资料也会保留测试对话,基本反馈正常,目前coze存在不稳定版本,需要不断调试完善。[heading3]3.2 Excel知识库[content]同时也可以增加其他形式的知识库上传表格的知识库不要过于复杂,不要有合并表格情况,同时系统不认不同的Sheet数据处理完成就显示100%进度加工出来的数据,点击添加Bot,就增加到知识库中测试发布测试返回[heading3]3.3网页知识库[content]选择有自动采集和手动采集两种方式,手动采集需要安装插件,操作稍微有点小复杂,等下节课程我们专门分享。这里我们选择批量添加,写入画小二官网的地址https://www.huaxiaoer.com.cn/这里你可以根据需求添加自己的网站然后就将网站所有的页面都扫描出来,点击确认。将全站数据解析并保存到知识库里面按照默认自动清洗数据数据清洗进度将网站所有数据清洗出来将网站添加到知识库里面
1."猫咪喜欢吃各种各样的食物,包括鱼、鸡肉和干粮。"2."猫咪的饮食习惯取决于它们的年龄、健康状况和品种。"3."幼猫需要更多的蛋白质,而成年猫则需要均衡的营养。"4."确保猫咪的饮食中包含足够的水分非常重要,以避免肾脏问题。"假设用户查询:“猫咪的饮食习惯是什么?”合理的文档切割会让系统返回如下更完整的结果:文档块2:“猫咪的饮食习惯取决于它们的年龄、健康状况和品种。”文档块3:“幼猫需要更多的蛋白质,而成年猫则需要均衡的营养。”这样,用户得到的回答是连贯且完整的。我希望你可以通过上面这个例子了解文档切割对于RAG的重要性,那我们该如何将文档切割的更合理呢?各个免费的平台一般都提供了两种文档切割方式,分别是:智能切割:由系统通过上下文理解进行切割手动切割:用户可以指定固定的分隔符来对文档进行切割如果我们想通过利用Coze等免费平台搭建知识库,在当下的技术水平下,智能切割并不是一个很好的方式,因为目前来讲Coze等免费平台提供的智能切割方式效果一般。那是不是Coze的知识库就完全不能用了?当然不是,对于某一个业务场景,RAG的表现都是比较稳定的,那就是以问答为主的客服场景。这里最主要的原因就是问答场景的格式非常固定,那就是问答对,只要我们在切割的时候将一个问答对切成一个文档片,那么在检索的时候效果就会非常好。这里给大家一个QA问答对的格式:
接下来,我们来测试下我的AI Bot:你会发现这里的回答只回答了大模型帮我们生成的结果,而其他航班信息以及天气相关的信息是没有给到我们结果的,究其原因是Coze国内版目前还是刚发布不久,有些官方和第三方插件的API调用和返回结果还是不太稳定,导致这里的结果不能完全显示出来,以下是我实际遇到的一些调用报错情况:不过这个问题我相信官方会尽快解决的,毕竟Coze这个平台的功能其实是挺完善和强大的,也做得很符合国情和本土化。最后我们再试几次,来看看最终的成功效果:可以看到成功的回答了我们的问题,这个回答是根据我们的提示词和插件+工作流的组合回答,所以回答的结果是非常详细的。如果之后加上自己的知识库甚至是可以根据用户定制化来使用数据库功能的话,那么我相信这个AI Bot的使用场景会更加符合一个APP该有的产品化功能。你可以想象一下,这个AI Bot的MVP我只用了一个晚上就完成了,出来的效果真的相当不错了,换作是传统开发的话,这个功能至少需要一个月的时间,而且还不一定能做得这么好。最后再说一句,如果是有条件使用国外版的小伙伴,我相信效果一定会更加好,因为国外版有免费的GPT4大模型的使用,插件和工作流功能更加丰富和稳定,而且还有更多的自定义插件和工作流功能,这样就可以更加灵活的根据自己的需求来定制化自己的AI Bot了。这个是我演示上述步骤后发布的AI Bot,其ID是:7333630516673167394,有兴趣的可以直接在Coze平台上搜索这个ID来体验一下我的AI Bot。