直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

创建知识库

回答

创建知识库的方法如下:

  • 智能体方面:
    • 本次创建知识库使用手动清洗数据,上节课程是自动清洗数据,自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。
    • 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库。知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档、自定义的自定义,输入###,然后就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加 Bot,添加好可以在调试区测试效果。
    • 本地文档:本地 word 文件,注意如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面。画小二这个课程 80 节课程,分为了 11 个章节,训练数据不能一股脑全部放进去训练。正确的方法是首先将 11 章的大的章节名称内容放进来,章节内详细内容格式依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。
    • 发布应用:点击发布,确保在 Bot 商店中能够搜到,没有通过发布的获取不到 API。
  • 一般情况:
    • 可以将文本内容上传至知识库中,作为回复用户问题的内容源或通过向量搜索进行内容召回。例如将产品使用文档上传至知识库中,创建一个专属的产品咨询顾问 Bot 来精准回答用户关于产品使用的相关问题。
    • 参考以下操作:登录扣子,在左侧导航栏的工作区区域,选择进入指定团队,在页面顶部进入知识库页面,并单击创建知识库,在弹出的页面配置知识库名称、描述,并单击确认。一个团队内的知识库名称不可重复,必须是唯一的。在单元页面,单击新增单元,在弹出的页面选择要上传的数据格式,默认是文本格式,然后选择一种文本内容上传方式完成内容上传。
  • Coze 方面:
    • 来到个人空间,找到知识库导航栏,点击创建知识库。知识库是共享资源,也就是多个 Bot 可以引用同一个知识库。
    • 选择知识库的格式,填写一些信息。目前(2024.06.08)Coze 支持三种格式:文档、表格(CSV、Excel 等)、图片(其实就是上传一张图片,然后填写个图片文字说明)。这里格式并不重要,重要的是要看懂上个章节讲的:影响 RAG 输出质量的因素。可以选择本地文档(问答对可以选择表格),选择自定义的文档切割,数据处理完成后,一个问答对被切割成一个文档片。
    • 关于使用知识库,大家可以看这篇教程:大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【智能体】让Coze智能体机器人连上微信和微信群详细配置文档

本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。

创建并使用知识库

你可以将文本内容上传至知识库中,作为回复用户问题的内容源或通过向量搜索进行内容召回。例如你可以将产品使用文档上传至知识库中,创建一个专属的产品咨询顾问Bot来精准回答用户关于产品使用的相关问题。参考以下操作,创建知识库并上传文本内容。1.登录[扣子](https://www.coze.cn/home)。2.在左侧导航栏的工作区区域,选择进入指定团队。3.在页面顶部进入知识库页面,并单击创建知识库。4.在弹出的页面配置知识库名称、描述,并单击确认。一个团队内的知识库名称不可重复,必须是唯一的。1.在单元页面,单击新增单元。2.在弹出的页面选择要上传的数据格式,默认是文本格式,然后选择一种文本内容上传方式完成内容上传。

这可能是讲 Coze 的知识库最通俗易懂的文章了

讲了一大堆,终于到了实战的环节了。这里我虽然使用Coze举例子,但是我希望可以帮助你举一反三,未来在接触到FastGPT、Dify等等AI Agent工具的时候都能快速的上手知识库组件。因为你了解了RAG的本质之后,无论什么知识库工具,本质都是一个皮而已!这些也是写这篇文章的目的:让你做到知其然,知其所以然[heading2]创建知识库[content]1.来到个人空间,找到知识库导航栏,点击创建知识库这里我想说明的是,知识库是共享资源,也就是你的多个Bot可以引用同一个知识库1.选择知识库的格式,填写一些信息目前(2024.06.08)Coze支持三种格式文档表格(CSV、Excel等)图片(其实就是上传一张图片,然后填写个图片文字说明)这里格式并不重要,重要的是你要看懂上个章节讲的:影响RAG输出质量的因素1.我这里选择本地文档(问答对可以选择表格)[购买后新人常见问题汇总.txt](https://bytedance.feishu.cn/space/api/box/stream/download/all/FNqobmfgBo5eGHxfZJ1cbOJ9n1H?allow_redirect=1)1.选择自定义的文档切割1.数据处理完成当数据处理完成后,你会发现,一个问答对被切割成一了一个文档片[heading2]使用知识库[content]关于使用知识库,大家可以看这篇教程:[大圣:胎教级教程:万字长文带你使用Coze打造企业级知识库](https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb),这篇文章已经讲的很详细了,这里就不再赘述了

其他人在问
你的知识库来源于哪里
我的知识库来源较为广泛,包括以下方面: 符号人工智能的早期成就之一——专家系统,其基于从人类专家提取的知识库,并包含推理引擎进行推理。专家系统包含问题记忆、知识库、推理引擎等部分。 “通往 AGI 之路「WaytoAGI」,这是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。 扣子的知识库,功能强大,可上传和存储外部知识内容,并提供多种查找知识的方法,能解决大模型的某些问题,使其回复更准确。
2024-11-13
什么是知识库,以及他的运作原理是什么,请用小白也能理解的语言进行说明
知识库可以用比较通俗的方式来理解: 想象一个大语言模型就像一个非常聪明、读过无数书的人,但对于一些特定的工作场景中的细节,比如见到老板娘过来吃饭要打三折,张梦飞过去吃饭要打骨折,它可能并不清楚。这时候,知识库就像是给这个聪明的人发的一本工作手册。 从更专业的角度来说,知识库的运作原理通常包括以下几个步骤: 1. 文档加载:从各种不同的来源,比如 PDF、SQL 数据、代码等加载相关的文档。 2. 文本分割:把加载的文档分割成指定大小的块,称为“文档块”或“文档片”。 3. 存储:这包括两个环节,一是将分割好的文档块进行嵌入,转换成向量的形式;二是将这些向量数据存储到向量数据库中。 4. 检索:当需要使用数据时,通过某种检索算法从向量数据库中找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给大语言模型,大语言模型会根据问题和检索出来的提示一起生成更合理的答案。 以车型数据为例,每个知识库的分段中保存了一种车型的基础数据。当用户问宝马 X3 的售价是多少时,就能匹配到对应车型的分段,然后从其中获取到售价信息。 海外官方文档:https://www.coze.com/docs/zh_cn/knowledge.html 国内官方文档:https://www.coze.cn/docs/guides/use_knowledge
2024-11-13
我没有知识库,如何让AI就某一问题穷尽搜索
要让 AI 就某一问题进行穷尽搜索,一般会涉及以下步骤: 1. 文档向量化:知识库中的文档需要被转换成向量形式,以便在数值级别上与问题向量进行比较。使用知识库工具上传文档时,会完成文档的向量化,这依靠 Embedding Model 实现。 2. 知识库检索: 相似性计算:使用相似性度量方法(如余弦相似性)计算问题向量和各个文档向量之间的相似度,以找出与问题内容最接近的文档。 排序与选择:根据相似性得分对所有文档进行排序,通常会选择得分最高的几个文档,认为这些文档与问题最相关。 信息抽取:从选定的高相关性文档中抽取具体的信息片段或答案,可能涉及进一步的文本处理技术,如命名实体识别、关键短语提取等。 3. 信息整合阶段:将检索到的全部信息连同用户问题和系统预设整合成一个全新的上下文环境,为生成回答提供基础。 此外,像生物进化中通过自然选择的方式,从特定规则开始逐步改变(可能随机),在每一步保留最有效的规则并丢弃其他,这种方法不是我们通常定义的“人工智能”(更像是“遗传算法”),但在高维规则空间中往往比低维规则空间效果更好,因为维度越多,陷入局部最小值的可能性越小。 同时,给 AI 配备随时更新的“活字典”即知识库是一个好方法。知识库就像 AI 随时可查阅的百科全书,当 AI 遇到不确定问题时,可从知识库中检索相关信息给出更准确回答。比如建立包含最新新闻、科技发展、法律法规等内容的知识库,或者利用整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。
2024-11-13
你的知识库是怎么部署的
部署个人知识库需要考虑硬件配置和相关技术原理。 硬件方面: 生成文字大模型,最低配置为 8G RAM + 4G VRAM,建议配置为 16G RAM + 8G VRAM,理想配置为 32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型)。 生成图片大模型(比如跑 SD),最低配置为 16G RAM + 4G VRAM,建议配置为 32G RAM + 12G VRAM。 生成音频大模型,最低配置为 8G VRAM,建议配置为 24G VRAM。 技术原理方面: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在这个过程中,首先检索外部数据,然后在生成步骤中将这些数据传递给 LLM。 RAG 应用包括文档加载、文本分割、存储、检索和输出这 5 个过程。 文档加载:从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器。 文本分割:把 Documents 切分为指定大小的块。 存储:涉及将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 检索:通过某种检索算法找到与输入问题相似的嵌入片。 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 此外,搭建基于 GPT API 的定制化知识库,涉及给 GPT 输入(投喂)定制化的知识。GPT3.5 一次交互(输入和输出)只支持最高 4096 个 Token。为了处理大量领域知识,OpenAI 提供了 embedding API 解决方案。embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度。
2024-11-11
搭建个人知识库,请推荐的免费人工智能软件
以下为您推荐一些可用于搭建个人知识库的免费人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze 或 FastGPT 等工具可搭建知识库,但当下其 RAG 能力仅对问答场景友好,复杂企业级知识库场景可能需要专业团队,收费几万到几十万不等。若想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。 此外,还有一些相关工具和方法: 用通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 定义提示语提取有用信息:https://memo.ac/zh/ 开源免费屏幕录制工具 OBS,下载地址:https://obsproject.com/ Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 用 losslessCut 快速切块:https://github.com/mifi/losslesscut 希望这些信息对您有所帮助。
2024-11-11
飞书和notion,在搭建个人知识库方面,各自的优点和缺点是什么
飞书在搭建个人知识库方面的优点: 可以方便地分类和整理知识,例如个人搭建某一领域知识库或企业搭建产品资料知识库。 有相关的分享和直播,能帮助用户轻松打造知识管理体系。 缺点: 随着知识库中信息增多,如果分类不合理,很难找到所需文章。 问题答案可能在文章某一段落,每次都需重新阅读文章才能找到答案。 Notion 在搭建个人知识库方面的优点: 是功能强大的知识管理和项目管理工具,可将各种信息 all in one place。 数据库可定制性高,接近关系型数据库,适合有相关需求的用户。 数据库的每一条记录都是一个页面,页面包含可自定义的属性和丰富内容。 支持的块类型非常丰富。 缺点:暂未提及。 此外,Notion 在创建知识库并上传文本内容方面,有特定的操作步骤,如在文本格式页签下选择 Notion 并进行授权,还可选择自动分段与清洗或自定义分段等方式。
2024-11-11
用Coze创建AI,打造自己的图像生成AI机器人
以下是使用 Coze 创建自己的图像生成 AI 机器人的步骤: 1. 注册 Coze 账号: 访问 Coze 官网,可选择中文版(https://www.coze.cn/,支持大模型:kimi、云雀)或英文版(https://coze.com/,支持大模型:chatgpt4)进行快速注册。 产品定位为新一代 AI 原生应用开发服务平台。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,起一个响亮的名字。 工作空间选“个人空间”。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”用文字描述想要的图标,满意后再把“Bot 名称”改为简洁版名称。 3. 具体创建 AI Bot: 首先打开扣子的首页(https://www.coze.cn/home),直接点击左上角的创建 AI Bot 按钮。 直接在弹窗输入 Bot 的相关信息,完成创建后细化其功能。 设计人设与回复逻辑,根据功能需求设计提示词。 调整模型设置,比如基于聊天为主的需求,将对话轮数记录改为 20 轮。 选择插件,如英文名言警句(get_one_eng_word & get_many_eng_words)随机获取英语名言,Simple OCR(ocr)识别图片中的文字。 设置开场白和预置问题,预置问题有参考价值。 最后设置语音,若为英语陪练 AI Bot,选择亲切的英语音色。
2024-11-09
用Coze创建AI,能够通过文字生成图片或者视频或者动画或者渲染效果
以下是使用 Coze 创建 AI 的相关信息: 1. 注册 Coze 账号: 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4)。 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 3. 制定任务的关键方法: 在开始设计和开发任何 AI Agent 之前,最关键的第一步是明确定义期望 AI 最终输出的结果。这包括详细描述期望获得的输出内容,如输出是文本、图像、音频还是其他形式的数据,输出的具体格式和结构是什么,确定输出内容的质量标准。 预估任务的可行性。 确定任务的执行形式。以 LearnAndRecord 的一篇文章为例,拆解其结构,基于此进行微调优化。值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。参照精读结构,评估任务的可行性,生成结果包括文字、图片(思维导图)、音频(原文音频)三类输出格式,前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。最后结合使用习惯,期望在输入一篇英文原文时,AI Agent 能够按模板要求,直接输出精读结果。
2024-11-09
还有没有类似语聚ai,扣子,Dify.A,腾讯元器、客悦等智能体创建平台
以下是为您介绍的一些类似语聚 AI、扣子、Dify.AI、腾讯元器、客悦等的智能体创建平台: 智能体是随着 ChatGPT 与 AI 概念爆火而出现的新名词,简单理解就是 AI 机器人小助手,类似移动互联网中的 APP 应用。目前有很多公司关注智能体在 AI 应用层的产品机会,比如在 C 端有社交方向的应用,用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入;在 B 端,有帮助商家搭建智能体的机会。 国内有不少智能体开发平台,如字节的扣子,2 月 1 日字节正式推出其国内版,主要用于开发下一代 AI 聊天机器人。此外,还有 Dify.AI 等平台。像阿里的魔搭社区也属于此类平台。 扣子(Coze)是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot,完成后还可发布到各种社交平台和通讯软件上供用户交互聊天。创建智能体通常包括起名称、写介绍、使用 AI 创建头像等简单步骤。
2024-11-08
如何快速创建调用API的应用
以下是快速创建调用 API 应用的步骤: 1. 了解请求的组成部分: Body:用于传递请求主体,GET 方法中通常不使用。 Path:定义请求路径,GET 方法中可编码参数在其中。 Query:定义请求查询部分,是 GET 方法常用的参数传递方式。 Header:定义 HTTP 请求头信息,通常不用于传递参数。 2. 配置输出参数: 在配置输出参数界面,可自动解析或手动新增参数。 包括设置参数名称、描述、类型、是否必填等。 对于 Object 类型参数,可添加子项。 3. 调试与校验: 在调试与校验界面填写输入参数并运行。 查看输出结果,Request 为输入传参,Response 为返回值。 4. 发布:在插件详情页右上角点击发布。 以创建调用 themoviedb.org API 应用为例: 注册并申请 API KEY:前往 themoviedb.org 注册,依次点击右上角头像 账户设置 API 请求 API 密钥 click here,选择 Developer 开发者,填写相关信息并提交,获取 API 读访问令牌备用。 构建 GPT:新创建 GPT,设置名字和描述,添加 Instructions 内容,并添加 Webpilot Action 和粘贴相关 Schema 内容。
2024-11-08
还有没有类似扣子、Dify.A类似的智能体创建平台?
以下为您介绍一些类似扣子、Dify.AI 的智能体创建平台: 腾讯元器:是一个智能体开发平台。 kimi:在智能体领域有所涉及。 需要注意的是,目前提示词攻击在业内是一个公开的秘密,国内外各大著名的 AI 厂商几乎无一幸免,其系统提示存在泄露的风险。
2024-11-08
类似扣子的智能体创建平台还有哪些?
以下是一些类似扣子的智能体创建平台: 1. 海外版 Coze(coze.com) 2. 百度 AppBuilder 3. 阿里通义千问 4. 智谱 AI 此外,还有 Dify.AI 等平台。字节的扣子(Coze)作为新一代一站式 AI Bot 开发平台,无论用户是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot。腾讯元器也是智能体开发平台之一。
2024-11-08