直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

创建知识库

回答

创建知识库的方法如下:

  • 手动清洗数据创建智能体的知识库:
    • 在线知识库:点击创建知识库,创建画小二课程的 FAQ 知识库。飞书在线文档中每个问题和答案以###分割,可点击编辑修改和删除,添加 Bot 后可在调试区测试效果。
    • 本地文档:对于本地 word 文件,注意不能将大量内容一股脑全部放入训练,应先放入大章节名称内容,再按固定方式人工标注和处理章节内详细内容,然后选择创建知识库自定义清洗数据。
    • 发布应用:点击发布,确保在 Bot 商店中能搜到。
  • 在扣子(https://www.coze.cn/home)创建并上传文本内容:
    • 登录扣子,在左侧导航栏的工作区区域选择进入指定团队。
    • 在页面顶部进入知识库页面,单击创建知识库,配置知识库名称、描述并确认。一个团队内的知识库名称需唯一。
    • 在单元页面,单击新增单元,选择要上传的数据格式和文本内容上传方式完成内容上传。
  • 在 Coze 中创建知识库:
    • 来到个人空间,找到知识库导航栏,点击创建知识库。知识库是共享资源,多个 Bot 可引用同一知识库。
    • 选择知识库的格式(目前支持文档、表格、图片),填写相关信息。如选择本地文档和自定义的文档切割,数据处理完成后,一个问答对会被切割成一个文档片。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【智能体】让Coze智能体机器人连上微信和微信群详细配置文档

本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。

创建并使用知识库

你可以将文本内容上传至知识库中,作为回复用户问题的内容源或通过向量搜索进行内容召回。例如你可以将产品使用文档上传至知识库中,创建一个专属的产品咨询顾问Bot来精准回答用户关于产品使用的相关问题。参考以下操作,创建知识库并上传文本内容。1.登录[扣子](https://www.coze.cn/home)。2.在左侧导航栏的工作区区域,选择进入指定团队。3.在页面顶部进入知识库页面,并单击创建知识库。4.在弹出的页面配置知识库名称、描述,并单击确认。一个团队内的知识库名称不可重复,必须是唯一的。1.在单元页面,单击新增单元。2.在弹出的页面选择要上传的数据格式,默认是文本格式,然后选择一种文本内容上传方式完成内容上传。

这可能是讲 Coze 的知识库最通俗易懂的文章了

讲了一大堆,终于到了实战的环节了。这里我虽然使用Coze举例子,但是我希望可以帮助你举一反三,未来在接触到FastGPT、Dify等等AI Agent工具的时候都能快速的上手知识库组件。因为你了解了RAG的本质之后,无论什么知识库工具,本质都是一个皮而已!这些也是写这篇文章的目的:让你做到知其然,知其所以然[heading2]创建知识库[content]1.来到个人空间,找到知识库导航栏,点击创建知识库这里我想说明的是,知识库是共享资源,也就是你的多个Bot可以引用同一个知识库1.选择知识库的格式,填写一些信息目前(2024.06.08)Coze支持三种格式文档表格(CSV、Excel等)图片(其实就是上传一张图片,然后填写个图片文字说明)这里格式并不重要,重要的是你要看懂上个章节讲的:影响RAG输出质量的因素1.我这里选择本地文档(问答对可以选择表格)[购买后新人常见问题汇总.txt](https://bytedance.feishu.cn/space/api/box/stream/download/all/FNqobmfgBo5eGHxfZJ1cbOJ9n1H?allow_redirect=1)1.选择自定义的文档切割1.数据处理完成当数据处理完成后,你会发现,一个问答对被切割成一了一个文档片[heading2]使用知识库[content]关于使用知识库,大家可以看这篇教程:[大圣:胎教级教程:万字长文带你使用Coze打造企业级知识库](https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb),这篇文章已经讲的很详细了,这里就不再赘述了

其他人在问
你的知识库是怎么部署的
部署个人知识库需要考虑硬件配置和相关技术原理。 硬件方面: 生成文字大模型,最低配置为 8G RAM + 4G VRAM,建议配置为 16G RAM + 8G VRAM,理想配置为 32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型)。 生成图片大模型(比如跑 SD),最低配置为 16G RAM + 4G VRAM,建议配置为 32G RAM + 12G VRAM。 生成音频大模型,最低配置为 8G VRAM,建议配置为 24G VRAM。 技术原理方面: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在这个过程中,首先检索外部数据,然后在生成步骤中将这些数据传递给 LLM。 RAG 应用包括文档加载、文本分割、存储、检索和输出这 5 个过程。 文档加载:从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器。 文本分割:把 Documents 切分为指定大小的块。 存储:涉及将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 检索:通过某种检索算法找到与输入问题相似的嵌入片。 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 此外,搭建基于 GPT API 的定制化知识库,涉及给 GPT 输入(投喂)定制化的知识。GPT3.5 一次交互(输入和输出)只支持最高 4096 个 Token。为了处理大量领域知识,OpenAI 提供了 embedding API 解决方案。embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度。
2024-11-11
搭建个人知识库,请推荐的免费人工智能软件
以下为您推荐一些可用于搭建个人知识库的免费人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze 或 FastGPT 等工具可搭建知识库,但当下其 RAG 能力仅对问答场景友好,复杂企业级知识库场景可能需要专业团队,收费几万到几十万不等。若想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。 此外,还有一些相关工具和方法: 用通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 定义提示语提取有用信息:https://memo.ac/zh/ 开源免费屏幕录制工具 OBS,下载地址:https://obsproject.com/ Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 用 losslessCut 快速切块:https://github.com/mifi/losslesscut 希望这些信息对您有所帮助。
2024-11-11
飞书和notion,在搭建个人知识库方面,各自的优点和缺点是什么
飞书在搭建个人知识库方面的优点: 可以方便地分类和整理知识,例如个人搭建某一领域知识库或企业搭建产品资料知识库。 有相关的分享和直播,能帮助用户轻松打造知识管理体系。 缺点: 随着知识库中信息增多,如果分类不合理,很难找到所需文章。 问题答案可能在文章某一段落,每次都需重新阅读文章才能找到答案。 Notion 在搭建个人知识库方面的优点: 是功能强大的知识管理和项目管理工具,可将各种信息 all in one place。 数据库可定制性高,接近关系型数据库,适合有相关需求的用户。 数据库的每一条记录都是一个页面,页面包含可自定义的属性和丰富内容。 支持的块类型非常丰富。 缺点:暂未提及。 此外,Notion 在创建知识库并上传文本内容方面,有特定的操作步骤,如在文本格式页签下选择 Notion 并进行授权,还可选择自动分段与清洗或自定义分段等方式。
2024-11-11
合适搭建个人知识库的人工智能软件有哪一些
以下是一些适合搭建个人知识库的人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址为 https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在使用时,可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合训练数据和上传文档给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze:如果您想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。但使用该软件可能需要对接一些额外的 API 。
2024-11-11
创建知识库
创建知识库的方法如下: 智能体方面: 本次创建知识库使用手动清洗数据,上节课程是自动清洗数据,自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库。知识库的飞书在线文档,其中每个问题和答案以分割,暂时不要问为什么。选择飞书文档、自定义的自定义,输入,然后就将飞书的文档内容以区分开来,这里可以点击编辑修改和删除。点击添加 Bot,添加好可以在调试区测试效果。 本地文档:本地 word 文件,注意如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面。画小二这个课程 80 节课程,分为了 11 个章节,训练数据不能一股脑全部放进去训练。正确的方法是首先将 11 章的大的章节名称内容放进来,章节内详细内容格式依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。 发布应用:点击发布,确保在 Bot 商店中能够搜到,没有通过发布的获取不到 API。 一般情况: 可以将文本内容上传至知识库中,作为回复用户问题的内容源或通过向量搜索进行内容召回。例如将产品使用文档上传至知识库中,创建一个专属的产品咨询顾问 Bot 来精准回答用户关于产品使用的相关问题。 参考以下操作:登录,在左侧导航栏的工作区区域,选择进入指定团队,在页面顶部进入知识库页面,并单击创建知识库,在弹出的页面配置知识库名称、描述,并单击确认。一个团队内的知识库名称不可重复,必须是唯一的。在单元页面,单击新增单元,在弹出的页面选择要上传的数据格式,默认是文本格式,然后选择一种文本内容上传方式完成内容上传。 Coze 方面: 来到个人空间,找到知识库导航栏,点击创建知识库。知识库是共享资源,也就是多个 Bot 可以引用同一个知识库。 选择知识库的格式,填写一些信息。目前(2024.06.08)Coze 支持三种格式:文档、表格(CSV、Excel 等)、图片(其实就是上传一张图片,然后填写个图片文字说明)。这里格式并不重要,重要的是要看懂上个章节讲的:影响 RAG 输出质量的因素。可以选择本地文档(问答对可以选择表格),选择自定义的文档切割,数据处理完成后,一个问答对被切割成一个文档片。 关于使用知识库,大家可以看这篇教程:。
2024-11-10
知识库设计
以下是关于知识库设计的相关内容: 在基于大模型+知识库的 Code Review 实践中: 为什么需要知识库:大模型基座只包含互联网上的公开数据,对公司内部的框架知识和使用文档不了解。例如公司内的框架 Lynx,需要让大模型从内部文档中知道“什么是 Lynx?”“怎么写 Lynx?”,这里的“强化模式”会使用向量数据库,并将匹配的知识库片段和问题生成 Prompt,发送到 LLM 执行。 怎样找到相关度高的知识:通过三个过程,即 Text Embeddings(文本向量化)、Vector Stores(向量存储)、Similarity Search(相似性搜索)。 在「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人中: 确定功能范围: 编写【prompt】提示词,设定 Bot 的身份和目标。 创建【知识库】,整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。创建知识库路径为个人空间知识库创建知识库,知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。按照操作指引上传文档、分段设置、确认数据处理。小技巧是在内容中加上特殊分割符“”以便于自动切分数据,分段标识符号选择“自定义”,内容填“”。如果内容有误可编辑或删除。 创建【工作流】,告诉 AI 机器人处理信息的流程。创建工作流路径为个人空间工作流创建工作流。工作流设计好后先试运行,无误后发布。如果任务和逻辑复杂,可结合“节点”工具,如调用【大模型】总结分析知识库内容、调用【数据库】存储用户输入信息、调用【代码】处理复杂逻辑等。个人建议工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很重要。
2024-11-10
用Coze创建AI,打造自己的图像生成AI机器人
以下是使用 Coze 创建自己的图像生成 AI 机器人的步骤: 1. 注册 Coze 账号: 访问 Coze 官网,可选择中文版(https://www.coze.cn/,支持大模型:kimi、云雀)或英文版(https://coze.com/,支持大模型:chatgpt4)进行快速注册。 产品定位为新一代 AI 原生应用开发服务平台。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,起一个响亮的名字。 工作空间选“个人空间”。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”用文字描述想要的图标,满意后再把“Bot 名称”改为简洁版名称。 3. 具体创建 AI Bot: 首先打开扣子的首页(https://www.coze.cn/home),直接点击左上角的创建 AI Bot 按钮。 直接在弹窗输入 Bot 的相关信息,完成创建后细化其功能。 设计人设与回复逻辑,根据功能需求设计提示词。 调整模型设置,比如基于聊天为主的需求,将对话轮数记录改为 20 轮。 选择插件,如英文名言警句(get_one_eng_word & get_many_eng_words)随机获取英语名言,Simple OCR(ocr)识别图片中的文字。 设置开场白和预置问题,预置问题有参考价值。 最后设置语音,若为英语陪练 AI Bot,选择亲切的英语音色。
2024-11-09
用Coze创建AI,能够通过文字生成图片或者视频或者动画或者渲染效果
以下是使用 Coze 创建 AI 的相关信息: 1. 注册 Coze 账号: 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4)。 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 3. 制定任务的关键方法: 在开始设计和开发任何 AI Agent 之前,最关键的第一步是明确定义期望 AI 最终输出的结果。这包括详细描述期望获得的输出内容,如输出是文本、图像、音频还是其他形式的数据,输出的具体格式和结构是什么,确定输出内容的质量标准。 预估任务的可行性。 确定任务的执行形式。以 LearnAndRecord 的一篇文章为例,拆解其结构,基于此进行微调优化。值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。参照精读结构,评估任务的可行性,生成结果包括文字、图片(思维导图)、音频(原文音频)三类输出格式,前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。最后结合使用习惯,期望在输入一篇英文原文时,AI Agent 能够按模板要求,直接输出精读结果。
2024-11-09
还有没有类似语聚ai,扣子,Dify.A,腾讯元器、客悦等智能体创建平台
以下是为您介绍的一些类似语聚 AI、扣子、Dify.AI、腾讯元器、客悦等的智能体创建平台: 智能体是随着 ChatGPT 与 AI 概念爆火而出现的新名词,简单理解就是 AI 机器人小助手,类似移动互联网中的 APP 应用。目前有很多公司关注智能体在 AI 应用层的产品机会,比如在 C 端有社交方向的应用,用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入;在 B 端,有帮助商家搭建智能体的机会。 国内有不少智能体开发平台,如字节的扣子,2 月 1 日字节正式推出其国内版,主要用于开发下一代 AI 聊天机器人。此外,还有 Dify.AI 等平台。像阿里的魔搭社区也属于此类平台。 扣子(Coze)是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot,完成后还可发布到各种社交平台和通讯软件上供用户交互聊天。创建智能体通常包括起名称、写介绍、使用 AI 创建头像等简单步骤。
2024-11-08
如何快速创建调用API的应用
以下是快速创建调用 API 应用的步骤: 1. 了解请求的组成部分: Body:用于传递请求主体,GET 方法中通常不使用。 Path:定义请求路径,GET 方法中可编码参数在其中。 Query:定义请求查询部分,是 GET 方法常用的参数传递方式。 Header:定义 HTTP 请求头信息,通常不用于传递参数。 2. 配置输出参数: 在配置输出参数界面,可自动解析或手动新增参数。 包括设置参数名称、描述、类型、是否必填等。 对于 Object 类型参数,可添加子项。 3. 调试与校验: 在调试与校验界面填写输入参数并运行。 查看输出结果,Request 为输入传参,Response 为返回值。 4. 发布:在插件详情页右上角点击发布。 以创建调用 themoviedb.org API 应用为例: 注册并申请 API KEY:前往 themoviedb.org 注册,依次点击右上角头像 账户设置 API 请求 API 密钥 click here,选择 Developer 开发者,填写相关信息并提交,获取 API 读访问令牌备用。 构建 GPT:新创建 GPT,设置名字和描述,添加 Instructions 内容,并添加 Webpilot Action 和粘贴相关 Schema 内容。
2024-11-08
还有没有类似扣子、Dify.A类似的智能体创建平台?
以下为您介绍一些类似扣子、Dify.AI 的智能体创建平台: 腾讯元器:是一个智能体开发平台。 kimi:在智能体领域有所涉及。 需要注意的是,目前提示词攻击在业内是一个公开的秘密,国内外各大著名的 AI 厂商几乎无一幸免,其系统提示存在泄露的风险。
2024-11-08