Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何搭建像你一样的知识库?

Answer

搭建像我这样的知识库可以参考以下步骤:

  1. 创建智能体:
    • 本次创建知识库可使用手动清洗数据,上节课程是自动清洗数据,自动清洗可能数据不准,手动清洗能提高准确性。参考课程:【智能体】用 Coze 在微信里搭建一个机器人,还能挖掘销售线索
    • 在线知识库:点击创建知识库,创建画小二课程的 FAQ 知识库。飞书在线文档中每个问题和答案以###分割,选择飞书文档、自定义的自定义,输入###,可编辑修改和删除。点击添加 Bot 并在调试区测试效果。
    • 本地文档:注意拆分内容以提高训练数据准确度,比如对于画小二 80 节课程分为 11 个章节,先放入大章节名称内容,再按固定方式细化处理,然后选择创建知识库自定义清洗数据。
    • 发布应用:点击发布,确保在 Bot 商店中能搜到,否则无法获取 API。
  2. 用 Coze 免费打造微信 AI 机器人:
    • 确定功能范围。
    • 编写【prompt】提示词,设定 Bot 的身份和目标。
    • 创建【知识库】,整理“关键字”与“AI 相关资料链接”的对应关系并存储。创建知识库路径为个人空间-知识库-创建知识库,文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。按照操作指引上传文档、分段设置、确认数据处理。小技巧:可在内容中加特殊分割符“###”便于自动切分数据,分段标识符号选“自定义”,内容填“###”。最终的知识库结果中,同一颜色代表同一数据段,若内容有误可点击右键编辑或删除。
Content generated by AI large model, please carefully verify (powered by aily)

References

【智能体】让Coze智能体机器人连上微信和微信群详细配置文档

本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。

Others are asking
有没有好用的知识库
以下是一些好用的知识库介绍: 扣子:其知识库功能强大,可上传和存储外部知识内容,提供多种查找知识的方法。能解决大模型有时出现的幻觉或专业领域知识不足的问题,支持多种格式文件,如文本格式。在智能体中使用时,回答用户前会先检索知识库内容。还可添加开场白提升体验。 扣子提供的存储和记忆外部数据的方式包括: 知识库:大量知识分片,通过语义匹配为模型补充知识。例如车型数据,每个知识库分段保存一种车型基础数据,用户提问时能匹配对应分段获取信息。 数据库:类似传统软件开发的数据库功能,以表格结构存储信息,通过 NoSQL 方式使用,目前提供关系型数据库,有多种应用场景。 AI 便签:记录用户提交的便签,支持提交、查询操作,通过 NL2SQL 完成。 单词本:记录用户背过的单词及未记住的单词等。 Coze 中创建知识库的步骤: 路径:个人空间 知识库 创建知识库。 支持的文档类型:本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。 按照操作指引上传文档、分段设置、确认数据处理。 小技巧:知识库的好用程度与内容切分粒度有关,可在内容中加特殊分割符如“”便于自动切分数据,分段标识符号选择“自定义”,内容填“”。最终的知识库结果中,同一颜色代表同一个数据段,有误可编辑或删除。
2025-03-05
我想要知识库里的ai系统学习文档,要怎么获取
您可以通过以下方式获取 AI 系统学习文档: 1. 观看李弘毅老师的生成式 AI 导论、吴达的生成式 AI 入门视频等,并整理成学习笔记,在整理过程中学习更多知识,还能与大家交流互动。 2. 等待社区共创内容,通过共创做小项目来反向推动学习。 3. 原子将分享 30 分钟快速体验 AI 工具并教爸妈理解相关内容。 4. 学习 A16Z 推荐的包括 GPT 相关知识、Transformer 模型运作原理,及大语言模型词语接龙原理等基础知识。 5. 查看如介绍 GPT 运作原理、Transformer 模型、扩散模型等的经典必读文章。 6. 推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 7. 查看历史脉络类资料,如整理了 open AI 的发展时间线和万字长文回顾等。 相关内容的获取链接为:https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=2727000 、https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=2806000 、https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=2942000 。
2025-03-05
有哪些好用的搭建知识库然后进行问答的 AI 工具?
以下是一些好用的搭建知识库然后进行问答的 AI 工具: 1. DIN: 搭建 OneAPI,用于汇聚整合多种大模型接口。 搭建 FastGpt,这是一个知识库问答系统,可放入知识文件,并接入大模型作为分析知识库的大脑,它有问答界面。 搭建 chatgptonwechat,将知识库问答系统接入微信,但建议先用小号以防封禁风险。 2. Coze: 知识库问答是其最基础的功能,利用了大模型的 RAG 机制(检索增强生成)。 RAG 机制先从大型数据集中检索与问题相关的信息,再利用这些信息生成回答。 实现知识库问答功能需创建包含大量 AI 相关文章和资料的知识库,通过手工录入上传内容。 在设计 Bot 时添加知识库,并设置合适的搜索策略、最大召回数量和最小匹配度,以更好地结合知识库返回的内容进行回答。
2025-03-05
有哪些好用的搭建知识库然后进行问答的 AI 工具?
以下是一些好用的搭建知识库然后进行问答的 AI 工具: 1. DIN: 搭建步骤: 搭建 OneAPI(https://github.com/songquanpeng/oneapi),用于汇聚整合多种大模型接口。 搭建 FastGpt(https://fastgpt.in/),这是一个知识库问答系统,将知识文件放入,并接入大模型作为分析知识库的大脑,它有问答界面。 搭建 chatgptonwechat(https://github.com/zhayujie/chatgptonwechat),接入微信,配置 FastGpt 把知识库问答系统接入到微信,建议先用小号以防封禁风险。 2. Coze: 知识库问答利用了大模型的 RAG 机制,全称为“检索增强生成”(RetrievalAugmented Generation)。 RAG 机制先从大型数据集中检索与问题相关的信息,再使用这些信息生成回答。 实现知识库问答功能,需创建包含大量 AI 相关文章和资料的知识库,通过手工录入上传文章内容。在设计 Bot 时,添加知识库,并设置合适的搜索策略、最大召回数量和最小匹配度,以结合知识库返回的内容进行回答。
2025-03-05
我想搭建自己的知识库,然后进行知识提取和查询辅助我进行办公和内容生成,请问有哪些工具好用?
以下是一些可用于搭建知识库并进行知识提取和查询以辅助办公和内容生成的工具: 1. ChatGPT:可以生成文章、故事、诗歌、歌词等内容,作为聊天机器人后端提供自然对话体验,用于问答系统、文本摘要、机器翻译、教育等,还能生成代码片段。相关网址:https://chat.openai.com/ 、https://bard.google.com/extensions 、https://claude.ai/ 。 2. ExoBrain 的集成软件:作为外脑的主要记忆空间,能捕获各种数字内容,挂接和导入外部记忆,快速理解内容,灵活创作笔记,生成创作建议,与外脑知识库对话并自动做外部检索完善答案。相关网址:https://hallid.ai/?ref=indigox.me ,关注获取最新信息。 3. 多维表格:用表格+AI进行信息整理、提效、打标签,满足 80%数据处理需求。相关文章: ,适用人群为 Excel 重度使用者、手动数据处理使用者、文件工作者。 4. Cursor:通过 AI 工具对编程祛魅,降低技术壁垒。相关文章: ,适用人群为 0 编程经验、觉得编程离我们很遥远的小白。 5. Suno:AI 赋能音乐创作,无需乐理知识即可参与音乐制作。相关文章: ,适用人群为 0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白。 6. 其他工具: PPT 生成: 。 音视频提取总结:https://bibigpt.co/r/AJ 。 播客总结:https://podwise.xyz/dashboard/trending 。 生成脑图:https://xmind.ai/editor/ 。 PDF 对话:演示 www.chatpdf.com 。
2025-03-05
如何在电脑硬件配置普通的情况下,用AI搭建知识库
在电脑硬件配置普通的情况下,用 AI 搭建知识库可以参考以下几种方法: 使用阿里云百炼: 1. 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传相关文档。 2. 建立索引:进入,根据引导创建一个新的知识库,并选择刚才上传的文件,其他参数保持默认即可。 3. 选择向量存储类型时,如果您希望集中存储、灵活管理多个应用的向量数据,可选择 ADBPG。 4. 引用知识:完成知识库的创建后,可以返回进入到刚才创建的应用设置界面,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。 使用 GPT: 要搭建基于 GPT API 的定制化知识库,涉及到给 GPT 输入(投喂)定制化的知识。但 GPT3.5,也就是当前免费版的 ChatGPT 一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字。为了使用 GPT 的语言能力来处理大量的领域知识,OpenAI 提供了 embedding API 解决方案。参考 OpenAI embedding documents。embeddings 是一个浮点数字的向量(列表)。两个向量之间的距离衡量它们的关联性。小距离表示高关联度,大距离表示低关联度。 使用 Dify: 1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式,并对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集,为数据集编写良好的描述。 3. 配置索引方式:Dify 提供了三种索引方式供选择,包括高质量模式、经济模式和 Q&A 分段模式,根据实际需求选择合适的索引方式。 4. 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用,在应用设置中,可以配置数据集的使用方式。 5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代,定期更新知识库,增加新的内容以保持知识库的时效性。
2025-03-05
怎么搭建智能体
搭建智能体主要包括以下步骤: 1. 创建智能体:输入人设等信息,并放上相关工作流。配置完成后进行测试,但千万不要直接发布。如果工作流中涉及使用个人的 token,为避免他人调用消耗个人费用,可以将 token 作为工作流开始的输入,让用户购买后自行输入再发布。 2. 确定智能体的结构: 按照市场营销逻辑组织智能体结构,例如在品牌卖点提炼中,以品牌卖点提炼六步法为核心流程,加入其他分析助手,如品牌卖点定义与分类助手、STP 市场分析助手、用户画像分析助手、触点收集助手等。 同时还包括一些未在结构中体现但在后续应用中有效的分析工具,如用户需求分析的 KANO 助手、营销六层转化漏斗分析、超级转化率六要素等。 3. 明确 KnowHow 和 AI 的能力:在搭建智能体前,要明确 AI 的能力边界,例如 AI 不了解公司的主要产品、独特之处、获得的认可、核心渠道、核心购买人群、营销手段、期望的新渠道结果等。同时,要清楚 AI 在逻辑推理、数据分析、内容理解和输出方面的能力,将智能体确定为引导型的助手,在寻找卖点时提供更多思考维度。
2025-03-05
如果要搭建一个自己的业务知识的结构化知识库,推荐哪个平台和工具?
以下是为您推荐的搭建自己业务知识结构化知识库的平台和工具: 1. Coze: 影响 RAG 输出质量的因素:当下这些平台的 RAG 能力对问答场景友好,其他场景效果一般。若需要企业级复杂知识库场景,可能需要找专业团队,收费几万到几十万不等。 基础能力:包括提示词(设定 Bot 身份、目标和技能)、插件(通过 API 连接集成平台和服务)、工作流(规划和实现复杂功能逻辑)、记忆库(保留和理解对话细节,添加外部知识库)。 相关参考:编写提示(https://www.coze.cn/docs/guides/prompt)、插件介绍(https://www.coze.cn/docs/guides/create_plugin)、工作流介绍(https://www.coze.cn/docs/guides/workflow)、知识库介绍(https://www.coze.cn/docs/guides/knowledge)、数据库(https://www.coze.cn/docs/guides/database)。 2. 您还可以参考以下文章: 《小七姐:信息管理工具与方法》:从信息源的选择、信息通路的建立、知识结构化、知识内化与应用等方面展示了信息管理和知识体系搭建的过程。 《这可能是讲 Coze 的知识库最通俗易懂的文章了》:其中提到如果想使用专门搭建个人知识库的软件,可以查看《手把手教你本地部署大模型以及搭建个人知识库》(https://waytoagi.feishu.cn/wiki/ZKGmwsQhTihYZ8kdu7uccF1lnQc?from=from_copylink),忽略本地部署大模型环节,直接看其中推荐的软件。但使用该软件可能需要对接一些额外的 API,建议先了解 RAG 的原理再使用。
2025-03-05