Chat with Wiki - 怎么让AI识别对话，并生成结构化数据存储到我的软件系统里

Answer

要让 AI 识别对话并生成结构化数据存储到软件系统里，可以参考以下方法：

基于结构化数据来 RAG：如果原始数据本身就是结构化、标签化的，不必将这部分数据做向量化。结构化数据的特点是特征和属性明确，可用有限标签集描述，能用标准查询语言检索。以餐饮生活助手为例，流程包括用户提问、LLM 提取核心信息并形成标准查询、查询结构化数据、LLM 整合回复。
利用 Coze 平台设计 AI 机器人：创建好 Bot 后，从“个人空间”入口找到机器人，进行“编排”设计。Coze 平台常用的概念和功能包括提示词（设定 Bot 身份和目标）、插件（通过 API 连接集成服务）、工作流（设计多步骤任务）、触发器（创建定时任务）、记忆库（保留对话细节，支持外部知识库）、变量（保存用户个人信息）、数据库（存储和管理结构化数据）、长期记忆（总结聊天对话内容）。设计 Bot 时要先确定目的，比如“AI 前线”Bot 的目的是作为 AI 学习助手，帮助职场专业人士提升在人工智能领域的知识和技能，并提供高效站内信息检索服务。

注：Coze 官方使用指南见链接：https://www.coze.cn/docs/guides/welcome ，遇到疑问也可查阅该指南。

Content generated by AI large model, please carefully verify (powered by aily)

References

我们不妨换个思路，上文拆解的三个环节，LLM是自然语言对话的根基无可替代，但是RAG是否必须向量化，必须基于语义召回呢？并非如此，在未引入LLM之前，传统检索信息的方式是通过将数据结构话，将特征提前抽象为列，通过有限的标签集进行描述，最终通过行式数据库存储，以标准sql来查询。传统数据检索的方式胜在准确且高效，弱势则在于查询存在一定门槛，交互上缺少人味。如果原始数据本身就是结构化，标签化的，那么我们大可不必将这部分的数据做embeding。结构化数据的特点是数据的特征和属性都是明确的，可以用有限的标签集进行描述，可以用标准的查询语言进行检索。不用向量也可以RAG的方法的基本思路就是利用结构化数据和LLM的交互，避免数据向量化和语义搜索的问题，直接使用标准查询和原始数据进行回复。基于这个思路，以餐饮生活助手为例，整体的交互处理思路如下：用户提问。用户输入一个自然语言的问题，例如“我们3个人想找个人均50左右的重庆火锅店”。LLM提取核心信息并形成标准查询。LLM根据用户的问题，提取出核心的信息和条件，例如人数、价格、类型等，并形成一个标准的查询语句，例如查询结构化数据。LLM用这个查询语句去检索结构化数据，得到相关的数据记录，例如：LLM整合回复。LLM根据这些数据记录，生成最合适的答案，输出给用户，例如“按您的要求，我找到了居民楼火锅店，位于万松小区，电话是17771857933或18871569657，是一家重庆火锅店，人均消费50元，适合3个人用餐。”这就是基于结构化数据RAG的基本流程，它的优势和特点有以下几点：

「AI 学习三步法：实践」用 Coze 免费打造自己的微信 AI 机器人

创建好Bot后，可以从“个人空间”入口找到自己的机器人，接下来最重要的环节就是设计我们的Bot了，在coze里概念叫“编排”。[heading4]Coze平台功能常用的概念和功能如下[content]（新概念比较多，大家可以先根据我的指引“照猫画虎”，在实践中慢慢消化这些概念）提示词：设定Bot的身份和目标。插件：通过API连接集成各种平台和服务。工作流：设计复杂的多步骤任务。触发器：创建定时任务。记忆库：保留对话细节，支持外部知识库。变量：保存用户个人信息。数据库：存储和管理结构化数据。长期记忆：总结聊天对话内容。[heading4]接下来将演示怎么一步一步设计Bot[content]注：Coze官方使用指南见链接：https://www.coze.cn/docs/guides/welcome，遇到疑问也可以查官方指南。Bot设计步骤（以我的“AI前线”Bot为例）：[heading4]1、确定目的[content]比如我的“AI前线”，目的是：一个AI学习助手，旨在帮助职场专业人士提升他们在人工智能领域的知识和技能。提供高效的站内信息检索服务。

「AI 学习三步法：实践」用 Coze 免费打造自己的微信 AI 机器人