Chat with Wiki - 如何利用飞书构建RAG系统

Answer

以下是关于如何利用飞书构建 RAG 系统的相关内容：

RAG 的常见误区：

随意输入任何文档就能得到准确回答：这是常见误区，RAG 流程包含离线环节（文档解析、切割及向量化写入向量数据库）和在线检索环节（用户问题理解、初步检索、重排序及大模型生成），任何环节都会影响最终质量，有效实现 RAG 系统需要考虑多个复杂因素，如文档预处理、高效索引、相关性排序等，需要专业知识和持续优化。
RAG 完全消除了 AI 的幻觉：虽然 RAG 可以显著减少幻觉，但并不能完全消除，只要有大模型参与，就有可能产生幻觉。
RAG 不消耗大模型的 Token 了：从大模型生成结果环节可以看出，最终还是将知识库中检索的结果给到 LLM，然后由 LLM 进行重新整理输出，所以 RAG 仍然消耗大模型的 Token。

本地部署资讯问答机器人：Langchain + Ollama + RSSHub 实现 RAG：

加载所需的库和模块，如 feedparse 用于解析 RSS 订阅源，ollama 用于在 python 程序中跑大模型，使用前需确保 ollama 服务已开启并下载好模型。
从订阅源获取内容，通过函数从指定的 RSS 订阅 url 提取内容，将长文本拆分成较小的块，并附带相关元数据，最终合并成列表返回。
为文档内容生成向量，使用文本向量模型 bge-m3，从 hf 下载好模型后，通过函数利用 FAISS 创建高效的向量存储。

RAG 性能提升策略和评估方法（产品视角）：

前言：RAG 是检索增强生成的缩写，是结合检索模型和生成模型的技术，核心目的是把知识告诉给 AI 大模型，让其“懂”我们，核心流程是根据用户提问从私有知识中检索相关内容，与用户提问一起放入 prompt 中提交给大模型，常见应用场景如知识问答系统。

Content generated by AI large model, please carefully verify (powered by aily)

References

胎教级教程：万字长文带你理解 RAG 全流程

RAG技术无疑是AI领域的一个重要技术，但了解其局限性和正确使用方法同样重要。这一章节，我们来聊聊大家在学习了RAG了之后常见的一些误区。[heading2]随意输入任何文档就能得到准确回答[content]这是最常见的误区，这也是我写这篇文章的一个主要原因之一。很多人在了解了RAG之后，尤其是看过很多营销号的内容之后，感觉像捡到了宝贝。这会给人一种错觉：好像随意的输入任何文档就可以得到准确的回答。上文我们已经讲了RAG的流程，主要包含：离线环节：文档解析，文档切割以及向量化写入向量数据库在线检索环节：用户问题理解、初步检索、重排序以及大模型生成上述的任何一环节而言都会影响RAG的最终质量。尽管RAG的基本概念不难理解，但有效实现RAG系统需要考虑多个复杂因素，如文档预处理、高效索引、相关性排序等。这些都需要专业知识和持续优化[heading2]RAG完全消除了AI的幻觉[content]虽然RAG可以显著减少幻觉，但并不能完全消除。模型仍可能在检索到的信息基础上进行不当的推理或生成错误信息。简单来讲：只要有大模型参与，就有可能产生幻觉[heading2]RAG不消耗大模型的Token了[content]从上面的最后大模型生成结果环节可以看出，最终还是将知识库中检索的结果给到LLM。然后由LLM进行重新整理输出，所以RAG仍然是消耗大模型的Token的请注意：RAG技术并不是简单的将知识库的内容直接检索出来给到用户，而是要经过大模型的处理，从而生成上下文更通顺的回答

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

加载所需的库和模块。其中，feedparse用于解析RSS订阅源ollama用于在python程序中跑大模型，使用前请确保ollama服务已经开启并下载好模型|从订阅源获取内容下面函数用于从指定的RSS订阅url提取内容，这里只是给了一个url，如果需要接收多个url，只要稍微改动即可。然后，通过一个专门的文本拆分器将长文本拆分成较小的块，并附带相关的元数据如标题、发布日期和链接。最终，这些文档被合并成一个列表并返回，可用于进一步的数据处理或信息提取任务。|为文档内容生成向量这里，我们使用文本向量模型bge-m3。https://huggingface.co/BAAI/bge-m3bge-m3是智源研究院发布的新一代通用向量模型，它具有以下特点：支持超过100种语言的语义表示及检索任务，多语言、跨语言能力全面领先（M ulti-Lingual）最高支持8192长度的输入文本，高效实现句子、段落、篇章、文档等不同粒度的检索任务（M ulti-Granularity）同时集成了稠密检索、稀疏检索、多向量检索三大能力，一站式支撑不同语义检索场景（M ulti-Functionality）从hf下载好模型之后，假设放置在某个路径/path/to/bge-m3，通过下面函数，利用FAISS创建一个高效的向量存储。|实现RAG

RAG性能提升策略和评估方法（产品视角）

作者：牛大局原文：[RAG性能提升策略和评估方法（产品视角）](https://iac2rhlh02p.feishu.cn/wiki/WL4Lwx5dyigl4zkZQojc7esQnWf)[heading1]一、前言[content]相信经过一年的知识沉淀，RAG是什么大家都不陌生了。RAG是检索增强生成（Retrieval-Augmented Generation）的缩写，它是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给AI大模型，让大模型“知道”我们的私有知识，变得越来越“懂”我们。RAG的核心流程是根据用户提问，从私有知识中检索到“包含答案的内容”，然后把“包含答案的内容”和用户提问一起放到prompt（提示词）中，提交给大模型，此时大模型的回答就会充分考虑到“包含答案的内容”。RAG的最常见应用场景知识问答系统：RAG可以用于构建问答系统，用户提出问题，RAG模型从大规模的文档集合中检索相关的文档，然后生成回答。