Chat with Wiki - RAG技术是什么

Answer

RAG 即检索增强生成（Retrieval-Augmented Generation），是一种结合了检索模型和生成模型的技术。

其核心目的是通过某种途径把知识告诉给 AI 大模型，让大模型“知道”我们的私有知识，变得越来越“懂”我们。

在这个过程中，首先检索外部数据，然后在生成步骤中将这些数据传递给 LLM。

一个 RAG 的应用通常包含以下 5 个过程：

文档加载：从多种不同来源加载文档，如 PDF 在内的非结构化数据、SQL 在内的结构化数据，以及 Python、Java 之类的代码等。
文本分割：文本分割器把 Documents 切分为指定大小的块，称为“文档块”或者“文档片”。
存储：涉及将切分好的文档块进行嵌入转换成向量的形式，并将 Embedding 后的向量数据存储到向量数据库。
检索：通过某种检索算法找到与输入问题相似的嵌入片。
输出：把问题以及检索出来的嵌入片一起提交给 LLM，LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。

RAG 的最常见应用场景是知识问答系统，用户提出问题，RAG 模型从大规模的文档集合中检索相关的文档，然后生成回答。

LangChain 是一个用于构建高级语言模型应用程序的框架，它与 RAG 的关系为：

LangChain 作为框架，提供了实现 RAG 所必需的工具和组件。
RAG 作为技术，可以在 LangChain 框架内得以实施和利用。
LangChain 允许开发者通过其模块化组件来构建 RAG 应用程序。
LangChain 通过提供现成的链和提示模板，简化了 RAG 应用程序的开发过程。
利用 LangChain 实现 RAG 可以帮助开发者创建更高效、更准确的应用程序，特别是在需要大量外部信息来辅助决策的场景中。
LangChain 通过其丰富的 API 和组件库，支持开发者构建复杂的 RAG 应用，如智能问答系统、内容推荐引擎等。

Content generated by AI large model, please carefully verify (powered by aily)

References

手把手教你本地部署大模型以及搭建个人知识库

因为利用大模型的能力搭建知识库本身就是一个RAG技术的应用。所以在进行本地知识库的搭建实操之前，我们需要先对RAG有一个大概的了解。以下内容会有些干，我会尽量用通俗易懂的描述进行讲解。我们都知道大模型的训练数据是有截止日期的，那当我们需要依靠不包含在大模型训练集中的数据时，我们该怎么做呢？实现这一点的主要方法就是通过检索增强生成RAG（Retrieval Augmented Generation）。在这个过程中，首先检索外部数据，然后在生成步骤中将这些数据传递给LLM。我们可以将一个RAG的应用抽象为下图的5个过程：文档加载（Document Loading）：从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器，包括PDF在内的非结构化的数据、SQL在内的结构化的数据，以及Python、Java之类的代码等文本分割（Splitting）：文本分割器把Documents切分为指定大小的块，我把它们称为“文档块”或者“文档片”存储（Storage）：存储涉及到两个环节，分别是：将切分好的文档块进行嵌入（Embedding）转换成向量的形式将Embedding后的向量数据存储到向量数据库检索（Retrieval）：一旦数据进入向量数据库，我们仍然需要将数据检索出来，我们会通过某种检索算法找到与输入问题相似的嵌入片Output（输出）：把问题以及检索出来的嵌入片一起提交给LLM，LLM会通过问题和检索出来的提示一起来生成更加合理的答案[heading2]文本加载器（Document Loaders）[content]文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理

RAG性能提升策略和评估方法（产品视角）

作者：牛大局原文：[RAG性能提升策略和评估方法（产品视角）](https://iac2rhlh02p.feishu.cn/wiki/WL4Lwx5dyigl4zkZQojc7esQnWf)[heading1]一、前言[content]相信经过一年的知识沉淀，RAG是什么大家都不陌生了。RAG是检索增强生成（Retrieval-Augmented Generation）的缩写，它是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给AI大模型，让大模型“知道”我们的私有知识，变得越来越“懂”我们。RAG的核心流程是根据用户提问，从私有知识中检索到“包含答案的内容”，然后把“包含答案的内容”和用户提问一起放到prompt（提示词）中，提交给大模型，此时大模型的回答就会充分考虑到“包含答案的内容”。RAG的最常见应用场景知识问答系统：RAG可以用于构建问答系统，用户提出问题，RAG模型从大规模的文档集合中检索相关的文档，然后生成回答。

问：LangChain 和 RAG 有什么关系？

LangChain是一个用于构建高级语言模型应用程序的框架，它提供了一系列的工具和组件，使得开发人员能够更容易地使用大型语言模型（LLM）来创建各种应用程序。LangChain的设计主张集中在模块化组件上，这些组件提供用于使用LLM的行为抽象，并为每个抽象提供实现的集合，从而允许开发人员构造新链或实现现成的链。RAG，即检索增强生成（Retrieval-Augmented Generation），是一种结合了检索（检索外部知识库中相关信息）和生成（利用LLM生成文本）的技术。RAG能够为LLM提供来自外部知识源的附加信息，使得LLM在应对下游任务时能够生成更精确和上下文相关的答案，并减少LLM的幻觉现象。LangChain和RAG之间的关系可以概括为：1.框架与技术：LangChain作为一个框架，提供了实现RAG所必需的工具和组件。RAG作为一项技术，可以在LangChain框架内得以实施和利用。2.模块化实现：LangChain允许开发者通过其模块化组件来构建RAG应用程序，例如使用LangChain的检索器（Retriever）和生成模型（LLM）来创建一个完整的RAG流程。3.简化开发：LangChain通过提供现成的链（Off-the-shelf chains）和提示模板（Prompt Templates），简化了RAG应用程序的开发过程。4.提高性能：利用LangChain实现RAG可以帮助开发者创建更高效、更准确的应用程序，特别是在需要大量外部信息来辅助决策的场景中。5.应用构建：LangChain通过其丰富的API和组件库，支持开发者构建复杂的RAG应用，如智能问答系统、内容推荐引擎等。