Chat with Wiki - RAG技术

Answer

RAG 即检索增强生成（Retrieval Augmented Generation），是一种结合了检索和生成的技术。以下是关于 RAG 的详细介绍：

应用背景：大模型的训练数据有截止日期，当需要依靠不在训练集中的数据时，RAG 可发挥作用。
抽象过程：包括文档加载（从多种来源加载文档，如 LangChain 提供 100 多种文档加载器）、文本分割（把文档切分为指定大小的块）、存储（将切分好的文档块嵌入并转换为向量形式存储到向量数据库）、检索（通过检索算法找到与输入问题相似的嵌入片）、输出（把问题及检索出的嵌入片提交给 LLM 生成更合理答案）。
与 LangChain 的关系：LangChain 是用于构建高级语言模型应用程序的框架，提供实现 RAG 必需的工具和组件。两者关系包括框架与技术、模块化实现、简化开发、提高性能、应用构建等方面。
核心流程：根据用户提问从私有知识中检索“包含答案的内容”，将其与用户提问一起放入提示词中提交给大模型，使大模型回答充分考虑该内容。
常见应用场景：如用于构建知识问答系统，用户提问后，RAG 模型从大规模文档集合中检索相关文档并生成回答。

Content generated by AI large model, please carefully verify (powered by aily)

References

因为利用大模型的能力搭建知识库本身就是一个RAG技术的应用。所以在进行本地知识库的搭建实操之前，我们需要先对RAG有一个大概的了解。以下内容会有些干，我会尽量用通俗易懂的描述进行讲解。我们都知道大模型的训练数据是有截止日期的，那当我们需要依靠不包含在大模型训练集中的数据时，我们该怎么做呢？实现这一点的主要方法就是通过检索增强生成RAG（Retrieval Augmented Generation）。在这个过程中，首先检索外部数据，然后在生成步骤中将这些数据传递给LLM。我们可以将一个RAG的应用抽象为下图的5个过程：文档加载（Document Loading）：从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器，包括PDF在内的非结构化的数据、SQL在内的结构化的数据，以及Python、Java之类的代码等文本分割（Splitting）：文本分割器把Documents切分为指定大小的块，我把它们称为“文档块”或者“文档片”存储（Storage）：存储涉及到两个环节，分别是：将切分好的文档块进行嵌入（Embedding）转换成向量的形式将Embedding后的向量数据存储到向量数据库检索（Retrieval）：一旦数据进入向量数据库，我们仍然需要将数据检索出来，我们会通过某种检索算法找到与输入问题相似的嵌入片Output（输出）：把问题以及检索出来的嵌入片一起提交给LLM，LLM会通过问题和检索出来的提示一起来生成更加合理的答案[heading2]文本加载器（Document Loaders）[content]文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理

问：LangChain 和 RAG 有什么关系？

LangChain是一个用于构建高级语言模型应用程序的框架，它提供了一系列的工具和组件，使得开发人员能够更容易地使用大型语言模型（LLM）来创建各种应用程序。LangChain的设计主张集中在模块化组件上，这些组件提供用于使用LLM的行为抽象，并为每个抽象提供实现的集合，从而允许开发人员构造新链或实现现成的链。RAG，即检索增强生成（Retrieval-Augmented Generation），是一种结合了检索（检索外部知识库中相关信息）和生成（利用LLM生成文本）的技术。RAG能够为LLM提供来自外部知识源的附加信息，使得LLM在应对下游任务时能够生成更精确和上下文相关的答案，并减少LLM的幻觉现象。LangChain和RAG之间的关系可以概括为：1.框架与技术：LangChain作为一个框架，提供了实现RAG所必需的工具和组件。RAG作为一项技术，可以在LangChain框架内得以实施和利用。2.模块化实现：LangChain允许开发者通过其模块化组件来构建RAG应用程序，例如使用LangChain的检索器（Retriever）和生成模型（LLM）来创建一个完整的RAG流程。3.简化开发：LangChain通过提供现成的链（Off-the-shelf chains）和提示模板（Prompt Templates），简化了RAG应用程序的开发过程。4.提高性能：利用LangChain实现RAG可以帮助开发者创建更高效、更准确的应用程序，特别是在需要大量外部信息来辅助决策的场景中。5.应用构建：LangChain通过其丰富的API和组件库，支持开发者构建复杂的RAG应用，如智能问答系统、内容推荐引擎等。

RAG性能提升策略和评估方法（产品视角）

作者：牛大局原文：[RAG性能提升策略和评估方法（产品视角）](https://iac2rhlh02p.feishu.cn/wiki/WL4Lwx5dyigl4zkZQojc7esQnWf)[heading1]一、前言[content]相信经过一年的知识沉淀，RAG是什么大家都不陌生了。RAG是检索增强生成（Retrieval-Augmented Generation）的缩写，它是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给AI大模型，让大模型“知道”我们的私有知识，变得越来越“懂”我们。RAG的核心流程是根据用户提问，从私有知识中检索到“包含答案的内容”，然后把“包含答案的内容”和用户提问一起放到prompt（提示词）中，提交给大模型，此时大模型的回答就会充分考虑到“包含答案的内容”。RAG的最常见应用场景知识问答系统：RAG可以用于构建问答系统，用户提出问题，RAG模型从大规模的文档集合中检索相关的文档，然后生成回答。