首页/问答列表/问答详情

RAG应该怎么使用呢

回答

RAG（检索增强生成）是一种结合了检索和生成的技术，具有以下特点和使用流程：

特点：

可以让大模型在生成文本时利用额外的数据源，从而提高生成的质量和准确性。
能解决大语言模型在实际应用中的一些问题，如知识局限性、幻觉问题和数据安全性等。

使用流程：

首先，给定一个用户的输入，如问题或话题。
RAG会从数据源（如网页、文档或数据库记录）中检索出与之相关的文本片段，这些片段称为上下文。
将用户的输入和检索到的上下文拼接成一个完整的输入，并传递给大模型（如 GPT）。输入通常包含提示，指导模型生成期望的输出，如答案或摘要。
最后，从大模型的输出中提取或格式化所需的信息，返回给用户。

此外，RAG 可以和微调结合使用，类似于为模型提供教科书，适用于模型回答特定询问或解决特定信息检索任务，但不适合教模型理解广泛领域或学习新的语言、格式或样式。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

开发：LangChain应用开发指南-大模型的知识外挂RAG

RAG是一种结合了检索和生成的技术，它可以让大模型在生成文本时利用额外的数据源，从而提高生成的质量和准确性。RAG的基本流程如下：首先，给定一个用户的输入，例如一个问题或一个话题，RAG会从一个数据源中检索出与之相关的文本片段，例如网页、文档或数据库记录。这些文本片段称为上下文（context）。然后，RAG会将用户的输入和检索到的上下文拼接成一个完整的输入，传递给一个大模型，例如GPT。这个输入通常会包含一些提示（prompt），指导模型如何生成期望的输出，例如一个答案或一个摘要。最后，RAG会从大模型的输出中提取或格式化所需的信息，返回给用户。

开发：LangChain应用开发指南-大模型的知识外挂RAG

19. RAG 提示工程系列（一）

[title]19.RAG提示工程系列（一）[heading2]二、什么是RAG？[heading3]优势大语言模型技术的本质导致了大模型的输出结果具有不可预测性，此外，静态的训练数据导致了大模型所掌握的知识存在截止日期，无法即时掌握最新信息。因此，当我们将大模型应用于实际业务场景时会发现，通用的基础大模型无法满足我们的实际业务需求。主要存在以下原因：知识的局限性：模型自身的知识完全源于它的训练数据，而现有的主流大模型（ChatGPT、文心一言、通义千问…）的训练集基本都是抓取网络公开的数据用于训练，对于一些实时性的、非公开的或离线的数据是无法获取到的，这部分知识也就无从具备。幻觉问题：大模型的底层原理是基于数学概率的文字预测，即文字接龙。因此大模型存在幻觉问题，会在没有答案的情况下提供虚假信息，提供过时或通用的信息，从可信度低非权威来源的资料中提供结果等。数据安全性：对于企业来说，数据安全至关重要，没有企业愿意承担数据泄露的风险，将自身的私域数据上传第三方平台进行训练。因此如何大模型落地应用时如何保障企业内部数据安全是一个重要问题。而RAG是解决上述问题的一套有效方案。它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息，更好地控制大模型生成的文本输出，并且用户可以深入了解LLM如何生成最终的结果。并且，RAG可以和微调结合使用，两者并不冲突。RAG类似于为模型提供教科书，允许它基于特定查询检索信息。这该方法适用于模型需要回答特定的询问或解决特定的信息检索任务。然而，RAG不适合教模型来理解广泛的领域或学习新的语言，格式或样式。

其他人在问

RAG

RAG（RetrievalAugmented Generation）即检索增强生成，是一种结合检索和生成能力的自然语言处理架构。它旨在为大语言模型（LLM）提供额外的、来自外部知识源的信息。通过检索的模式为大语言模型的生成提供帮助，使大模型生成的答案更符合要求。 LLM 需要 RAG 进行检索优化的原因在于 LLM 存在一些缺点： 1. 无法记住所有知识，尤其是长尾知识，受限于训练数据和学习方式，对长尾知识的接受能力不高。 2. 知识容易过时且不好更新，微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证，存在内容黑盒、不可控以及受幻觉问题干扰的情况。 4. 容易泄露隐私训练数据。 5. 规模大，训练和运行成本高。 RAG 具有以下优点： 1. 数据库对数据的存储和更新稳定，不存在模型学不会的风险。 2. 数据库的数据更新敏捷，可解释且对原有知识无影响。 3. 数据库内容明确、结构化，结合模型的理解能力，降低大模型输出出错的可能。 4. 便于管控用户隐私数据，可控、稳定、准确。 5. 可降低大模型的训练成本，新知识存储在数据库即可，无需频繁更新模型。 RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色，在使用 MSMARCO 和 Jeopardy 问题进行测试时，生成的答案更符合事实、具体且多样，FEVER 事实验证使用 RAG 后也得到了更好的结果。基于检索器的方法越来越流行，常与 ChatGPT 等流行 LLM 结合使用来提高其能力和事实一致性。在商业化问答场景中，优化 AI 更准确回答问题的过程中，RAG 是一个重要的术语。它由检索器和生成器两部分组成，检索器从外部知识中快速找到与问题相关的信息，生成器利用这些信息制作精确连贯的答案，适合处理需要广泛知识的任务，如问答系统，能提供详细准确的回答。

2024-11-04

rag 多智能体

多智能体（MultiAgent）是由多个自主、独立的智能体（Agent）组成的系统。在这个系统中，每个智能体都能感知环境、进行决策并执行任务，且它们之间可进行信息共享、任务协调与协同行动以实现整体目标。随着大型语言模型（LLM）出现，以 LLM 为核心构建的 Agent 系统受广泛关注。Agent 系统会为不同 Agent 分配角色和任务信息，并配备工具插件以完成复杂任务。目前常见框架多集中在单 Agent 场景，其核心在于 LLM 与工具协同配合，可能需与用户多轮交互。同时，更多 Agent 框架开始关注多 Agent 场景，会为不同 Agent 指定角色并通过协作完成复杂任务，与用户交互可能减少。构建多 Agent 框架，需考虑相对于单 Agent 增加的组件，如： 1. 环境（environment）：所有 Agent 处于同一环境，环境含全局状态信息，Agent 与环境有信息交互与更新。 2. 阶段（stage）：现有多 Agent 框架常采用 SOP 思想，将复杂任务分解为多个子任务。 3. 控制器（controller）：可以是 LLM 或预先定义好的规则，负责环境在不同 Agent 和阶段间切换。 4. 记忆：多 Agent 框架中因 Agent 数量增多，消息数量及相关字段增多。 OpenAI 官方开源多智能体框架「Swarm」，其优势在于处理了不同智能体之间通信的“交接”逻辑。例如构建客服多智能体，可能只需准备普通接线客服和宽带客服两个 Agent。另外，轨道智能体是一类更高级的智能体，被赋予更高级目标和更多自由度，仍受程序性知识指导，拥有预定义工具并受约束。运行时会产生特定模式，可能需要额外数据基础设施支持。

2024-11-04

有没有关于RAG的实践

以下是关于 RAG 的一些实践： OpenAI 的实践：从 45%的准确率开始，尝试多种方法，如假设性文档嵌入（HyDE）和精调嵌入等，效果不理想。通过尝试不同大小块的信息和嵌入不同的内容部分，准确率提升到 65%。通过 Reranking 和对不同类别问题特别处理，进一步提升到 85%。最终，通过提示工程、查询扩展等方法结合，达到 98%的准确率。团队强调了模型精调和 RAG 结合使用的强大潜力，尤其是在未使用复杂技术的情况下，仅通过简单的模型精调和提示工程就接近行业领先水平。本地部署大模型以及搭建个人知识库：利用大模型的能力搭建知识库是 RAG 技术的应用。RAG 应用可抽象为 5 个过程，包括文档加载、文本分割、存储（包括嵌入和向量数据存储）、检索、输出（把问题及检索出的嵌入片提交给 LLM 生成答案）。本地部署资讯问答机器人：基于用户问题从向量数据库中检索相关段落并过滤，让模型参考上下文信息回答，实现 RAG。通过 gradio 创建网页 UI 并进行评测，对不同模型如 Qwen7b、Gemma、Mistral、Mixtral 和 GPT4 进行测试，得出 GPT4 表现最好等结论。同时总结指出上下文数据质量和大模型性能决定 RAG 系统性能上限，RAG 能提升答案质量和相关性，但不能完全消除大模型幻觉、信息滞后问题。

2024-11-03

专门为大模型RAG设计的知识库产品有哪些？

以下是一些专门为大模型 RAG 设计的知识库产品： 1. Metaso.cn：适用于学术、研究领域。 2. So.360.com：在生活方面提供便捷的搜索服务。 3. Felo.ai/search：具有综合性的特点。 4. Devv.ai：主要面向程序员、开发者。 5. Perplexity：属于付费产品，提供高质量的服务。 6. Bing.com：具有通用性。 7. Google.com：在全球范围内提供精准的搜索结果。 RAG 就像一个超级智能的图书馆员，其工作流程包括检索、增强和生成三个环节。在不改变大模型本身的基础上，通过外挂知识库等方式，为模型提供特定领域的数据信息输入，让模型能基于特定的数据生成内容、降低幻觉，实现对该内容更准确的信息检索和生成。 RAG 具有成本效益、灵活性和可扩展性等优点，比如实现成本更低，可以利用多种数据源，能随时增加或更新知识库中的内容。但也存在回答准确性不够的缺点。在一些示例中，如设定使用阿里千问模型作为 AI 模型，将角色设定为“美嘉”并按照其人设、背景和对话风格设定提示词，放入《爱情公寓》全季剧情作为知识库，从而让“美嘉”拥有过往“记忆”。