Chat with Wiki - RAG的局限

Answer

RAG 技术存在以下局限性：

知识领域方面：适合打造专才，不适合打造通才。能够提供新的信息、专有领域知识等，但不适合提供通用领域知识。
模型输出方面：让模型保持稳定的风格或结构输出，降低 token 消耗等，这两点需要使用微调技术解决。
检索质量方面：RAG 技术的表现高度依赖于检索到的信息质量。如果知识库中的信息存在错误或偏差，生成内容也可能受其影响。
资源需求方面：计算资源需求较高，可能限制其在资源有限的场景中的应用。
处理速度方面：由于需要先进行信息检索，再进行内容生成，处理速度相对较慢，可能不适合实时性要求高的应用。
可能引入错误和幻觉：例如检索出不相关或不准确的文本片段，或者生成与输入或上下文不一致的输出。

Content generated by AI large model, please carefully verify (powered by aily)

References

如果LLM应用面临的问题与上下文有关，那么RAG就是一个强大的工具。它使模型能够访问外部数据源，提供模型训练数据中不存在的必要上下文。这种方法可以显著提高模型的性能，尤其是在最新信息或特定领域信息至关重要的情况下。为模型提供参考文本的情况下，也能大大降低模型幻觉。需要注意的是RAG的局限性如下：适合打造专才，不适合打造通才。虽然能够为模型提供新的信息、专有领域知识等，但并不适合为模型提供通用领域知识。让模型保持稳定的风格或结构输出，降低token消耗等。也就是我们在prompt工程局限性的后两点，而这两点需要使用微调技术解决。

【深度揭秘】AI 幻觉背后的技术真相与应对策略，探索人工智能的未来

尽管RAG技术在减少AI幻觉方面表现出色，但它也存在一些局限性：依赖检索质量：RAG技术的表现高度依赖于检索到的信息质量。如果知识库中的信息存在错误或偏差，生成内容也可能受其影响。计算资源需求高：RAG技术结合了检索和生成两部分，计算资源需求较高，可能限制其在资源有限的场景中的应用。处理速度慢：由于需要先进行信息检索，再进行内容生成，RAG技术的处理速度相对较慢，可能不适合实时性要求高的应用。

如何基于飞书能力来开发问答机器人

RAG技术的缺点是也可能引入一些错误和幻觉，例如检索出不相关或不准确的文本片段，或者生成与输入或上下文不一致的输出。参考文档：1.[开发：LangChain应用开发指南-大模型的知识外挂RAG](https://waytoagi.feishu.cn/wiki/GnYQw1kbairUbSka90gc4XCAnSe)2.[开发：LangChain应用开发指南-大模型的知识外挂RAG](https://waytoagi.feishu.cn/wiki/EQrQwYmKpisP4RkvJZocX8nNnAL)3.[开发：产品视角的大模型RAG应用](https://waytoagi.feishu.cn/wiki/WiAwwqSfYiT8sKkYU33c7FMpnvh)4.[通过增强PDF结构识别，革新检索增强生成技术(RAG)](https://waytoagi.feishu.cn/wiki/TcwvwTa7Mij60WkM1b7cojnEnIg)5.[开发：LangChain应用开发指南-TruLens用量化对抗幻觉](https://waytoagi.feishu.cn/wiki/XXFDwmeLUiVV6Jkgb5HcTKnhntk)6.[RAG系统开发中的12大痛点及解决方案](https://waytoagi.feishu.cn/wiki/JG7rwbXKzi1f0Lk9Br8crFmPn8g)7.[XiaoHu.AI日报](https://waytoagi.feishu.cn/wiki/T2fUwmHBSiHU6Ukq9Imcu7n7nMh)