Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

什么事指代消解

Answer

指代消解是在多轮对话中需要解决的问题。在自然的人类语言交流中,多轮对话常出现使用代词如“它”“他们”“我们”等的指代情况。若仅依据用户原始提问检索知识片段,可能导致结果不精确或无法检索到信息,且对模型回复内容的限制可能影响多轮对话流畅性甚至中断。为提升对话系统性能和用户体验,需开发提示词来解决此问题,确保模型在连续交流中提供准确连贯回答。

由于指代消解需多轮对话完成,单次交互无法达成,所以要转换测试形式,先解决指代消解问题再进行下一轮答复。首先准备所需提示词,这里的提示词是用 CoT 写出的思维链,列举不同推理情景,让模型推理出需消解的代词并重新组织问题。

接着复现代指消解步骤:

  1. 进行第一轮对话,如提出“尼罗河是什么?”,系统召回相关知识片段并回复。
  2. 开始指代消解。
  3. 使用指代消解后的问题进行提问,如“尼罗河对埃及的贡献是什么?”,系统准确召回知识片段并答复。

客观来说,指代消解是利用 RAG 架构构建智能问答系统的关键挑战之一,尤其在多轮对话场景中突出。目前用 Prompt 方法解决,要求模型先解析推理问题再回复,增加了计算资源消耗和系统响应延迟,处理时需权衡推理负荷、Token 消耗和问答准确性等因素,根据应用环境和需求做出合理选择和策略。

Content generated by AI large model, please carefully verify (powered by aily)

References

RAG提示工程(一):基础概念

[title]RAG提示工程(一):基础概念[heading2]六、动手做一个RAG提示词[heading3]6.2过程[heading4]6.2.5 Must To Have:通过多轮对话解决指代消解问题在先前的讨论中,我们主要关注的是单轮问答的情境。然而,在现实世界的对话中,我们往往需要处理连续的多轮对话。在自然的人类语言交流中,多轮对话常常伴随着指代问题的产生,例如使用代词“它”、“他们”、“我们”等。在这种情况下,如果仅仅依据用户的原始提问来检索相关知识片段,可能会导致检索结果的不精确或者无法检索到相关信息。此外,由于我们对模型的回复内容施加了限制,使得模型不再依赖其内部知识库来生成答案,有时这可能会导致多轮对话的流畅性受到影响,甚至出现对话中断的情况。因此,为了提升对话系统的性能和用户体验,我们需要开发提示词来解决多轮对话中的指代消解问题,并确保模型能够在连续的交流中提供准确、连贯的回答。不过,由于“指代消解”需要多轮对话来完成,单次交互是无法达成的(至少目前看来是这样),所以我们需要将测试形式进行转换。首先解决”指代消解“的问题,然后再进行下一轮答复。首先,我们准备指代消解所需的提示词:大家可以看到,这里使用的“指代消解”提示词是使用CoT写出的思维链,我们在这个思维链中列举了不同情况的推理情景,目的就是让模型能够适应并成功推理出需要消解的代词,然后根据消解代词的结果重新组织问题。接着我们开始尝试复现指代消解的步骤:步骤1:进行第一轮对话在第一轮对话中,我们提出问题”尼罗河是什么?“,接着,系统成功召回了关于“尼罗河“的知识片段,并做出了回复。步骤2:开始指代消解

19. RAG 提示工程系列(一)

[title]19.RAG提示工程系列(一)[heading2]六、动手做一个RAG提示词[heading3]6.2过程[heading4]6.2.5 Must To Have:通过多轮对话解决指代消解问题在先前的讨论中,我们主要关注的是单轮问答的情境。然而,在现实世界的对话中,我们往往需要处理连续的多轮对话。在自然的人类语言交流中,多轮对话常常伴随着指代问题的产生,例如使用代词“它”、“他们”、“我们”等。在这种情况下,如果仅仅依据用户的原始提问来检索相关知识片段,可能会导致检索结果的不精确或者无法检索到相关信息。此外,由于我们对模型的回复内容施加了限制,使得模型不再依赖其内部知识库来生成答案,有时这可能会导致多轮对话的流畅性受到影响,甚至出现对话中断的情况。因此,为了提升对话系统的性能和用户体验,我们需要开发提示词来解决多轮对话中的指代消解问题,并确保模型能够在连续的交流中提供准确、连贯的回答。不过,由于“指代消解”需要多轮对话来完成,单次交互是无法达成的(至少目前看来是这样),所以我们需要将测试形式进行转换。首先解决”指代消解“的问题,然后再进行下一轮答复。首先,我们准备指代消解所需的提示词:大家可以看到,这里使用的“指代消解”提示词是使用CoT写出的思维链,我们在这个思维链中列举了不同情况的推理情景,目的就是让模型能够适应并成功推理出需要消解的代词,然后根据消解代词的结果重新组织问题。接着我们开始尝试复现指代消解的步骤:步骤1:进行第一轮对话在第一轮对话中,我们提出问题”尼罗河是什么?“,接着,系统成功召回了关于“尼罗河“的知识片段,并做出了回复。步骤2:开始指代消解

RAG提示工程(一):基础概念

[title]RAG提示工程(一):基础概念[heading2]六、动手做一个RAG提示词[heading3]6.2过程[heading4]6.2.5 Must To Have:通过多轮对话解决指代消解问题首先我们需要把提示词更换为处理”指代消解“的专用提示词,紧接着,我们尝试提问“它对埃及的贡献是什么?”经过指代消解的处理,原先的问题“它对埃及的贡献是什么?”已经转换为更加明确的询问:“尼罗河对埃及的贡献是什么?”随着代词的消失,问题变得具体而清晰,显示出指代消解过程取得了成功。现在,让我们将这个经过优化的问题带入到接下来的对话环节中,以便模型能够准确召回对应知识片段。步骤3:使用指代消解后的问题进行提问:在问题被更换成“尼罗河对埃及的贡献是什么?”后,系统准确的召回了相关的知识片段,并对此进行了答复。至此,”指代消解“的流程演示完毕。客观来看,“指代消解”是利用RAG架构构建智能问答系统时面临的关键挑战之一,特别是在多轮对话的应用场景中尤为突出(毕竟,哪个真实的应用场景不是由一系列多轮对话构成的呢?)。然而,目前采用Prompt方法来解决指代消解问题,要求模型在生成回复之前,首先对问题进行深入的解析和推理。基于这一推理结果,才能继续提出问题。这种做法无疑增加了计算资源的消耗和系统的响应延迟。因此,在处理这类问题时,我们必须全面权衡推理负荷、Token消耗和问答的准确性等多个因素,以便根据具体的应用环境和需求,做出合理的技术选择和应用策略。

Others are asking
你在设计大模型语音座舱功能,怎么设计上下文多轮对话的场景,比如否定、指代、延展等
在设计大模型语音座舱功能中的上下文多轮对话场景时,对于否定的情况,需要准确识别用户表达的否定意图,并据此调整后续的回应策略。例如,当用户说“不要这样做”,系统要理解并停止当前可能进行的相关操作。 指代方面,要能够解析用户话语中的各种指代关系,比如“那个东西”“这个方案”等,通过上下文和语境来明确其具体所指。 延展的场景设计则要鼓励用户进一步展开话题,例如当用户提到一个主题后,系统可以通过提问或提供相关信息来引导用户深入阐述,比如“能再多和我讲讲吗?”或者“那您对这方面还有其他的想法吗?”
2024-08-27