意图识别是根据输入的内容决定后续环节的一种方式,类似于 if/else 。从输出看,其 reason 通常为英文。它可以被理解为简化版的大语言模型节点,为更精准识别,可优化选项,若不行可换大语言模型节点。
在自然语言处理领域,意图识别虽已被广泛讨论,但随着大型模型兴起,尤其在用作智能体的 Brain 模块时,承担了主要工作任务。其本质是对用户输入指令的分类任务,在单一或多智能体系统中都至关重要。通过如 Siri、小爱同学等常见智能助手的例子可更直观理解。大型模型执行意图识别任务主要基于大量数据训练得到的模型,可通过微调适应特定领域需求。
在 AI 搜索中,意图识别的关键作用是对用户提问进行分类,如分为导航类、信息查询类、交易类、本地信息类等,还包括多级子分类,但面临枚举无法穷尽的问题。对搜索意图分类可匹配更准的信息源和更好的回复提示词,很大程度提升检索召回率,保证搜索结果个性化。目前主流实现方案主要通过提示词请求大模型完成识别,但准确度不够高,大模型的 Function Calling 能力也可理解为一种意图识别。
有点像if/else,它根据输入的内容决定走下一个环节。从它的输出来看,它的reason是英文的。可以简单理解为,它是一个简化版的大语言模型节点。为了更精准识别,可以采取的措看起来只有优化选项,让选项更精准,更凝练,实在不行换大语言模型节点。[heading2]问答节点[content]问答节点非常好解决了传统智能体交互的困扰,它的应用场景可以是不断打磨内容。比如我们让智能体设计一张图,但是不满意,希望基于它来修改,这个时候,就可以借助问答节点,配合循环和图像生成来做。再比如,让智能体不断修改文案,也可以是类似的方案。[heading2]变量节点:[content]用于读取或写入Bot的变量,方便在工作流中存储和传递数据。变量有2个方向,一个是设置变量,一个是获取变量,变量的名称要从智能体设置。否则会提示没有设置变量。非常适合在不同工作流之间传递信息。它内置的变量可以用来获取用户信息,通过经纬度获取城市,从而获取用户所在城市天气等[heading2]图像生成[content]根据不同模型,出现的效果也会不同,相同的提示词,出现的效果也会有所不同。另外有些模型需要参考图,有不同的参考方式传统图像流的大部分功能都已经迁移到插件中比如抠图功能[heading2]画板(海报,解决文字)[content]在画板编辑里面可以设置尺寸,把前面节点的内容都加入进来。小技巧,文字内容,点击上面的框无法移动,还是要点下面黑色字体那个才可以可以自动以画报大小,手工填写即可
尽管意图识别在自然语言处理领域已经是一个被广泛讨论的话题,我们也已经通过各种规模较小的模型来处理这一任务。然而,随着大型模型的兴起,尤其是当这些大型模型被用作智能体的Brain模块时,它们在意图识别方面承担了主要工作任务。[heading3]6.1意图识别定义[content]那么,什么是意图识别呢?当用户输入指令,这些指令通过感知模块传递到Brain模块,Brain模块需要对这些指令做出反应。这个过程在本质上是一种分类任务,即识别并区分用户的具体意图。无论是在单一智能体架构还是复杂的多智能体系统中,意图识别都扮演着至关重要的角色。让我们通过一些具体的例子来更直观地理解意图识别。比如我们常用的Siri、小爱同学,以及其他手机品牌搭载的智能助手。当我们向它们发出指令时,它们能够做出相应的反应。在这个过程中,意图识别起到了关键作用。具体来说,大型模型在执行意图识别任务时,主要是基于前期通过大量数据训练得到的模型。这可以是专门针对意图识别任务训练的大型模型,也可以是通过在特定任务中进行微调来优化的模型。通过微调,可以使模型更好地适应特定领域的任务需求。
第一种方案会有枚举无法穷尽的问题,第二种方案主要问题在于大模型的识别准确度不够高。意图识别另一个关键作用,是对用户提问进行分类,比如可以把用户的搜索意图分为:导航类:用户希望找到特定的网站或网页。例如:搜索“ThinkAny”,是为了打开ThinkAny官网;信息查询类:用户希望找到某个问题的答案或关于某个事物的详细信息。例如:搜索“什么是AI搜索引擎”,是为了了解这类产品或这个行业;交易类:用户希望进行某种交易。例如:搜索“笔记本电脑”是为了找到电脑相关的产品信息和价格信息,并进入推荐的电商网站购买。本地信息类:用户希望根据特定地理位置查找本地信息。例如:搜索“附近的烤肉店”是为了找到附近的餐馆。还有其他一些分类,包括多级子分类。照样面临枚举无法穷尽的问题。对搜索意图进行分类,可以匹配更准的信息源和更好的回复提示词。比如搜索“笔记本电脑”,如果能提取出一个“shopping”意图,就可以挂载亚马逊/淘宝/京东等电商平台的信息源进行更小范围内的搜索,召回的信息会更加精准。同时也可以加载跟此类搜索意图匹配的提示词模板,来控制搜索后的大模型回答内容。意图分类是搜索前一个非常关键的步骤,可以很大程度提升检索召回率,通过不同的提示词模板总结输出,保证了搜索结果的个性化。目前主流的实现方案,主要是通过提示词,请求大模型完成识别。不管是成熟的大模型,还是微调的小模型,准确度都不够高。大模型提供的Function Calling能力也可以理解为一种意图识别。1.问题改写Query Rewrite