Prompt 在激活和运用 AI Agent 的“大脑模块”中起着关键作用,在角色定义、知识处理和逻辑规划等环节都不可或缺。但 Prompt 并非完美无缺,其缺点是使用的 Prompt 越长,消耗的 Token 越多,推理成本可能很高。
对于拟人化程度不高的情况,单纯通过 Prompt 来构建大脑模块(Prompt-tuning)较为适合;而对于“有趣的灵魂”,目前最直接的解决方式是通过微调一个定向模型,微调过程能将信息直接“记忆”在 AI 的“大脑模块”中,提高信息提取效率,减少处理数据量,优化性能和成本。一般创建方式是将 Prompt-tuning 和 Fine-tuning 相结合。
此外,还有如 PromptAgent 这样的优化方法,它将提示词优化视为策略性规划问题,采用基于蒙特卡洛树搜索的规划算法,能自主设计出与专家手工制作同等质量的提示词,并应用于多个实际领域的任务且效果显著。
图10.1.1创建AI Agent的两种手段(来自李博杰的个人博客)不过,虽然Prompt在激活和运用AI Agent的“大脑模块”中扮演着关键角色,但它并非没有缺点。一个很直观的问题是:使用的Prompt越长,消耗的Token也就越多。一个公众人物公开披露的个人信息(身份、言行等),转换成Token数可能高达数百万。这还不考虑模型是否能够处理这么多Token的问题,仅仅是每次推理所需支付的成本——无论是金钱还是时间——都可能非常高昂。所以,单纯通过Prompt来构建大脑模块(Prompt-tuning),一般适合“无趣的灵魂”,即拟人化不是那么重的情况。紧接上面的总结,那”有趣的灵魂"咋办呢?目前,针对"有趣的灵魂"最直接的解决方式就是通过微调一个定向模型来达到上述效果。与Prompt相比,基于微调的方法可以视为将信息直接“记忆”在AI的“大脑模块”中。微调过程本质上是一个信息压缩和整合的过程,它能将例如三万条推特中的零散信息有效地整理并嵌入到大型模型的权重中,且权重占比不到1%。这种方法不仅提高了信息提取的效率,还减少了每次查询或应用时所需处理的数据量,从而优化了性能和成本。"面对有趣的灵魂",一般创建方式是两种结合,即Prompt-tuning +Fine-tuning。
图10.1.1创建AI Agent的两种手段(来自李博杰的个人博客)不过,虽然Prompt在激活和运用AI Agent的“大脑模块”中扮演着关键角色,但它并非没有缺点。一个很直观的问题是:使用的Prompt越长,消耗的Token也就越多。一个公众人物公开披露的个人信息(身份、言行等),转换成Token数可能高达数百万。这还不考虑模型是否能够处理这么多Token的问题,仅仅是每次推理所需支付的成本——无论是金钱还是时间——都可能非常高昂。所以,单纯通过Prompt来构建大脑模块(Prompt-tuning),一般适合“无趣的灵魂”,即拟人化不是那么重的情况。紧接上面的总结,那”有趣的灵魂"咋办呢?目前,针对"有趣的灵魂"最直接的解决方式就是通过微调一个定向模型来达到上述效果。与Prompt相比,基于微调的方法可以视为将信息直接“记忆”在AI的“大脑模块”中。微调过程本质上是一个信息压缩和整合的过程,它能将例如三万条推特中的零散信息有效地整理并嵌入到大型模型的权重中,且权重占比不到1%。这种方法不仅提高了信息提取的效率,还减少了每次查询或应用时所需处理的数据量,从而优化了性能和成本。"面对有趣的灵魂",一般创建方式是两种结合,即Prompt-tuning +Fine-tuning。
高效的、针对特定任务的提示词往往由专家精心设计,整合详细的指令和领域见解,这基于对大型语言模型(LLM)的本能和目标任务的复杂性的深入了解。然而,如何自动化地生成这样的专家级提示词仍然是一个挑战。现有的提示词优化方法往往忽视领域知识的深度,且难以高效地探索专家级提示词的巨大空间。为了解决这一问题,我们提出了PromptAgent,这是一种优化方法,可以自主地设计与专家手工制作的同等质量的提示词。PromptAgent的核心观点是将提示词优化视为一个策略性规划问题,并采用一种基于蒙特卡洛树搜索的原则性规划算法,策略性地导航专家级提示词空间。受到人类试错探索的启发,PromptAgent通过反思模型的错误并生成有建设性的错误反馈,诱导出精确的专家级见解和深入的指令。这种新颖的框架允许智能体迭代地检查中间提示词(状态),基于错误反馈(行为)对其进行细化,模拟未来的回报,并寻找通往专家提示词的高回报路径。我们将PromptAgent应用于跨越三个实际领域的12个任务:BIG-Bench Hard(BBH)、特定领域的NLP任务以及通用的NLP任务,结果显示它显著地超越了强大的Chain-of-Thought以及最近的提示词优化基线。深入的分析强调了其制定专家级、详细和富有领域洞察力的提示词的高效性和普适性。