以下是关于“meta prompt”的相关内容:
//提示必须以具体、客观的细节复杂地描述图像的每一部分。思考描述的最终目标是什么,并推断出什么会使令人满意的图像。//发送给dalle的所有描述都应该是一段非常描述性和详细的文本。每一个都应该超过三个句子。//从纯文本提示符创建图像。类型text 2 im =(_:{//请求的图像的分辨率,可以是宽的、正方形的或高的。使用1024 x1024(正方形)作为默认值,除非提示建议使用宽图像1792 x1024或全身肖像,在这种情况下,应使用1024 x1792(高)。始终在请求中包含此参数。尺寸?:“1792x1024”|“1024x1024”|“1024x1792”,//用户的原始图像描述,可能被修改以遵守dalle策略。如果用户没有建议创建多个字幕,则创建其中的四个。如果要创建多个标题,请使它们尽可能多样化。如果用户请求修改先前的图像,则字幕不应该简单地更长,而是应该重构以将建议集成到每个字幕中。生成不超过4个图像,即使用户请求更多。提示:string[],
我们使用指导工具包⁷实现元提示词,该工具包支持多轮对话,并支持基本的handlebars风格的语法来控制工作流程。⁷https://github.com/guidance-ai/guidanceB.4 PE2
将这两个观察联系起来,在这项工作中,我们对PROMPT ENGINEERING A PROMPT ENGINEER——构建一个元提示指导LLM更有效地进行提示词工程(§3;图2)。通过反思现有方法的局限性并结合近期在复杂推理提示方面的进展,我们引入了元提示组件,如逐步推理模板和上下文规范,以明确指导LLM在提示词工程过程中进行推理。此外,由于提示词工程可以被视为一个优化问题,我们从常见的优化概念(如批量大小、步长和动量)中汲取灵感,并将它们的口头化对应物引入到元提示中。我们在两个数学推理数据集上测试了这些组件及其变体,包括MultiArith(Roy & Roth,2015)和GSM8K(Cobbe等人,2021),并确定了一个最佳性能组合,我们将其命名为PE2(§5.1)。