Prompt 是给大模型输入的一段原始输入,能够帮助模型更好地理解用户的需求并按照特定的模式或规则进行响应。它通常以问题或指示的形式出现,比如可以设定“假设你是一位医生,给出针对这种症状的建议”,后续与大模型的对话会按照此设定展开。
Prompt 有多种玩法,例如可以在设定中要求模型按照一定的思路逻辑去回答,像最近比较火的思维链(cot)就是在 prompt 环节对模型的输出进行指导。还可以让模型按照特定格式(如 json)输出,使模型变成一个输出器。
简单来说,Prompt 是一套与大模型交互的语言模板,通过它可以输出对大模型响应的指令,指定大模型应做的任务、如何处理任务,并最终获得期望的结果。大模型本质是基于语言的概率模型,若直接询问而不提供 prompt,模型随机给出答案;有了 prompt 则相当于给了模板,包括对模型的要求、输入和输出的限制,模型在限制下得出概率最大的答案。虽然大模型有基础文字能力能理解大部分话,但为提升回答效果,需要通过 prompt 来提高返回的准确性。在大模型时代,人机交互的主要方式可以认为是 prompt,而非过去通过代码的方式。
ok,在我们对于两个重要的基础模型,llm大语言模型和多模态模型的原理有了基础的认知后,我们可以再进一步,去理解下一些大模型领域常见的些术语名词,究竟是在干些什么,以及都能干什么。[heading3]1.prompt[content]prompt这个词很多人都听到过,甚至一度还出现过prompt优化师这样的角色。那么prompt是做什么的呢?prompt其实是给到大模型输入的一段原始的输入,能够帮助模型更好地理解用户的需求并按照特定的模式或规则进行响应。对于prompt,比如可以设定“假设你是一位医生,给出针对这种症状的建议”,然后你与大模型后续的对话中,都会按照这个原始设定来展开。这里有个比较有意思的玩法,就是我们可以在prompt的设定中,要求模型按照一定的思路逻辑去回答。比如最近比较火的cot,也就是思维链,也是在prompt这个环节,对于模型的输出进行指导。这里的玩法很多,比如我们还可以让模型按照特定格式的json输出等,这样模型真的就可以变成了一个输出器来使用。
A prompt is the text that you give Claude to elicit,or"prompt,"a relevant output.A prompt is usually in the form of a question or instructions.For example:提示是您给Claude的文本,用于引发相关输出。提示通常以问题或指示的形式出现。例如:|Role|Prompt||-|-||User|Why is the sky blue?<br>为什么天空是蓝色的?|The text that Claude responds with is called a"response",sometimes also called an"output"or"completion."Claude回答的文本被称为“响应”,有时也被称为“输出”或“完成”。|Role|Response||-|-||Assistant|The sky appears blue to us due to how the molecules in the air scatter light from the sun.The shorter wavelength light(blue)scatters more easily than the longer wavelength light(like reds and yellows),so when we look up at the sky,what we see is all the scattered blue light.This is known as Rayleigh scattering.The color of the sky varies based on conditions like the angle of the sun and amount of dust/water in the air,but during the day with a clear sky,the blue wavelength of light is most responsible for the color we perceive.<br>对我们来说,天空呈现蓝色是由于大气分子散射来自太阳的光线。较短波长的光(蓝色)比较长波长的光(如红色和黄色)更容易散射,因此当我们抬头望天空时,看到的是散射的蓝色光线。这被称为瑞利散射。天空的颜色会随着太阳角度和空气中灰尘/水的含量等条件而变化,但在白天晴朗的天空中,蓝色光波长最负责我们所感知的颜色。|
原创小宝聊AI小宝聊AI 2024-01-30 00:12发表于浙江小宝聊AI十年大厂架构师,专注于大模型技术和应用29篇原创内容公众号本文长度5000字阅读时长预计需要20分钟本文目录一、什么是Prompt二、用更加专业的方式定义Prompt三、用数学来理解Prompt四、NLP发展的四大范式五、为什么Prompt可以减少幻觉六、Open AI()提供的最佳实践七、可以直接使用Prompt的关键框架八、为什么使用框架的效果好[heading2]1、什么是Prompt[content]简单来说,其实是一套你和大模型交互的一种语言模板。通过这个模版,你可以输出你对于大模型响应的指令,用于大模型应该具体做什么指定,完成什么任务,如何处理具体的任务,并最终输出你期望的结果。虽然大模型具有基础的文字能力,能够理解你对于模型说的大部分话,但是为了达成大模型更好的回答效果,需要通过Prompt,来提升模型返回的准确性。如果说,过去的时代,人机交互的主要方式是通过代码,那么我认为在大模型时代,交互语言的主要方式其实是Prompt。[heading2]2、用更加专业的方式定义[content]Prompt大模型的本质是一个基于语言的概率模型,他返回他觉得概率最大的内容。如果是直接问大模型,没有提供Prompt,相当于大模型随机给出他的答案。有了Prompt,其实是给了一个模板,这个模板包括了对于模型的要求,输入和输出的限制,大模型在这个限制之下,去得到概率最大的答案。