直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

最佳实践prompt

回答

以下是关于 prompt 最佳实践的相关内容:

李继刚等的 prompt 最佳实践:

  • 贡献者包括李继刚、Sailor、田彬玏、Kyle😜、小七姐等群友。
  • 李继刚的相关链接:即刻GitHub,最近收录不是很及时,可以在李继刚的即刻查看更多,每个角色都有版本迭代,会标注版本号,争取每个都更新到最新的版本。李继刚写了上百个这种 Prompt,如果大家有具体场景需求,可以评论中留言,作者说可以来试试帮大家写定制的,当然也可以尝试用这种结构化的方式自己写。使用方法:开一个 new chat,点代码块右上角的复制,发送到 chat 聊天框即可,里面的描述可以按照自己需求修改。思路来源:云中江树的框架:即刻GitHub ,AI 导师作者:Mr.-Ranedeer-AI-Tutor
  • Role:文字排版大师,有适合私域群运营发公告通知等的版本 1,针对比较长的内容更适合的版本 2 以及最新版,案例包括群公告、群通知,小互的每日推文用的上面最新的 prompt:小互的每日动态 ,以下是群主发群公告时生成的,很好用。相关链接:爆款文案模型 、群友的最佳实践💡🔗链接:李继刚等的 prompt 最佳实践 、一个文字游戏🎮🔗链接:一个提示词文字游戏

小七姐:官方最佳 Prompt 实践的六个方法:

  • 06 学习地图 | 编写清晰地说明 - 指定所需的格式/长度,用两个段落概括用三引号分隔的文本,用 3 个要点概括用三引号分隔的文本。要点总结:我们可以明确要求模型按特定数量的字、句子、要点来生成内容,但对于中文来说,由于字符和 token 的映射机制及中文的上下文生成机制问题,精确符合字数的生成不稳定,但对于引用文本的概括或修改,效果相对会变得好很多。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

李继刚等的prompt最佳实践

贡献者:李继刚,Sailor,田彬玏,Kyle😜,小七姐等群友|李继刚的[即刻](https://okjk.co/264vOK)[GitHub](https://github.com/lijigang/prompts):最近收录不是很及时,可以在李继刚的即刻查看更多每个角色都有版本迭代。“- version:0.8”这里会标注版本号,争取每个都更新到最新的版本李继刚写了上百个这种Prompt,如果大家要是有具体场景需求,可以评论中留言.作者说可以来试试帮大家写定制的。当然你也可以尝试用这种结构化的方式自己写。使用方法:开一个new chat,点代码块右上角的复制,发送到chat聊天框即可,里面的描述可以按照自己需求修改思路来源:云中江树的框架:[即刻](https://m.okjike.com/originalPosts/645e48f8f9f51888942247d2?s=eyJ1IjoiNjQyM2IwMDE4NDg5Njk1NGJjYzhkNWU1IiwiZCI6MX0%3D),[GitHub](https://github.com/yzfly/LangGPT)AI导师作者:[Mr.-Ranedeer-AI-Tutor](https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor)

李继刚等的prompt最佳实践

版本1:适合私域群运营发公告通知等版本2,针对比较长的内容更适合最新版案例:群公告,群通知小互的每日推文用的上面最新的prompt:[小互的每日动态](https://waytoagi.feishu.cn/wiki/T2fUwmHBSiHU6Ukq9Imcu7n7nMh)以下是群主发群公告时生成的,很好用今天收获了很多群友分享的prompt,非常好用✨🌟爆款文章模型,操作简单非常牛逼🚀🔗链接:[爆款文案模型](https://ywh1bkansf.feishu.cn/wiki/E1qQwfaLdiTtYlk3NyBcd7bHn6b)群友的最佳实践💡🔗链接:[李继刚等的prompt最佳实践](https://ywh1bkansf.feishu.cn/wiki/JTjPweIUWiXjppkKGBwcu6QsnGd)一个文字游戏🎮🔗链接:[一个提示词文字游戏](https://ywh1bkansf.feishu.cn/wiki/UuVOwy3w7ishplkeDeXcIc1BnZd)

小七姐:官方最佳 Prompt 实践的六个方法

用两个段落概括用三引号分隔的文本。"""在此处插入文本"""用3个要点概括用三引号分隔的文本。"""在此处插入文本"""4.要点总结:我们可以明确要求模型按特定数量的字、句子、要点来生成内容。但对于中文来说,由于字符和token的映射机制及中文的上下文生成机制问题,精确符合字数的生成不稳定。但对于引用文本的概括或修改,效果相对会变得好很多。

其他人在问
runaway的prompt编写
以下是关于 Runway 官方镜头提示词的相关内容: Prompt Structures 提示结构: 使用这种结构,提示一个女人站在热带雨林可能是这样的。 在提示的不同部分重复或强调关键思想可提高输出一致性。例如在超高速拍摄中,相机会快速飞过场景。应将提示集中在场景中应出现的内容上,比如输入晴朗的天空,而非没有云的天空。 协助镜头画面描述的提示词: 样品说明: 1. Seamless Transitions 无缝转换 1. Camera Movement 相机移动 1. Text Title Cards 文本标题卡 1. Prompt Keywords 提示关键词 关键字有助于在输出中实现特定样式。确保关键字与整个提示符保持一致,会使其在输出中更明显。例如,包括关于皮肤纹理的关键字对于相机未紧密聚焦在面部的广角拍摄没有好处,广角镜头可能受益于环境的其他细节。在保持这种凝聚力的同时,可尝试不同的关键字。
2024-09-18
prompts是什么
Prompts 是在不同的 AI 应用场景中的一种指令或语言模板。 在 Midjourney Bot 中,它用于启动新任务或创建一组图像,可以是简单的单词或短语,也可以是更详细的指令和参数,Midjourney Bot 会根据提供的 Prompt 生成图像网格,用户可选择并进行修改和操作。您可以通过进一步了解。 从原理层面看,简单来说,它是一套与大模型交互的语言模板。通过这个模板,可以输出对大模型响应的指令,明确大模型应该做什么、完成什么任务、如何处理具体任务,并最终获得期望的结果。虽然大模型能理解大部分输入的话,但为了获得更好的回答效果,需要使用 Prompt 来提升模型返回的准确性。可以认为在大模型时代,人机交互的主要方式是 Prompt,而非过去通过代码。 在 AI 视频生成中,prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,用户借此控制和指导生成内容。它在 AI 视频生成中作用十分重要,是表达需求的方式,影响视频内容和质量。如果上述解释过于抽象,您可以理解 Prompt 为:将您输入的文字变成对应的画面和运动形式。
2024-09-10
说一下什么事prompt
Prompt 简单来说是一套与大模型交互的语言模板。它是给大模型输入的一段原始输入,能帮助模型更好地理解用户需求,并按照特定模式或规则进行响应。 在大模型时代,它类似于过去人机交互中的代码,成为主要的交互语言。通过 Prompt,能提升模型返回的准确性,比如可以设定“假设你是一位医生,给出针对这种症状的建议”,后续对话会按此设定展开。 在 AI 视频生成中,Prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,借此控制和指导生成内容,作用十分重要,是表达需求的方式,影响视频内容和质量,您可以理解为将输入的文字变成对应的画面和运动形式。 这里的玩法很多,比如可以在 Prompt 的设定中,要求模型按照一定的思路逻辑去回答,像最近比较火的思维链(cot),就是在 Prompt 环节对模型的输出进行指导,还可以让模型按照特定格式(如 json)输出,使模型变成一个输出器来使用。甚至一度还出现过 Prompt 优化师这样的角色。
2024-09-10
说一下什么事prompt
Prompt 是一套与大模型交互的语言模板。简单来说,它是您向大模型输出的用于指示其响应的指令,明确大模型应做什么、完成何种任务、如何处理具体任务,并最终输出您期望的结果。尽管大模型具备基础的文字理解能力,能理解您的大部分表述,但为获得更好的回答效果,需要借助 Prompt 来提高模型返回的准确性。在大模型时代,Prompt 成为人机交互的主要方式之一。 在 AI 领域,Prompt 是给到大模型输入的一段原始输入,能帮助模型更好地理解用户需求,并按照特定模式或规则进行响应。例如,可以设定“假设您是一位医生,给出针对这种症状的建议”,后续与大模型的对话将基于此原始设定展开。此外,还有很多有趣的玩法,如在 Prompt 的设定中要求模型按照一定的思路逻辑回答,像最近较火的思维链(cot)就是在这个环节对模型的输出进行指导。还可以让模型按照特定格式(如 json)输出,使模型成为一个输出器。 在 AI 视频生成中,Prompt 是直接描述或引导视频生成的文本或指令,类似于给 AI 的提示,包含主体、运动、风格等信息,用户借此控制和指导生成内容。其作用十分重要,是表达需求的方式,会影响视频的内容和质量。如果上述解释过于抽象,您可以将 Prompt 理解为:把您输入的文字变成对应的画面和运动形式。
2024-09-10
说一下什么事prompt
Prompt 简单来说是一套与大模型交互的语言模板。它能输出对大模型响应的指令,明确大模型应做的具体事项、完成的任务、处理任务的方式,并最终获得期望的结果。大模型虽有基础文字能力能理解大部分话语,但为提升回答准确性,需要借助 Prompt。在大模型时代,Prompt 成为人机交互的主要方式之一。 Prompt 是给大模型输入的一段原始输入,能帮助模型更好理解用户需求并按特定模式或规则响应。例如,可以设定“假设你是一位医生,给出针对这种症状的建议”,后续对话会按此设定展开。还有很多有趣玩法,如要求模型按一定思路逻辑回答,像最近较火的思维链(cot)就在此环节指导模型输出,还能让模型按特定格式(如 json)输出,使模型成为输出器。 在 AI 视频生成中,Prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,借此控制和指导生成内容,作用十分重要,是表达需求的方式,影响视频内容和质量。如果觉得抽象,可以理解为将输入的文字变成对应的画面和运动形式。
2024-09-10
说一下什么事prompt
Prompt 是一套与大模型交互的语言模板,是给大模型输入的一段原始输入。它能帮助大模型更好地理解用户需求,并按照特定模式或规则进行响应。 简单来说,通过 Prompt 可以输出对大模型响应的指令,明确大模型应做什么、完成什么任务、如何处理具体任务,并最终输出期望的结果。虽然大模型有基础文字能力能理解大部分话,但为提升回答准确性,需要使用 Prompt。 在不同场景中,Prompt 有不同的应用和作用。比如在 AI 视频生成中,Prompt 是直接描述或引导视频生成的文本或指令,包含主体、运动、风格等信息,借此控制和指导生成内容,其作用十分重要,是表达需求的方式,影响视频内容和质量。还可以将其理解为把输入的文字变成对应的画面和运动形式。 此外,Prompt 有很多有趣的玩法,比如可以设定“假设你是一位医生,给出针对这种症状的建议”,然后后续对话会按照这个原始设定展开。还能在 Prompt 设定中要求模型按照一定的思路逻辑回答,像最近较火的思维链(cot)就是在 Prompt 环节对模型输出进行指导,也可以让模型按照特定格式(如 json)输出,使模型变成一个输出器。甚至一度还出现过 prompt 优化师这样的角色。
2024-09-10
利用AI变现的最佳途径
以下是一些利用 AI 变现的途径: 1. 电商方面:在抖音、快手、视频号、小红书等平台上,批量发布四维彩超生成 AI 宝宝照片的视频或图文,将客户引到私域接单变现。后续还可针对宝妈开展如四维彩超 AI 预测、头像定制、绘画收徒、宝宝起名字、售胎毛纪念品、母乳纪念品、宝宝出生后的相关产品等多种变现方式。同时,做好私域的精细化运营,运营朋友圈。 2. 软件方面: 开发 AI 抖音发广告的软件,借助抖音平台对实体商家的流量扶持,让实体商家购买。此方式需要懂软件开发的技术人员,且熟悉抖音。 开发 AI 私域做客户培育/用户旅程的软件,帮助不同商家自动跟进/培育客户。同样需要懂软件开发的技术人员,且熟悉微信。 3. 内容创作方面: 创作 AI 绘本,如 2 4 岁儿童的睡前故事,图文结合,并以幼儿理解的方式表达。 制作法律咨询相关的 Bot,建立数据库进行回复。 进行体检报告解读。 总之,利用 AI 变现的方式多样,不局限于单一途径,通过合理推广与精细化运营,能获取收益并积累用户资源。
2024-09-16
有没有关于微调的最佳实践
以下是关于微调的最佳实践: 一般最佳实践:使用更多高质量的示例进行微调效果更好。要微调一个比使用基本模型使用高质量提示更好地执行的模型,应提供至少几百个高质量的示例,最好由人类专家审查。从那里开始,性能往往会随着示例数量的每增加一倍而线性增加。增加示例的数量通常是提高性能的最佳和最可靠的方法。分类器是最容易上手的模型。对于分类问题,建议使用 ada,经过微调后,它通常只会比功能更强大的模型稍微差一点,同时速度更快,成本更低。 准备数据集:微调是一种强大的技术,可用于创建特定于您的用例的新模型。在微调您的模型之前,强烈建议阅读以下针对您的用例的最佳实践和具体指南。 具体指南:微调可以解决多种问题,最佳使用方式可能取决于您的具体用例。常见的微调用例和相应的指南包括: 如果您要对预先存在的数据集进行微调,而不是从头开始编写提示,请务必在可能的情况下手动检查您的数据是否存在令人反感或不准确的内容,或者如果数据集很大,请检查尽可能多的随机样本。
2024-09-06
采用AI辅助阅读、读书的最佳场景有哪些?
以下是采用 AI 辅助阅读、读书的一些最佳场景: 1. 使用 360AI 浏览器: 自动生成思维导图,方便调研总结。 无需复杂链路,网页右侧有 AI 贴心助手,提供文章简介、重点和 AI 问答。 支持文章朗读、全屏沉浸式阅读,可直接保存为图片或 PDF,能修改字体字号。 对于长文阅读和文档解释,可直接在浏览器中进行。 对于论文等 PDF 材料阅读,有强大的编辑和辅助工具,如一键翻译、快速定位原文、询问概念等,降低阅读门槛。 免费开放 100 万字长文本阅读功能,内测 500 万字长文本处理功能。 辅助音视频观看,快速了解主体内容。 2. 法律领域: 类案检索:使用法律行业垂类的 AI 产品,按照特定的 Prompt 指令词进行操作。 法律文本阅读:上传文本,根据需求提问,如“图纸是谁设计的?”“谁负责承担本项目的设计、建设?”“贷款期限是多少?”
2024-08-31
你好,请问目前最佳的生图软件是什么
目前比较成熟的生图软件主要有以下几种: 1. Artguru AI Art Generator:这是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:一种 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 此外,一些受欢迎的文生图工具包括: 1. DALL·E:由 OpenAI 推出,可根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,能生成高质量的图片,支持多种模型和算法。 3. MidJourney:因其高质量的图像生成效果和用户友好的界面设计而广受喜爱,在创意设计人群中尤其流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104),可以查看更多文生图工具。需要注意的是,这些 AI 模型在使用过程中可能会存在一些局限,如偶尔性能不稳定、生成内容不当等问题。 Kolors 也是一款表现不错的开源文生图模型,从技术报告来看,它在多个方面进行了改进,实测效果良好。
2024-08-13
prompt 编写最佳实践。
以下是关于 prompt 编写的最佳实践: 1. 明确任务:在 prompt 中清晰地定义任务,比如写故事时要包含故事背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,在 prompt 里提供充足的上下文信息,如写历史事件报告时提供基本信息。 3. 使用清晰语言:尽量用简单、清晰的语言描述任务,避免模糊或有歧义的词汇,防止 AI 模型误解。 4. 给出具体要求:若任务有特定格式或风格要求,在 prompt 中明确指出,如文章需遵循的格式或引用的文献类型。 5. 使用示例:如有特定期望结果,在 prompt 中提供示例,帮助 AI 模型理解需求。 6. 保持简洁:让 prompt 简洁明了,过多信息可能导致 AI 模型困惑,生成不准确结果。 7. 使用关键词和标签:有助于 AI 模型理解任务主题和类型。 此外,还需注意: 我们可以要求模型生成具有给定目标长度的输出,可用字数、句数、段落数、要点数等来指定。但指示模型生成特定字数的精确度不高,尤其对中文而言。相对来说,约束句子数量比明确要求字数更稳定,且 ChatGPT 4 在这方面的表现比 3.5 版本更稳定。对于既有文本的概括或改写,提供明确文本让模型概括时效果较好。
2024-07-24
coze有哪些最佳实践
Coze作为一个AI开发平台,提供了多种功能和工具,帮助用户创建聊天机器人、智能体、AI应用等。以下是一些关于Coze的最佳实践: 1. 理解用户需求:在创建机器人之前,理解目标用户的需求和目的是非常重要的。这将帮助设计更加贴合用户需求的对话流程和功能。 2. 利用预构建的机器人:Coze提供了预构建的机器人,这些可以直接用于探索Coze的功能,也可以作为创建个性化机器人的基础。 3. 拖拽式操作:Coze支持拖拽式操作,用户可以通过拖拽不同的功能卡片到工作区来构建对话流程,实现无代码的页面布局设计。 4. 工作流设计:通过Coze的工作流功能,可以设计复杂的对话路径和逻辑,实现更高级的交互。 5. 多Agent协同:在构建复杂的系统时,可以利用多Agent协同工作,分流处理不同的任务,提高效率和响应速度。 6. 知识库应用:Coze的知识库功能可以自动或按需调用,结合大模型生成回复,提供丰富的信息和知识支持。 7. 数据库和数据管理:使用Coze的数据库功能进行数据管理,可以直接收录用户回复的重要信息,并实现Text2SQL的功能。 8. API集成:Coze支持API集成,可以创建基于API的插件,实现与外部服务和数据库的连接。 9. 持续学习和优化:根据用户的反馈和交互数据,持续优化机器人的性能和用户体验。 10. 社区和资源共享:参与Coze社区,分享和学习其他用户的优秀案例和实践,获取灵感和改进建议。 通过遵循这些最佳实践,用户可以更有效地利用Coze平台的功能,创建出更加智能、有用的AI应用。
2024-05-25
某银行计划对外采购2024年分行内训师培训项目,现需要对采购内容做详细要求,培训内容以AI工具课程开发与设计,课程制作与实践,短视频制作,直播授课技巧等,我该如何对培训老师资质,授课经验,AI工具运用等技能做细化要求
以下是为您提供的关于银行采购 2024 年分行内训师培训项目中对培训老师资质、授课经验、AI 工具运用等技能的细化要求建议: 培训老师资质: 具备相关领域的专业教育背景,如计算机科学、人工智能等。 持有相关的行业认证或资格证书。 授课经验: 拥有丰富的企业内训经验,特别是在金融行业的培训经历。 成功完成过类似 AI 工具课程开发与设计、课程制作与实践等相关课程的授课。 AI 工具运用技能: 熟练掌握多种主流的 AI 工具,如常见的机器学习框架、自然语言处理工具等。 能够运用 AI 工具进行实际项目开发,并具有相关的案例成果。 熟悉短视频制作和直播授课中涉及的 AI 辅助技术,如智能剪辑工具、虚拟主播技术等。 希望以上建议对您有所帮助。
2024-09-13
帮我写一篇有关aigc的行业分析,标题为《AIGC行业洞察与概览》,其中框架内容包含以下部分,整体3万字 - 概念导入(AI、AIGC) - AI与人的区别 - AI衍生发展历程(诞生、发展、现状-中外各平台产品及语言模型介绍) - AI在社会各领域的应用实践 - AI技术的底层逻辑概览 - AI的弊端以及风险
以下是为您生成的《AIGC 行业洞察与概览》的部分内容: 一、概念导入 (一)AI 人工智能(Artificial Intelligence,简称 AI)是一种目标,旨在让机器展现智慧。 (二)AIGC GenAI(即生成式 AI)是一种能够从已有数据中学习并生成新的数据或内容的 AI 应用,利用 GenAI 创建的内容即 AIGC(全称 AIGenerated Content)。AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。 二、AI 与人的区别 三、AI 衍生发展历程 (一)诞生 (二)发展 (三)现状 1. 中外各平台产品及语言模型介绍 (1)语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 GeminiUltra。 (2)图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,代表项目有 Stable Diffusion 和 StyleGAN 2。 (3)音视频生成利用扩散模型、GANs 和 Video Diffusion 等,代表项目有 Sora 和 WaveNet。 四、AI 在社会各领域的应用实践 AIGC 技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 五、AI 技术的底层逻辑概览 (一)机器学习:一种让机器自动从资料中找到公式的手段。 (二)深度学习:一种更厉害的手段,类神经网络,具有非常大量参数的函数。 (三)大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称 LLMs。 六、AI 的弊端以及风险 作为一种强大的技术,生成式 AI 能够赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 由于篇幅限制,目前仅能为您提供约 2000 字的内容,距离 3 万字还有较大差距。后续还需要进一步丰富和完善各个部分的细节及案例分析等。
2024-09-03
最新的 RAG 进展和业界实践
以下是关于最新的 RAG 进展和业界实践的详细介绍: RAG 是检索增强生成(Retrieval Augmented Generation)的简称,是当前最火热的企业级 LLM 应用方案。概括来说,它是知识检索与内容生成的结合,就像大模型的开卷考试,谁的资料更全、翻找更快更准,结果往往更好。 Lewis 等人(2021)提出了一个通用的 RAG 微调方法,使用预训练的 seq2seq 作为参数记忆,用维基百科的密集向量索引作为非参数记忆,并通过神经网络预训练的检索器访问。RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色,用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、更具体、更多样,FEVER 事实验证使用 RAG 后也得到了更好的结果,这表明 RAG 是一种可行的方案,能在知识密集型任务中增强语言模型的输出。 目前,大部分公司倾向于使用 RAG 方法进行信息检索,因为相比长文本的使用成本,使用向量数据库的成本更低。在 RAG 应用中,一些公司会使用微调的 Embedding Model 增强检索能力,也有些公司会选择使用知识图谱或者 ES 等非向量数据库的 RAG 方法。一个正常的模型使用 RAG 仍是当前主流。由于大语言模型存在信息滞后和不包含业务知识的特点,常需外挂知识库协助解决问题,此时 Embedding 模型的召回效果直接影响大模型的回答效果,所以很多场景下需要微调 Embedding 模型提高召回效果。 最近,基于检索器的方法越来越流行,常与 ChatGPT 等流行 LLM 结合使用来提高其能力和事实一致性。例如,在 LangChain 文档中可以找到一个使用检索器和 LLM 回答问题并给出知识来源的简单例子。 此外,来自马里兰大学、劳伦斯利弗莫尔国家实验室、纽约大学的研究学者提出了一个大模型微调的方法,在微调时只需要在 Embedding 层上加随机噪声即可大幅度提升微调模型的对话能力,且不会削弱模型的推理能力。用 Alpaca 微调 LLaMA27B 可以在 AlpacaEval 上取得一定表现,而用加了噪声的嵌入则表现更佳,不过该工作只在较小的模型上进行微调。
2024-07-26