直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

李继刚大神提出的伪代码prompt 相关文章

回答

李继刚等的 prompt 最佳实践相关内容如下:

  • 方法论:
    • 提出了基于 GPT-3 的无代码聊天机器人设计工具 BotDesigner。
    • 创建了 Conversation 视图和 Error Browser 视图。
    • 使用 BotDesigner 观察 10 名非专家提示设计师执行聊天机器人设计任务的行为,以探索他们在提示设计中的直觉方法和困难。
  • 结论:
    • 所有参与者都能进行机会性的提示迭代设计,并能对提示更改进行局部测试。
    • 参与者在生成提示、评估提示有效性和解释提示效果方面的困难主要源自过度概括和人际交往预期。
    • 参与者倾向于从单一数据点过度推广,也倾向于从人类交流的角度过滤他们的提示设计和聊天机器人的响应。
  • 关键信息:
    • 贡献者包括李继刚、Sailor、田彬玏、Kyle😜、小七姐等群友。
    • 李继刚的即刻GitHub,最近收录不是很及时,可在李继刚的即刻查看更多。
    • 每个角色都有版本迭代,标注版本号,争取更新到最新版本。
    • 李继刚写了上百个这种 Prompt,有具体场景需求可评论留言,作者可帮忙写定制,也可自己用结构化方式写。
    • 使用方法:开一个 new chat,点代码块右上角的复制,发送到 chat 聊天框,里面的描述可按需求修改。
    • 思路来源:云中江树的框架:即刻GitHubAI 导师作者:Mr.-Ranedeer-AI-Tutor
    • 方法论总结:格式化的 prompt 方法论
    • 建议用文心一言/讯飞星火等国内大模型试试,有这些 prompt 的加持效果不错。

此外,还有相关的高阶使用方法,如陈财猫的“如何用 GPT 写长篇科幻?用分治法完成复杂任务”(https://waytoagi.feishu.cn/wiki/GY3sw4LQli5k9ckzrDZcRnVmnQf),刘海的“Prompt 纵向研究的最新成果:伪代码提示词”(https://waytoagi.feishu.cn/wiki/MjUDwTbq9iUtBrkskPXcpfOHnPg),陈财猫的“由 GPT 驱动的人生重开模拟器游戏,体验无穷变化的多重人生(已开源)”(https://waytoagi.feishu.cn/wiki/WyJSwjvN5iZudhkd8iocrSy3njc)

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

李继刚等的prompt最佳实践

[title]李继刚等的prompt最佳实践[heading2]Role:学术阅读(读论文)测试输入:https://dl.acm.org/doi/pdf/10.1145/3544548.3581388您好,我已经仔细阅读了您提供的论文,现根据您的要求,对论文进行概括总结如下:一、明确的方法论1.提出了一个基于GPT-3的无代码聊天机器人设计工具BotDesigner。2.创建了两个界面:Conversation视图和Error Browser视图。Conversation视图允许设计师通过提示来创建聊天机器人;Error Browser视图允许设计师针对提示进行迭代设计和评估。3.使用BotDesigner作为探查工具,观察了10名非专家提示设计师执行聊天机器人设计任务的行为,以探索他们在提示设计中的直觉方法和困难。二、经过验证的结论1.所有参与者都能够进行机会性的提示迭代设计,并能够对提示更改进行局部测试。2.参与者在生成提示、评估提示有效性和解释提示效果方面的困难主要源自过度概括和人际交往预期。3.参与者倾向于从单一数据点过度推广;也倾向于从人类交流的角度过滤他们的提示设计和聊天机器人的响应。三、关键信息本文的关键信息包括:

李继刚等的prompt最佳实践

[title]李继刚等的prompt最佳实践贡献者:李继刚,Sailor,田彬玏,Kyle😜,小七姐等群友|李继刚的[即刻](https://okjk.co/264vOK)[GitHub](https://github.com/lijigang/prompts):最近收录不是很及时,可以在李继刚的即刻查看更多每个角色都有版本迭代。“- version:0.8”这里会标注版本号,争取每个都更新到最新的版本李继刚写了上百个这种Prompt,如果大家要是有具体场景需求,可以评论中留言.作者说可以来试试帮大家写定制的。当然你也可以尝试用这种结构化的方式自己写。使用方法:开一个new chat,点代码块右上角的复制,发送到chat聊天框即可,里面的描述可以按照自己需求修改思路来源:云中江树的框架:[即刻](https://m.okjike.com/originalPosts/645e48f8f9f51888942247d2?s=eyJ1IjoiNjQyM2IwMDE4NDg5Njk1NGJjYzhkNWU1IiwiZCI6MX0%3D),[GitHub](https://github.com/yzfly/LangGPT)AI导师作者:[Mr.-Ranedeer-AI-Tutor](https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor)方法论总结:[格式化的prompt方法论](https://ywh1bkansf.feishu.cn/wiki/UFvBw98foiTar5kmKrtcM5Ktn9f)建议大家用文心一言/讯飞星火等国内大模型试试,有了这些prompt的加持,效果也不错哟

🌈通往AGI之路-分享会

[目录:最佳实践🔥](https://waytoagi.feishu.cn/wiki/NbqXwHXrkiYWKVkFTbmcwxQqntb?chunked=false)[李继刚等的prompt最佳实践](https://waytoagi.feishu.cn/wiki/JTjPweIUWiXjppkKGBwcu6QsnGd?chunked=false)操作高阶使用方法:[陈财猫:如何用GPT写长篇科幻?用分治法完成复杂任务](https://waytoagi.feishu.cn/wiki/GY3sw4LQli5k9ckzrDZcRnVmnQf)[刘海:Prompt纵向研究的最新成果:伪代码提示词](https://waytoagi.feishu.cn/wiki/MjUDwTbq9iUtBrkskPXcpfOHnPg)[陈财猫:由GPT驱动的人生重开模拟器游戏,体验无穷变化的多重人生(已开源)](https://waytoagi.feishu.cn/wiki/WyJSwjvN5iZudhkd8iocrSy3njc)

其他人在问
给我讲解李继刚老师的lisp语言的提示词
以下是李继刚老师相关的提示词信息: 在市场营销类中,李继刚老师以“最酷的老师”角色,其提示词包括: role:Cool Teacher 、profile Writer:李继刚 version:1.4 language:中文 description:你是世界上最酷的老师 、Goals 1.以一种非常创新和善解人意的方式,教给毫无常识,超级愚蠢的学生 2.既有比喻的引导,也会提供真实案例,同时还会进行哲学层面的反思 、skills 1.擅长使用简单的语言,简短而充满哲理,给人开放性的想象 2.惜字如金,不说废话 3.模仿费曼的教学风格 、rules 任何条件下不要违反角色 不要编造你不知道的信息,如果你的数据库中没有该概念的知识,请直接表明 不要在最后添加总结部分.例如"总之","所以"这种总结的段落不要输出 、workflow 1.输入:用户输入问题 2.第一轮思考和输出:a.比喻:你会在开始时使用类似卡夫卡。 在个人类中,李继刚老师同样以“最酷的老师”角色,提示词内容与上述市场营销类相似。 在市场营销类中,李继刚老师作为“脱口秀编剧”,其提示词包括: Role:脱口秀编剧 、Profile: writer:李继刚 version:0.1 language:中文 description:你是一个专门编写 Oneliner 风格的脱口秀段子编剧 、Attention:你的创作对用户的上台表演产生巨大影响,他是吃肉还是饿肚子,全靠你的创作水平.你一定可以让他获得掌声,有钱吃肉的. 、Background:希望通过这个 Prompt,可以创作出有趣的脱口秀段子 、Constrains:段子必须包含铺垫和包袱两部分 段子要求有幽默感,能打破预期 、Definition:预期违背即在段子的结构中,包袱必须是对铺垫的预期违背 、Examples:面试官说了半天,我实在忍不了了,说:不好意思,我听不懂上海话。他说:这是英文。我说:但这里是中国。他说:但你面试的是翻译。相关链接地址为 。
2024-10-23
prompt编写
以下是关于如何编写提示词(prompt)的全面指导: 一、编写 prompt 的一般建议 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:避免模糊或歧义词汇,用简单明了的表述。 4. 给出具体要求:如格式、风格或引用文献等方面的要求。 5. 使用示例:提供期望结果的示例,帮助 AI 理解需求。 6. 保持简洁:避免过多信息导致 AI 困惑。 7. 使用关键词和标签:有助于 AI 理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整 prompt。 二、律师编写 prompt 的建议框架及格式 CRISPE 1. Capacity and Role(能力与角色):明确 AI 的角色和能力,如专注于民商事法律领域、擅长案例研究等。 2. Insight(洞察):提供背景信息和上下文,如案件关键事实、相关法律等。 3. Statement(陈述):明确期望 AI 完成的任务,如总结诉求、检索法条等。 4. Personality(个性):设定 AI 的回答风格或方式。 5. Experiment(举例):通过具体例子说明上述各点。 三、头脑风暴常用的 20 个 prompt 1. Take on the perspective of afrom their point of view.My aim is to find new ways to improve. 2. Scenarios Prompt:Imagine a best case scenario for:everything goes right.Now imagine a worst case scenario:everything goes wrong.Brainstorm ideas for each. 3. Analogy Thinking Prompt:is like what?Identify an analogy,then brainstorm ideas based on properties of the analogy.Explain each idea that follows from this analogy. 4. Idea Spurring Prompt:Build on the following idea related to.What does it make you think of?Use it as a jumping off point for more ideas. 5. Concept Fan Prompt:Here is one idea related to.Fan out from this concept in different directions to generate related ideas.Explain each new idea in a few words. 6. Evil Genius Prompt:Pretend you're an evil genius plotting against.How would you undermine it?Reverse engineer your evil plans into constructive ideas. 7. Random Stimuli Prompt:Use this random.Make unlikely connections. 8. Headline Writing Prompt:Come up with turn them into full ideas. 9. Brainstorming Journey Prompt:Imagine you're on a journey related to.Describe where you are,what you see,who you meet,what you're thinking let the scenario spark ideas. 10. Outside Perspectives Prompt:Bring in different viewpoints to ideate onand get new perspectives.Develop these different points of view,explaining succinctly why they are relevant in each case. 希望以上内容能对您编写 prompt 有所帮助。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-21
写精彩脱口秀文本的prompt
以下是关于写精彩脱口秀文本的一些提示: 基本提示可以只是一个单词、短语或表情符号。 更高级的提示可以包括一个或多个图片 URL、多个文本短语以及一个或多个参数。图片 URL 始终位于提示的最前面,以影响完成结果的风格和内容。参数需要放在提示语的末尾。 作为脱口秀编剧,如李继刚,在编写 Oneliner 风格的脱口秀段子时,需注意以下方面: 角色设定:writer 为李继刚,语言为中文。 注意事项:创作对用户的上台表演影响巨大,段子必须包含铺垫和包袱两部分,要有幽默感,能打破预期。预期违背即在段子的结构中,包袱必须是对铺垫的预期违背。 参考示例:可查看
2024-11-19
hello 有什么写新闻采写好用的prompt嘛
以下是一些写新闻采写好用的 prompt 示例: 1. 新闻文章的事实核查员: 角色:你是一个新闻文章的事实核查员。 个人信息: 作者:悟空 版本:0.1 语言:中文 描述:你的工作是确定新闻报道中哪些段落是假的。 目标:首先,你需要能够区分事实和观点。其次,你需要确定事实和观点是否一致。最后,你应该同时呈现事实和观点,使用问号标记哪些观点缺乏事实支持。 约束:你列出的事实可以进行总结,而观点必须原样重述。 技能:首先是区分事实和观点的能力。此外,还包括使用表情符号、缩写、粗体文本和其他格式化技术使内容清晰生动。 工作流程:第一步,逐步列出文本中的事实和观点;第二步,在列举观点之前列举事实的内容;第三步,使用颜文字符号(对,错,疑问)标记与事实不符的观点并提供判断的理由。第四步,进一步解释第三步的推理,并提供类似案。 2. 联网的科普作者: 角色:科普作者 个人信息: 作者:小七姐 版本:1.4 语言:中文 PTC(prompt token count):897 tokens 描述:我是一名资深科普作家,我会用通俗的语言对当然科研领域的新闻消息进行深度的解析和真实性判断 目标:根据用户提供的关键词找到更可信的新闻源,并根据你的专业性对新闻内容进行解读和判断 约束:准确性:判断和生成内容准确无误,判断新闻消息是否反映了科学研究的真实结果,必须有三个以上的内容源交叉验证你的结论。清晰性:文章应该易于理解。记者需要使用清晰、简洁的语言来解释复杂的科学概念和发现。公正 3. 精通中文的专业翻译: 角色:你是一位精通简体中文的专业翻译 曾参与《纽约时报》和《经济学人》中文版的翻译工作,因此对于新闻和时事文章的翻译有深入的理解。我希望你能帮我将以下英文新闻段落翻译成中文,风格与上述杂志的中文版相似。 规则:翻译时要准确传达新闻事实和背景。保留特定的英文术语或名字,并在其前后加上空格,例如:"中 UN 文"。分成两次翻译,并且打印每一次结果:1.根据新闻内容直译,不要遗漏任何信息;2.根据第一次直译的结果重新意译,遵守原意的前提下让内容更通俗易懂,符合中文表达习惯 初始化:本条消息只需要回复 OK,接下来的消息我将会给你发送完整内容,收到后请按照上面的规则打印两次翻译结果。
2024-11-19
产品经理功能设计prompt
以下是为您整理的关于产品经理功能设计的相关 prompt: 创建客户旅程:帮您写一段客户旅程,该产品功能为{功能描述},用户画像是{用户特征描述,如年龄、性别等};为{具有功能的产品}创建针对{受众人口统计,如性别、年龄组等}的客户旅程。客户旅程应该包括用户角色、场景、目标和期望,以及接触点的体验。此外,提供有助于改善客户旅程的机会和问题等见解。 竞争对手分析:帮您分析几个竞争对手,可以列出产品名字;通过研究提供类似产品或功能的公司,分析{产品/功能}的竞争对手。使用表格格式组织调查结果:公司名称|资金来源|投资者|客户|目标市场。 API 集成问题:帮您确定需要哪些 API 来实现以下的功能;请提供在将第三方 API 集成到此特定功能的{产品}中时需要询问的技术问题列表。 用户测试问题:帮您编写一份用户测试问题,实现以下的功能;编写{产品/功能}的用户测试说明,用用户目标和目的代替逐步指导。用相关问题总结说明,以收集用户的反馈。 商业计划书:您的商业目标是{……},为您撰写一份商业计划书,包括想法名称、简短的一句话、目标用户角色、用户要解决的痛点、主要价值主张、销售和营销渠道、收入来源、成本结构、关键活动、关键资源、关键合作伙伴、想法验证步骤、估计的第一年运营成本,以及需要寻找的潜在业务挑战。将结果以 Markdown 形式写在表格中。 写 PRD:您作为一名产品经理,根据{具体需求}撰写一份 PRD。包括主题、介绍、问题陈述、目标和目的、用户故事、技术要求、好处、关键绩效指标、开发风险、结论。 行业洞察分析:对行业现状、趋势和未来发展方向进行深入研究和预测。 方法论专家:精通各类管理和研发方法论,能根据具体情况选择和应用最佳方法。 头脑风暴:团队成员自由提出各种想法和见解,快速产出创意解决方案。 需求文档设计:根据产品特性和用户需求,设计产品需求文档。 功能价值分析:评估产品各项功能的重要性和价值,辅助优化资源配置。 竞品分析报告:对竞争对手的产品进行全面的分析比较,找出优劣势。 流程图/图表设计:直观地呈现业务流程、组织结构或统计数据。 思维导图设计:以树状图形式展示思路和知识框架。 解决方案专家:根据问题分析,提供切实可行的解决方案。 周报生成器:自动化生成工作周报,提高工作效率。 学习 Prompt 提示词可以参考:https://www.promptingguide.ai/zh
2024-11-18
一个 prompt 有 10 段文本内容,怎么标记不同段落的权重
当一个 prompt 有 10 段文本内容时,标记不同段落权重的方法如下: 使用双冒号“::”将提示分成不同部分,并在双冒号后面立即添加一个数字来指定该部分的相对权重。例如,“hot::2 dog”表示单词“hot”比“dog”重要度高出两倍。 在版本 1、2、3 中只接受整数作为权值,版本 4 能接受权值的小数位数。未指定权值时默认为 1。 负数权值可用于提示中以删除或排除不需要的元素,但所有权值的比必须是正数。 改变 tag 权重有多种方式: :数值从 0.1 到 100,低于 1 减弱,大于 1 加强。 括号,权重就重 1.1 倍;每加一层括号就反向减弱 1.1 倍。 小括号权重乘 1.1,如 a;中括号权重除以 1.1;小括号里面直接用冒号写权重也行;反斜杠可以让小括号的权重不生效当做一般字符串处理。 花括号写法,一个花括号权重为 1.05。 提示词其他常用语法:是画到一半的时候开始不画女孩。
2024-11-17
什么是prompt?
Prompt 是您给大模型的文本,用于引发相关输出,通常以问题或指示的形式出现。它可以是一套与大模型交互的语言模板,通过这个模板,您可以输出对大模型响应的指令,明确大模型应该做什么、完成什么任务以及如何处理具体任务,并最终获得期望的结果。大模型的本质是基于语言的概率模型,没有 Prompt 时,大模型随机给出答案,有了 Prompt 则相当于给了一个包含对模型要求、输入和输出限制的模板,让大模型在限制下得到概率最大的答案。此外,Prompt 是给到大模型输入的一段原始输入,能帮助模型更好地理解用户需求并按特定模式或规则进行响应。例如可以设定“假设你是一位医生,给出针对这种症状的建议”,后续对话会按此设定展开,还能在设定中要求模型按一定思路逻辑回答,如思维链(cot),也能让模型按特定格式(如 json)输出,使模型成为输出器。
2024-11-17
AI 小白怎么成为AI大神
以下是为 AI 小白提供的成为 AI 大神的学习路径: 首先,要了解 AI 基本概念。建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支如机器学习、深度学习、自然语言处理等以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 接着,开始 AI 学习之旅。在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并争取获得证书。 然后,选择感兴趣的模块深入学习。AI 领域广泛,涵盖图像、音乐、视频等,您可以根据自身兴趣选择特定模块进行深入钻研。 此外,还可以通过观看相关视频来辅助学习,比如“”,了解什么是 AI 大模型及其原理,包括生成式 AI 生成的内容叫做 AIGC,以及相关技术名词如机器学习(包括监督学习、无监督学习、强化学习)、深度学习等。 最后,在医疗保健领域应用 AI 时,要像人类学习一样,不能仅仅依靠大量数据和生成模型,而应通过使用彼此堆叠的模型来训练,比如先训练生物学的模型,再添加特定于医疗保健或药物设计的数据点。
2024-07-25
请你以制定清晰的任务列表和优先级的方式,来制作ai绘画相关的课程,帮助小白一步步上手操作成为大神。
以下是一个针对小白用户,从零开始学习AI绘画的清晰任务列表和优先级建议: 阶段一:基础知识学习 1. 了解AI绘画的基本概念 理解AI绘画与传统绘画的区别 了解AI绘画在艺术创作中的应用 2. 选择合适的AI绘画工具 研究不同AI绘画工具的特点和优缺点 选择一个适合自己的AI绘画工具 3. 学习基础绘画技巧 了解基本的绘画术语和技巧 学习如何使用AI绘画工具进行基础操作 阶段二:AI绘画工具使用 1. 熟悉AI绘画工具的基本操作 学习如何创建、编辑和管理画布 学习如何使用工具箱中的工具 2. 掌握AI绘画工具的功能 学习如何使用AI绘画工具的自动生成功能 学习如何调整AI绘画工具的参数和设置 3. 实践AI绘画工具的基本操作 尝试绘制简单的图形和形状 尝试使用AI绘画工具的自动生成功能创作作品 阶段三:AI绘画创作实践 1. 创作个人风格的作品 学习如何利用AI绘画工具创作具有个人风格的作品 尝试创作不同风格和主题的作品 2. 学习AI绘画工具的高级功能 学习如何使用AI绘画工具的高级功能,如AI生成、AI优化等 尝试创作更复杂和高质量的作品 3. 实践AI绘画创作 尝试创作不同风格和主题的作品,提高创作技巧 不断学习和实践,提升自己的AI绘画水平 阶段四:AI绘画作品展示和交流 1. 分享和展示自己的AI绘画作品 选择合适的平台分享和展示自己的AI绘画作品 与其他AI绘画爱好者交流和分享经验 2. 参加AI绘画相关的比赛和活动 了解和参加AI绘画相关的比赛和活动 通过比赛和活动提升自己的AI绘画水平 3. 持续学习和提升 关注AI绘画领域的新技术和趋势 不断学习和提升自己的AI绘画技巧和水平 通过以上任务列表和优先级建议,小白用户可以逐步学习AI绘画,并逐渐提升自己的创作水平。在学习过程中,建议多实践、多交流,不断提升自己的技能和创作能力。
2024-04-16
目前最方便的用来编程的免费AI有哪些?不能只会生成代码,还要像cursor一样有多种便利的编程功能
目前较为方便且具有多种便利编程功能的免费 AI 编程工具包括: 1. Cursor:是一个现代化的集成开发环境(IDE),具有 AI 辅助编码、代码自动补全、实时代码分析、多语言支持、集成终端、Git 集成、自定义主题、跨平台、性能优化和实时协作等特点。可通过 https://www.cursor.com/ 链接进入主页下载。 2. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议。 3. 通义灵码:阿里巴巴团队推出,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 4. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,可为开发人员实时提供代码建议。 5. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码。 6. Cody:代码搜索平台 Sourcegraph 推出的 AI 代码编写助手,借助 Sourcegraph 强大的代码语义索引和分析能力,了解开发者的整个代码库。个人使用免费。 7. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手。 8. Codeium:一个由 AI 驱动的编程助手工具,提供代码建议、重构提示和代码解释,提高编程效率和准确性。 此外,还有一些其他工具,如 Wing Python IDE Pro,专为 Python 编程设计,集成多种功能,但年度许可证起价 179 美元/月;Smol Developer 是开源的 AI 开发助手,能根据产品需求生成完整的代码库,遵循 MIT 许可证。 每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。更多辅助编程 AI 产品,还可以查看 https://www.waytoagi.com/category/65 。
2024-11-21
强化学习+开源代码
以下是关于强化学习的开源代码入门指南: 1. 基础知识准备: 若概率论和线性代数基础薄弱,可利用周末约一天时间学习相关课程,若不关注公式可忽略。 若机器学习基础为零,先看吴恩达课程,再以李宏毅课程作补充,若仅为入门强化学习,看李宏毅课程前几节讲完神经网络部分即可,此课程约需 25 小时。 2. 动手实践: 跟随《动手学深度学习 https://hrl.boyuai.com/》学习并写代码,入门看前五章,约 10 小时。 观看 B 站王树森的深度学习课程前几节学习强化学习基础知识点,约 5 小时。 3. 项目实践: 参考《动手学强化学习》(已开源 https://hrl.boyuai.com/),看到 DQN 部分,约十几小时。 模型构建:DQN 的网络模型采用一层 128 个神经元的全连接并以 ReLU 作为激活函数,选用简单的两层网络结构。 缓存区:需要一个缓存区来存放从环境中采样的数据。 训练函数:批量从缓存区获取数据,使用 DQN 算法进行训练。 主循环函数:在每个 episode 中,选择一个动作(使用 εgreedy 策略),执行该动作,并将结果存储在 replay buffer 中。训练完使用保存好的 model.pth 参数即可实际使用。 4. Qlearning 算法: 比如在状态 s1 上,根据 Q 值表选择行动,如发现向下行动 Q 值最大则向下走。获取 Q(s1,下)乘上衰减值 gamma(如 0.9)并加上到达下一个状态的奖励 R,作为“Q 现实”,之前根据 Q 表得到的是“Q 估计”。通过公式更新 Q(s1,下)的值,公式为:。 算法流程:初始化 Q,for 序列 e = 1 > E do: 用 ε Greedy 策略根据 Q 选择当前状态 s 下的动作 a,得到环境反馈的 r,s‘,得到初始状态 s,for 时间步 t = 1> T do: ,End for,End for。启动程序训练 100 次后可较好进行游戏。
2024-11-21
强化学习+开源代码
以下是关于强化学习的开源代码入门指南: 1. 基础知识准备: 若概率论和线性代数基础薄弱,可在周末约一天时间学习相关课程,若不关注公式可忽略。 若机器学习基础薄弱,先看吴恩达课程,再以李宏毅课程作补充,若仅为入门强化学习,看李宏毅课程前几节讲完神经网络部分即可,此视频课程约需 25 小时。 2. 动手实践: 跟随《动手学深度学习 https://hrl.boyuai.com/》动手学习概念并写代码,入门看前五章,约 10 小时。 观看 B 站王树森的深度学习课程前几节学习强化学习基础知识点,约 5 小时。 3. 项目实践: 参考《动手学强化学习》(已开源 https://hrl.boyuai.com/),看到 DQN 部分,约十几小时。 模型构建:DQN 的网络模型采用一层 128 个神经元的全连接并以 ReLU 作为激活函数,选用简单的两层网络结构。 数据缓存:需要一个缓存区来存放从环境中采样的数据。 训练函数:批量从缓存区获取数据,使用 DQN 算法进行训练。 主循环函数:在每个 episode 中,选择一个动作(使用 εgreedy 策略),执行该动作,并将结果存储在 replay buffer 中。训练完使用保存好的 model.pth 参数即可实际使用。 4. Qlearning 算法流程: 初始化 Q。 for 序列 e = 1 > E do: 用 ε Greedy 策略根据 Q 选择当前状态 s 下的动作 a,得到环境反馈的 r,s‘,得到初始状态 s。 for 时间步 t = 1> T do: End for。 End for。 例如,在当前智能体处于 s1 状态时,会在表中找最大 Q 值对应的行动。获取 Q(s1,下)乘上衰减值 gamma(如 0.9)并加上到达下一个状态时的奖励 R,作为现实中 Q(s1,下)的值(即“Q 现实”),之前根据 Q 表得到的 Q(s1,下)是“Q 估计”。有了“Q 现实”和“Q 估计”,可按公式更新 Q(s1,下)的值。公式中,α是学习率,γ是对未来 reward 的衰减值。启动程序训练 100 次后可较好地进行游戏。
2024-11-21
Coze代码测试成功,运行示例时报错
关于您提到的 Coze 代码测试成功但运行示例时报错的问题,以下是相关的信息和可能的解决办法: 图片生成方面:理想生成图片只实现了一次,其他几次生成文字加链接,链接需点进去查看且图片需渲染或加载,无互动趣味性,增加等待时间。因为默认返回的是 markdown 格式,微信不支持 markdown 格式,可在 github 上搜索 nicecoze 插件,基于 cow,把 markdown 转换为图片消息。 模型配置方面:Coze 里面模型配置用的 GPT4o,程序运行调用的是 GPT3.5 Turno。这是因为没有查询到 4o 的 token 计算方式,所以采用 3.5 的,但依然使用的是 GPT4o,只是 token 计算方式用的 3.5。 插件功能方面:Coze 加入了插件 Data Analysia(数据分析)、Browser 和 GPT4v 互动过程无法实现功能。这需要在 coze 里进行鼓捣,和 cow 的 config 无关。 外层 bot 方面:在外层 bot 进行运行时容易出现报错,暂时无法确定原因,猜测可能是外层 bot 的并发不够稳定,不如直接在工作流编辑面板中获取精度结果。如果自行实验时多次报错且无法定位问题原因,不要急着怪自己,相关 bug 已提交给 Coze 团队,希望能加紧优化。
2024-11-19
我想要让ai生成svg代码,如何保证其生成质量
目前知识库中没有关于如何保证让 AI 生成 SVG 代码质量的相关内容。但一般来说,要保证 AI 生成 SVG 代码的质量,可以从以下几个方面考虑: 1. 清晰明确地向 AI 描述您的需求,包括图形的特征、尺寸、颜色、线条样式等具体要求。 2. 提供足够的示例或参考资料,让 AI 更好地理解您期望的代码风格和质量标准。 3. 对生成的代码进行多次测试和验证,检查其在不同场景下的显示效果和兼容性。 4. 尝试使用不同的 AI 模型或工具,并比较它们生成的 SVG 代码质量,选择最适合您需求的。
2024-11-15
代码review的prompt
以下是关于代码 review 的 prompt 相关内容: 名词解释: Prompt:一段文本或语句,用于指导机器学习模型生成特定类型、主题或格式的输出。在自然语言处理领域中,通常由问题或任务描述组成,在图像识别领域中,可以是图片描述、标签或分类信息。 LangChain:开源 Python 库,由 Harrison Chase 开发,旨在支持使用大型语言模型和外部资源开发应用程序,提供标准接口,与其他工具集成,并为常见应用程序提供端到端链。 Embedding:将任意文本映射到固定维度的向量空间中,相似语义的文本,其向量在空间中的位置会比较接近。在 LLM 应用中常用于相似性的文本搜索。 向量数据库:存储向量表示的数据库,用于相似性搜索,如 Milvus、Pinecone 等。 Similarity Search:在向量数据库中搜索离查询向量最近的向量,用于检索相似项。 知识库:存储结构化知识的数据库,LLM 可以利用这些知识增强自己的理解能力。 InContext Learning:机器学习领域的概念,指不调整模型自身参数,在 Prompt 上下文中包含特定问题相关的信息,赋予模型解决新问题能力的一种方式。 Finetune /微调:在预训练模型基础上使用特定数据集进行微调,提升模型在某任务上的性能。 软件工程师相关的 Prompt 示例: 解释代码:👉向我解释此代码{要解释的代码} 请解释这段代码{代码段} 调试代码,找 Bug:👉这个{编程语言}代码有什么问题 代码:{待调试代码} 这段代码有什么问题{代码段} 生成单元测试:👉生成单元测试代码 请输入你要{要使用的语言和框架},再输入{代码段} 请为以下代码片段创建一组单元测试以进行彻底测试 它的功能。首先,概述你计划创建的测试用例。其次,使用{要使用的语言和框架}和下面提供的代码片段来实现测试用例。 创建样本代码库:👉为{描述功能所需的应用程序创建样板代码库}。请使用{指定的编程语言和框架}。 例如:为包含第三方 API 的应用程序创建样板代码库。请用 Django 框架上使用 Python 代码。 向代码添加注释:👉请输入你要添加注释的{代码段} 请查看以下代码片段并为每一行代码提供注释,解释其目的和功能。检查完代码后,请重新生成带有添加注释的代码段。 比较两段代码:👉请输入你要比较的两个{代码段 1}、{代码段 2},最好{描述你在建构的内容和目的} 我正在开发一个{描述你正在构建的}并且想评估和 将{第一个比较项}与{第二个比较项}进行比较。请提出基本{您正在构建的内容}的要求,并创建两个满足这些要求的代码库一个使用{第一个比较项},另一个使用{第二个比较项}。请提供在我的本地计算机上运行这两个应用程序的明确说明。 生成正则表达式:👉请创建一个正则表达式匹配{你想匹配的模式} 请创建一个正则表达式匹配{你想匹配的模式} 解决 Leetcode 问题:👉请用{所需语言}编写代码来解决以下挑战:{待解决挑战的概述} 请用{所需语言}编写代码来解决以下挑战:{待解决挑战的概述} 查找边缘情况:👉请帮我找下以下代码的边缘情况:{代码段} 我想让你充当软件开发人员。请帮我抓住这个功能的边缘情况{插入功能函数} 增强代码可读性:👉请帮我优化下面代码:{代码段} 我想让你充当代码分析器。您能否改进以下代码以提高可读性和可维护性?{插入代码}
2024-11-11