Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

常用的结构化提示词框架有哪些?

Answer

以下是一些常用的结构化提示词框架:

  1. 基础的结构化编写 Prompt 框架:
    • Role:[请填写你想定义的角色名称]

    • Profile:

      • author:作者
      • version:版本
      • language:中文
      • description:[请简短描述该角色的主要功能,50 字以内]
    • Goals:

      • 1.[请列出该角色的主要目标 1]
      • 2.[请列出该角色的主要目标 2]
    • Constrains:

      • [请列出该角色在互动中必须遵循的限制条件 1]
      • [请列出该角色在互动中必须遵循的限制条件 2]
    • Skills:

      • [为了在限制条件下实现目标,该角色需要拥有的技能 1]
      • [为了在限制条件下实现目标,该角色需要拥有的技能 2]
    • Workflows:

      • 1.[请描述该角色的工作流程的第一步]
      • 2.[请描述该角色的工作流程的第二步]
  2. CRISPE 框架(Capacity and Role,Insight,Statement,Personality,Experiment)
  3. BROKE 框架(Background,Role,Objectives,Key Results,Evolve)
  4. ICIO 框架:
    • Instruction(指令):明确定义 AI 需要执行的任务,遵循简洁明了、具体详细、行动导向、单一任务等原则。
    • Context(背景信息):提供任务的相关背景,包括任务目的、目标受众、相关背景、限制条件、角色扮演等。
    • Input Data(输入数据):为 AI 提供执行任务所需的具体信息或数据。
    • Output Indicator(输出引导):指导 AI 如何构建和呈现输出结果,包括格式要求、语气和风格、长度限制、结构指引、特殊要求、评估标准等。
Content generated by AI large model, please carefully verify (powered by aily)

References

小七姐:Prompt 喂饭级系列教程小白学习指南(四)

作者:小七姐可以在以下地址关注她,主页内容更丰富:[小七姐的](https://t.zsxq.com/15KhQ0RE7)[Prompt](https://t.zsxq.com/15KhQ0RE7)[学习社群](https://t.zsxq.com/15KhQ0RE7)在今天的(四)中,我们主要分享:Prompt的结构化什么是结构化Prompt?结构化的思想很普遍,结构化内容也很普遍,我们⽇常写作的⽂章,看到的书籍都在使⽤标题、⼦标题、段落、句⼦等语法结构。结构化Prompt的思想通俗点来说就是像写⽂章⼀样写Prompt。结构化编写Prompt本身算是提示词编写的进阶学习内容,基于我们是面向新手的喂饭级教程,这里只列举一套(极简)基础的结构化编写Prompt的框架,我们可以看到它通过一些特定的标准,将提示词结构为一些固定范式,例如:# Role:[请填写你想定义的角色名称]# Profile:- author:作者- version:版本- language:中文- description:[请简短描述该角色的主要功能,50字以内]## Goals:1.[请列出该角色的主要目标1]2.[请列出该角色的主要目标2]## Constrains:[请列出该角色在互动中必须遵循的限制条件1][请列出该角色在互动中必须遵循的限制条件2]## Skills:[为了在限制条件下实现目标,该角色需要拥有的技能1][为了在限制条件下实现目标,该角色需要拥有的技能2]## Workflows:1.[请描述该角色的工作流程的第一步]2.[请描述该角色的工作流程的第二步]我们看到上述范例中有一些特殊写法和标识:

小七姐:Prompt is not enough

在过去的一年半时间里,我一直在深度探索和使用如何更好的引导大模型生成我们需要的内容,也一直在进行提示词(prompt)系统化教学。这段经历让我对提示词的发展和应用有了深的认识,我的认知也产生了一个重要的转变:[heading3]“从单纯的提示词优化到更加关注人的底层能力的提升。”[heading2](一)提示词探索路径[content]1.OpenAI官方的六项最佳实践最初,我们主要依赖OpenAI官方给出的指导,包括写清晰具体的指令、给模型时间思考、使用分隔符等基本技巧——这些实践为我们使用大模型开了个好头。1.提示词框架随后,各种提示词框架开始出现,如CRISPE(Capacity and Role,Insight,Statement,Personality,Experiment)和BROKE(Background,Role,Objectives,Key Results,Evolve)等。我们是这用这些框架为提示词编写提供一个系统化的方法。1.明确任务目标清晰地定义我们希望大模型完成的任务是至关重要的。这个阶段强调了任务描述的精确性和完整性。1.角色扮演方法探索让大模型扮演特定角色来完成任务的方法。这种方法能够让模型更好地理解上下文并生成更相关的回答。1.结构化提示词使用基于Markdown语法和角色法框架的结构化提示词。这种方法提高了提示词的可读性和组织性,使复杂任务的分解变得更加直观。1.提示词测试和迭代随着实践的深入,开发了一些提示词测试和迭代的方法。这个过程帮助我们不断优化提示词,提高其效果。1.提示词封装为智能体将提示词封装为智能体,这使得复杂任务的处理变得更加模块化和可复用。

安迪:写给职场人的 AI 办公手册——如何与 AI 高效对话

ICIO框架是一种结构化的提示词设计方法,旨在优化与AI模型的交互。该框架由四个关键组成部分构成:Instruction(指令)、Context(背景信息)、Input Data(输入数据)和Output Indicator(输出引导)。Instruction(指令):这是ICIO框架的核心要素,用于明确定义AI需要执行的任务。编写指令时应遵循以下原则:•简洁明了:使用清晰、直接的语言•具体详细:提供足够的细节以避免歧义•行动导向:使用动词开头,如”分析”、“创建”、“评估”等•单一任务:每个指令专注于一个主要任务,避免多任务混淆Context(背景信息):提供任务的相关背景,帮助AI更好地理解和执行任务。背景信息可包括:•任务目的:说明为什么需要执行这个任务•目标受众:指明结果将被谁使用或阅读•相关背景:提供任何有助于理解任务的历史或当前情况•限制条件:说明任何需要考虑的限制或约束•角色扮演:如果需要,指定AI应该扮演的角色Input Data(输入数据):这部分为AI提供执行任务所需的具体信息或数据。可以包括:•事实和统计数据•相关文本或文档•链接或参考资源•图片、音频或视频(如果AI模型支持)注意:并非所有任务都需要输入数据,如果任务不需要特定数据,可以省略此部分。Output Indicator(输出引导):指导AI如何构建和呈现输出结果。这可以包括:•格式要求:如报告、列表、对话、诗歌等•语气和风格:如正式、随意、幽默、专业等•长度限制:指定字数或段落数•结构指引:如需要的章节或部分•特殊要求:如需要包含的具体元素(图表、引用等)•评估标准:说明如何判断输出质量的标准

Others are asking
非结构化数据治理
以下是关于非结构化数据治理的相关信息: 在 AI 新产品方面: JamGPT AI Debug 小助手:https://jam.dev/jamgpt ChatGPT2D 用于生成二维知识图谱:https://www.superusapp.com/chatgpt2d/ Motörhead by metal 是用于 LLM 的开源内存和信息检索服务器:https://github.com/getmetal/motorhead 在网页抓取工具方面: Hexomatic:https://hexomatic.com/ WebscrapeAI:https://webscrapeai.com/ Kadoa:https://www.kadoa.com/ 在个人数据处理方面: Bloks 可自动处理个人笔记、任务列表和会议记录:https://www.bloks.app/ Lettria 用于处理个人文本材料:https://www.lettria.com/ Quadratic 可使用 AI、Python、SQL 和公式分析个人数据:https://www.quadratichq.com/?ref=producthunt 在向量数据库方面,以电影网站为例,传统搜索在处理语义搜索和对非结构化数据(如图像、音频等)的相似性搜索时存在问题,比如用户输入“电影像《星球大战》一样令人兴奋”或上传一张电影《银翼杀手》的海报,传统关系数据库或 Excel 难以理解和返回相关搜索结果。 在金融行业,非结构化数据主要涉及报告(如年度报告、季度报告等公司财务报告)、公告(如董事会公告、监事会公告、股东大会公告等)、上市资料(如招股说明书等公司上市相关文件)。
2025-01-24
非结构化数据
非结构化数据是指缺乏预定义格式的数据,如文本、图像和音频等。为在人工智能和机器学习应用中利用这些数据,需使用嵌入技术将其转换为数字表示。嵌入就像给每个项目赋予独特的代码以捕捉其含义或本质,通常通过特殊神经网络实现,例如单词嵌入将单词转换为向量,使含义相似的单词在向量空间中更接近,从而让算法了解项目间的关系和相似性,将非数字数据转换成机器学习模型可处理的形式,以辨别数据中的模式和关系。 在金融行业中,非结构化数据主要涉及报告(年度报告、季度报告等公司财务报告)、公告(董事会公告、监事会公告、股东大会公告等)、上市资料(如招股说明书等公司上市相关文件)。 向量数据库处理的是称为向量的复杂非结构化数据,其存储过程为:若为文本,通过模型转换成向量对象后存入数据库,再进行使用。传统数据库以表格形式存储简单数据,而向量数据库使用独特方法搜索,如近似近邻(ANN)搜索,包括散列搜索和基于图的搜索等方法,且使用特定的相似性度量来寻找最接近的匹配。要理解向量数据库的工作原理及与传统关系数据库的不同,需先理解嵌入的概念。
2025-01-24
请给我一份李继刚的结构化的prompt方法论
李继刚的结构化的 prompt 方法论如下: 如何写好 Prompt:结构化 结构化:对信息进行组织,使其遵循特定的模式和规则,从而方便有效理解信息。 语法:支持 Markdown 语法、YAML 语法,甚至纯文本手动敲空格和回车都可以。 结构:结构中的信息可根据自己需要进行增减,常用模块包括: Role:<name>,指定角色会让 GPT 聚焦在对应领域进行信息输出。 Profile author/version/description:Credit 和迭代版本记录。 Goals:一句话描述 Prompt 目标,让 GPT Attention 聚焦起来。 Constrains:描述限制条件,帮 GPT 进行剪枝,减少不必要分支的计算。 Skills:描述技能项,强化对应领域的信息权重。 Workflow:重点中的重点,希望 Prompt 按什么方式来对话和输出。 Initialization:冷启动时的对白,强调需注意重点。 示例 贡献者:李继刚,Sailor,田彬玏,Kyle😜,小七姐等群友。 李继刚的。 每个角色都有版本迭代,标注版本号,争取每个都更新到最新的版本。 李继刚写了上百个这种 Prompt,有具体场景需求可评论留言,作者可帮忙写定制的,也可自己用这种结构化的方式写。 使用方法:开一个 new chat,点代码块右上角的复制,发送到 chat 聊天框即可,里面的描述可按自己需求修改。 思路来源:云中江树的框架: 方法论总结: 建议用文心一言/讯飞星火等国内大模型试试,有这些 prompt 的加持,效果不错。
2024-12-17
将活动主题拆解为大量结构化提示词,用于文生视频
以下是将活动主题拆解为大量结构化提示词用于文生视频的相关内容: 技巧 1:提示词的结构 当提示词有清晰的结构时,提示效果最有效。可使用简单公式:。 例如:无结构提示词“小男孩喝咖啡”,有结构的提示词“摄影机平移(镜头移动),一个小男孩坐在公园的长椅上(主体描述),手里拿着一杯热气腾腾的咖啡(主体动作)。他穿着一件蓝色的衬衫,看起来很愉快(主体细节描述),背景是绿树成荫的公园,阳光透过树叶洒在男孩身上(所处环境描述)”。 技巧 2:提示词的优化 有三个原则: 1. 强调关键信息:在提示的不同部分重复或强化关键词有助于提高输出的一致性。 2. 聚焦出现内容:尽量让提示集中在场景中应该出现的内容上。 3. 规避负面效果:在提示词中写明不需要的效果。 写提示词时,首先要明确场景中的人物和冲突,其次是对场景进行详细描述,包括地点、人物形象、任务动作等细节,使用生动的动词营造动态和戏剧化氛围,第三要加强镜头语言,如推、拉、摇、移、升、降等,每种镜头运动都有其特定作用和效果。 PixelDance V1.4 提示词指南 图生视频的基础提示词结构为:主体+运动。当主体有突出特征时可加上,需基于输入图片内容写,明确写出主体及想做的动作或运镜,提示词不要与图片内容/基础参数存在事实矛盾。
2024-12-09
结构化提示词
结构化提示词是一种像写文章一样编写提示词的方法。其思想较为普遍,日常写作的文章和书籍都常使用标题、子标题、段落、句子等语法结构。 在文生图方面,调整好参数生成图片后,若质感欠佳,可添加标准化提示词,如“,绘图,画笔”等,让画面更趋近于固定标准。 对于新手,有一套极简基础的结构化编写 Prompt 框架,例如: Role: Profile: author:作者 version:版本 language:中文 description: Goals: 1. 2. Constrains: Skills: Workflows: 1. 2. 在提高模型响应精确度方面,改进提示词格式很重要。如在问答和文本分类中,提示词可以通过指令、上下文、输入和输出指示来改进响应结果。越明确的指示,响应越好。包含相关语境和其他要素,提供更多信息和具体指令,能使响应更符合需求。
2024-11-11
GPTs 结构化提示词模板
以下是为您整理的关于 GPTs 结构化提示词模板的相关内容: 简单的提示词模板:最终目标是把需求说清楚。例如,“Act like a ”。 GPTs 教程及案例拆解 开源:一些 GPTs 的 prompt 中,如超强 LOGO 生成器,其使用方法为设计一个 logo 生成工具,允许用户上传多张 logo 图片作为参考,通过提示询问用户是否使用这些图片来创建新的 logo 设计,可自定义提示词风格和设定图片参考权重,利用 GPT4 Vision 的识图能力生成新 logo 设计,若用户不满意则重新生成,创作完后提示用户是否满意,满意则提供转 LOGO 矢量图的链接。 GPTs 教程及案例拆解 精选:GPTs 项目包括 Reviewer2Pal,可帮用户将直白的英文论文回应转换为专业回复;方法论专家 Methodology Expert,辅助用户使用方法论解决相关问题;灵感专家 Brainstorming Expert,辅助用户进行灵感思考和提出发散性角度;自动结构化框架,由小七姐编写,欢迎关注其公众号“AI 中文百科”领取更多好玩的 GPT 工具。
2024-11-07
12个prompt 框架
以下是 12 种 Prompt 框架: 1. Instruction(指令):即希望 AI 执行的具体任务,如翻译或写一段文字。 2. Context(背景信息):给 AI 更多背景信息,引导模型做出更贴合需求的回复。 3. Input Data(输入数据):告知模型需要处理的数据。 4. Output Indicator(输出引导):告知模型输出的类型或风格。 5. Capacity and Role(能力和角色):ChatGPT 应扮演的角色。 6. Insight(见解):提供请求背后的见解、背景和上下文。 7. Statement(声明):说明要求 ChatGPT 做什么。 8. Personality(个性):希望 ChatGPT 以何种风格、个性或方式回应。 9. Experiment(实验):请求 ChatGPT 回复多个示例。 10. Background(背景):说明背景,为 ChatGPT 提供充足信息。 11. Role(角色):希望 ChatGPT 扮演的角色。 12. Objectives(目标):希望实现的目标。 此外,还有以下框架: 1. TASK(任务):定义特定任务。 2. ACTION(行动):描述需要做的事情。 3. GOAL(目标):解释最终目标。 4. INPUT(输入):描述信息或资源。 5. STEPS(步骤):询问详细的步骤。 6. EXPECTATION(期望):描述所需的结果。 7. REQUEST(请求):描述您的要求。 8. Key Result(关键结果):要什么具体效果,试验并调整。 9. Evolve(试验并改进):三种改进方法自由组合,包括改进输入、改进答案、重新生成。 10. CONTEXT(上下文背景):为对话设定舞台。 11. OBJECTIVE(目的):描述目标。 12. SCENARIO(方案):描述场景。 同时,还有一些特定的框架,如 ICIO 框架、CRISPE 框架、BROKE 框架等。
2025-01-23
dify编排框架是什么意思
Dify 编排框架是一种在 AI 领域中应用的可视化编排框架,例如在 workflow 可视化编排页面中使用(框架:React Flow)。它具有以下特点和优势: 1. 集各家所长,在用户体验方面表现出色。 2. 可以人为编排 Workflow 里的子任务,与 AutoGPT 由大模型编排任务的方式不同,这种手动编排方式带来了明显的优化,如在流程中加入人类 Knowhow 以补足模型知识的不足,通过专家测试试跑减少生产环境中的反复无效反思,引入图的概念灵活组织节点、连接各类工具等。 3. 加入图的概念后,workflow 的天花板变得非常高,可以在流程中任意增加节点和各种类型的节点,不仅能套工具、套其它 agent,还能写代码用硬逻辑处理或接大模型进行判断,能力上限很大程度取决于想象力。 4. 对于个人开发者构建高质量的 AI 数字人很有帮助,有大量开源工作者维护,集成了各种主流的模型供应商、工具以及算法实现等,可以通过它快速编排出自己的 AI Agent,赋予数字人灵魂。利用其编排和可视化交互能任意修改流程,构造不同的 AI Agent,并实现相对复杂的功能,如知识库搭建、工具使用等,无需任何编码和重新部署工作。同时,Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于这两个接口可将数字人的语音识别和语音生成都交由 Dify 控制。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台进行部署。此外,数字人 GUI 工程中仍保留了多个模块,能保持更好的扩展。 在使用 Dify 接口时,需要注意必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,可自行选择方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可以根据个人喜好添加。
2025-01-21
18种提示词框架
以下是 18 种提示词框架: 1. Instruction(指令):即您希望 AI 执行的具体任务,比如翻译或者写一段什么文字。 2. Context(背景信息):给 AI 更多的背景信息,引导模型做出更贴合需求的回复。 3. Input Data(输入数据):告知模型需要处理的数据。 4. Output Indicator(输出引导):告知模型我们要输出的类型或风格。 5. Capacity and Role(能力和角色):ChatGPT 应扮演什么角色。 6. Insight(见解):提供您请求的背后见解、背景和上下文。 7. Statement(声明):您要求 ChatGPT 做什么。 8. Personality(个性):您希望 ChatGPT 以何种风格、个性或方式回应。 9. Experiment(实验):请求 ChatGPT 为您回复多个示例。 10. Background(背景):说明背景,为 ChatGPT 提供充足信息。 11. Role(角色):您希望 ChatGPT 扮演的角色。 12. Objectives(目标):我们希望实现什么。 13. Key Result(关键结果):您要什么具体效果,试验并调整。 14. Evolve(试验并改进):三种改进方法自由组合:a.改进输入:从答案的不足之处着手改进背景、目标与关键结果;b.改进答案:在后续对话中指正 ChatGPT 答案缺点;c.重新生成:尝试在 Prompt 不变的情况下多次生成结果,优中选优。 15. CONTEXT 上下文背景:为对话设定舞台。 16. OBJECTIVE 目的:描述目标。 17. ACTION 行动:解释所需的动作。 18. SCENARIO 方案:描述场景。 此外,还有一些常见的特定框架,如: 1. ICIP 框架:包括指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填)。 2. BROKE 框架:着重于背景(Background)、角色定义(Role)、目标设定(Objectives)、关键成果展示(Key Result)以及持续的试验与优化(Evolve)。 3. CRISPE 框架:分为上下文(Context)、角色(Role)、说明(Instruction)、主题(Subject)、预设(Preset)和例外(Exception)。 提示词工程师是专门负责为大语言模型设计、优化和实施 Prompt 的技术角色,他们深刻理解模型的工作原理,能够根据具体需求定制合适的 Prompt,确保其有效性。随着大语言模型在商业和研究领域的应用,定制化的 Prompt 编写服务日渐受到欢迎。这些专业服务往往由资深的提示词工程师提供,他们会深入了解客户的具体需求,从而为其设计、优化并定制出最合适的 Prompt。
2025-01-15
对话框架都有哪些
以下是一些常见的对话框架: 1. 智谱·AI 开源模型列表中的 Chat 模型框架: ChatGLM36B:第三代 ChatGLM 对话模型,采用全新 Prompt 格式,原生支持工具调用、代码执行和 Agent 任务等复杂场景,上下文 token 数为 8K。 ChatGLM36Bbase:第三代 ChatGLM 基座模型,采用更多样训练数据、更充分训练步数和更合理训练策略,在 10B 以下基础模型中性能最强,上下文 token 数为 8K。 ChatGLM36B32k:第三代 ChatGLM 长上下文对话模型,在 ChatGLM36B 基础上强化长文本理解能力,能处理最多 32K 长度上下文。 ChatGLM26B32k:第二代 ChatGLM 长上下文对话模型,在 ChatGLM26B 基础上进一步强化长文本理解能力,能处理最多 32K 长度上下文。 ChatGLM26B32kint4:ChatGLM26B32K 的 int4 版本。 ChatGLM6B:第一代 ChatGLM 对话模型,支持中英双语,基于 General Language Model架构,具有 62 亿参数,结合模型量化技术可在消费级显卡上本地部署,上下文 token 数为 2K。 2. COSTAR 框架: 定义:指明文本的整体风格,包括词汇选择、句式结构及可能的参照对象。 重要性:不同风格适合不同场合,如学术论文和社交媒体帖子。 示例:科学论文需正式语言和客观语气,博客文章可采用轻松、个人色彩写作风格。 Tone(语气) 定义:设定文本的情感基调,确保符合预期氛围。 重要性:正确语气可建立与读者联系,传达适当态度。 示例:商业计划书需正式、专业且有说服力语气,产品评测可采用轻松幽默语气。 Audience(受众) 定义:明确回答或文本的目标读者。 重要性:了解受众有助于调整语言复杂度、术语使用及整体信息传递方式。 示例:专业人士可用行业术语和复杂概念,大众需简化语言避免专业化术语。 Response(回复) 定义:指定最终输出的形式和结构。 重要性:正确格式使信息更易理解和消化。 示例:详细分析报告按标准报告格式组织,简单问答可直接列表呈现答案。
2025-01-14
提示词框架
以下是关于提示词框架的相关内容: 视频模型中的提示词框架: Vidu Prompt 基本构成: 提示词基础架构:包括主体/场景、场景描述、环境描述、艺术风格/媒介。需调整句式和语序,避免主体物过多/复杂、模糊术语表达,使用流畅准确的口语化措辞,丰富、准确和完整的描述以生成特定艺术风格、满足需求的视频。 提示词与画面联想程度的说明:以单帧图像为例,通过具体详实的位置描述/环境描述进行构图,艺术风格描述提升效果和氛围,统一画面风格。 AI 提示词工程师相关的提示词框架: 提示词工程师是专门负责为大语言模型设计、优化和实施 Prompt 的技术角色,不仅编写 Prompt,还需测试和优化以确保输出内容质量。 发展出多种提示词框架,如 ICIP 框架(包括指令、背景信息、输入数据、输出指示器)、BROKE 框架(包括背景、角色定义、目标设定、关键成果展示、持续的试验与优化)、CRISPE 框架(包括上下文、角色、说明、主题、预设、例外)。 有定制化的 Prompt 编写服务,由资深提示词工程师深入了解客户需求设计、优化并定制最合适的 Prompt。 RAG 提示工程中的提示词框架: 在输入环节构建全面的提示词框架,包含伦理审查及针对不同类型攻击的审查规则,具体划分为伦理审查及对越狱类、泄露类、目标劫持类等攻击类型的审查。融入人格设定元素,利用大型模型的注意力机制,加固输入防护的审核能力及人格设定的稳定性。
2025-01-13
ai agent 框架有哪些
目前常见的 AI Agent 框架主要有以下几种: 1. LangChain 的 LangGraph:通过简化标准底层任务,如调用 LLM、定义和解析工具、链接调用等,使入门变得容易,但可能创建额外抽象层,增加调试难度。 2. 亚马逊 Bedrock 的 AI Agent 框架。 3. Rivet:拖放式 GUI 的 LLM 工作流构建器。 4. Vellum:用于构建和测试复杂工作流的 GUI 工具。 此外,行业里常用于为 LLM 增加工具、记忆、行动、规划等能力的框架是 LangChain,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。AutoGPT 被描述为使 GPT4 完全自主的实验性开源尝试,也是一种重要的框架。但需要注意的是,当前大多数代理框架都处于概念验证阶段,还不能可靠、可重现地完成任务。
2025-01-08
AI图片生成视频的提示词公式
AI 图片生成视频的提示词公式如下: 1. 基础公式:主体+主体描述+运动+环境。例如:“一艘白色邮轮缓缓驶过海面。(A white cruise ship sails slowly across the sea.)” 2. 进阶技巧:对各部分进行详细描述,如“一只金色毛发的狗(描述主体)悠然自得地在阳光洒满的草地上行走,草叶轻轻地在它的爪下弯曲(详细描述环境和动作)。微风拂过,它的毛发随风轻动,时不时低下头嗅闻着大地。(进一步描述主体动作细节)远处,夕阳的余晖拉长了影子,营造出一种宁静祥和的氛围。(描述环境氛围)(A goldenhaired dog strolls leisurely across a sunlit grassy field,the blades of grass bending gently under its paws.A soft breeze passes by,causing its fur to sway,and it occasionally lowers its head to sniff the ground.In the distance,the setting sun casts long shadows,creating a peaceful and serene atmosphere.)”这样可以使生成的视频更稳定、提升美感。 3. 语法方面: 注意权重值最好不要超过 1.5。 可以通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,语法为:例如“alandscape”,在一开始,读入的提示词为:the model will be drawing a fantasy landscape.在第 16 步之后,提示词将被替换为:a cyberpunk landscape,它将继续在之前的图像上计算。 提示词还可以轮转,比如在第一步时,提示词为“cow in a field”;在第二步时,提示词为“horse in a field.”;在第三步时,提示词为“cow in a field”,以此类推。 4. 其他方面: 指令参数:一般包括视频时长、分辨率、帧率等细节。PixVerse 默认生成 4s 时长的视频(会在后续更新中增加更长视频的生成),分辨率 1408×768。升级(Upscale)后,分辨率可以达到 4k,会导致生成所花费的时间比普通生成更长。 情感氛围:描述视频的情感基调或氛围,可用于人物的表情、环境氛围等的控制。 参考风格:可以输入参考的艺术风格等。
2025-01-25
langchain的提示词工程
LangChain 是一个在提示词工程领域具有重要地位的开源框架。 它允许开发者将语言模型与应用程序连接起来,使应用程序能够嵌入大模型的能力,俗称 ReAct,展示了一种提示词技术,允许模型“推理”和“行动”。 高级提示词工程技术的发展促使一系列工具和框架兴起,LangChain 已成为提示词工程工具包中的基石,最初专注于链条,后扩展到支持包括智能体和网络浏览等更广泛的功能,其全面的功能套件使其成为开发复杂 LLM 应用的宝贵资源。 在实际的工作场景中,LangChain 是常用的 RAG 框架之一。它是为简化大模型应用开发而设计的开源框架,通过提供模块化的工具和库,便于开发者集成和操作多种大模型,将更多精力投入到创造应用的核心价值上。其设计注重简化开发流程,支持广泛模型,具备良好可扩展性,有活跃的贡献者和持续更新,提供全面文档和示例代码,考虑了应用安全性和用户数据隐私保护,是多语言支持的灵活框架,适用于各种规模项目和不同背景开发者。 LangChain 官方手册:https://python.langchain.com/docs/get_started/introduction/
2025-01-25
提示词学习
以下是关于提示词学习的相关内容: 提示词的知识体系: 可分为五个维度,从高到低依次是思维框架、方法论、语句、工具和场景。但对于初学者,舒适的学习顺序应是反过来的。 场景:直接切入提示词的场景去学,对比在不同场景下使用提示词的效果。 工具:使用现成的提示词工具,包括 Meta Prompt、Al 角色定制等。 有效语句:学习大量经典论文中提出的提示词语句。 方法论:将有效语句及其背后的原理整合成稳定可控的方法,自动编写稳定的提示词。 学习 Stable Diffusion 提示词的步骤: 学习基本概念,包括了解其工作原理、模型架构,理解提示词如何影响生成结果,掌握提示词的组成部分。 研究官方文档和教程,包括通读官方文档,学习开发团队和专家的分享。 学习常见术语和范例,熟悉相关领域的专业术语和概念,研究优秀的图像标题和描述。 掌握关键技巧,如组合词条精确描述效果、控制生成权重的符号使用、处理抽象概念等。 实践和反馈,尝试生成不同风格和主题的图像,对比结果并总结经验,在社区分享请教。 创建提示词库,根据主题、风格等维度建立,记录成功案例。 持续跟进前沿,关注最新更新和趋势。 学习提示词运用的建议: 理解提示词的作用,其为模型提供上下文和指示,影响输出质量。 学习构建技巧,明确任务目标,用简洁准确语言描述,提供背景信息和示例,使用清晰指令,明确特殊要求。 参考优秀案例,在领域社区、Github 等资源中寻找。 实践、迭代、优化,多与语言模型互动,比较输出差异。 活用提示工程工具,如 Anthropic 的 Constitutional AI。 跟上前沿研究。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结才能掌握窍门。
2025-01-25
提示词学习
以下是关于提示词学习的相关内容: 提示词的知识体系: 可以分为五个维度,从高到低依次是思维框架、方法论、语句、工具和场景。但对于初学者,舒适的学习顺序应是反过来的。 场景:直接切入提示词的场景去学,对比在不同场景下使用提示词的效果。 工具:使用现成的提示词工具,包括 Meta Prompt、Al 角色定制等。 有效语句:学习大量经典论文中提出的提示词语句。 方法论:将有效语句及其背后的原理整合成稳定可控的方法,自动编写稳定的提示词。 学习 Stable Diffusion 的提示词: 是一个系统性的过程,需要理论知识和实践经验结合。 学习基本概念,包括了解工作原理、模型架构,理解提示词如何影响生成结果,掌握组成部分。 研究官方文档和教程。 学习常见术语和范例。 掌握关键技巧,如组合词条、控制生成权重、处理抽象概念等。 实践和反馈,对比结果并总结经验。 创建提示词库。 持续跟进前沿。 学习提示词运用的建议: 理解提示词的作用,其质量直接影响模型输出质量。 学习构建技巧,明确任务目标,给予足够背景信息和示例,使用清晰指令,对特殊要求明确指示。 参考优秀案例,可在领域社区、Github 等资源中找到。 实践、迭代、优化,多与语言模型互动,尝试各种变体。 活用提示工程工具,如 Anthropic 的 Constitutional AI。 跟上前沿研究。
2025-01-25
如何快速掌握AI提示词的技巧
以下是快速掌握 AI 提示词技巧的方法: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支及相互联系。同时浏览入门文章,了解 AI 的历史、应用和发展趋势。 2. 开始 AI 学习之旅:在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台按自己节奏学习并获取证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,可根据自身兴趣选择特定模块,比如一定要掌握提示词技巧,因其上手容易且有用。 4. 实践和尝试:理论学习后进行实践来巩固知识,尝试使用各种产品创作作品,并在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 此外,不同的 AI 产品在提示词方面也有各自的特点和技巧: 海螺 AI:MiniMax 视频模型能识别图片和理解指令,还能实现顶级特效和细腻表情呈现。提示词优化功能可扩展视频美学呈现,专业创作者有 2000 字的提示词空间。 星流一站式 AI 设计工具:在 prompt 输入框中可输入提示词和使用图生图功能。写好提示词要做到内容准确,包含人物主体、风格、场景特点等;可调整负面提示词;利用“加权重”功能突出重点;使用辅助功能如翻译、删除所有提示词、会员加速等。
2025-01-24
如何使用网站内的提示词
以下是关于如何在网站内使用提示词的详细介绍: 1. 提示词输入框: 您可以在提示词输入框中输入提示词,使用图生图功能辅助创作。 星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 启用提示词优化后,会帮您扩展提示词,更生动地描述画面内容。 2. 写好提示词的方法: 小白用户可以点击提示词上方官方预设词组进行生图。 提示词内容应准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 点击提示框下方的齿轮按钮,弹出负面提示词框,输入负面提示词可以帮助 AI 理解不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。 辅助功能包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 其他相关: 在悠船网站,网页最下方有输入框,输入提示词按回车键可创作图片。 生成的图片可在开始想象页面中找到,点击查看大图,还能针对喜欢的图片进行图像变体。 编辑面板有高清、重塑、延展、扩图、局部重绘等工具优化图片和进行实验性创作。 设置面板可调整所有提示的默认参数,如图像的长宽比,风格化、怪异化和多样化的参数,以及模型版本和生成速度。 悠船可以使用现有图片作为全新创作的灵感,站内图片可直接拖放或站外图片可点击输入框的“+”上传或直接粘贴。 如需下载、筛选或整理图片,可访问想象历史页面进行批量操作。
2025-01-23
机器学习的子领域包括: 监督学习,常用算法如线性回归、决策树、支持向量机(SVM)。 无监督学习,如聚类、降维等算法。 强化学习,那深度学习是哪一种啊
深度学习是机器学习的一个子领域。 在机器学习中,深度学习是一种利用深度神经网络来学习数据特征和模式的方法。 深度学习的特点包括: 1. 具有复杂的网络结构,如前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等。 2. 能够自动从大量数据中提取高级特征。 深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成果。
2025-01-21
列举常用的剪辑软件、硬件设备、技术支持和3d动画软件
常用的剪辑软件有 Adobe Premiere Pro、Final Cut Pro、DaVinci Resolve 等。 常用的硬件设备包括高性能的计算机主机,具备强大处理能力的 CPU(如英特尔酷睿 i7 或 i9 系列)、大容量高速内存(16GB 及以上)、专业图形显卡(如 NVIDIA GeForce 系列)、大容量高速存储硬盘(如 SSD 固态硬盘),以及高分辨率和色彩准确的显示器。 常见的技术支持包括视频编码和解码技术(如 H.264、H.265 等)、特效插件(如 After Effects 插件)、色彩校正工具等。 常用的 3D 动画软件有 Maya、3ds Max、Blender 等。
2025-01-16
列举常用的剪辑软件、硬件设备以及技术支持,3d动画和ai视频生成
以下是关于剪辑软件、硬件设备、技术支持、3D 动画和 AI 视频生成的相关信息: AI 视频生成工具: Runway: 主要能力:文生视频(Text 2 Video)、Prompt+图像生成视频(Text+Image to Video)、无 Prompt 直接图片转视频(Image to Video)。 使用建议:Text to Video 时,优先使用右下角的“Free Preview”免费生成多组图片,然后从中选择一张进行视频生成以节约 credits。 近期更新:支持将 4s 的视频延长,每次延长需消耗 20 credits;9 月更新中,支持 110 级的 motion slider 调节,默认幅度为 5,同时支持水平、垂直、空间和旋转的运镜,并支持调节运动速度。 其他功能:提供 30 多项图片、视频处理能力,如 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。控制台上线了 Watch 模块,可查看官方精选的创意案例。推荐教程:ai 繪圖教學|Ai 动画:https://www.youtube.com/watch?v=Yj73NRmeSZM 由于您未明确提及剪辑软件、硬件设备和技术支持的具体需求,暂时无法为您详细列举。如果您能提供更具体的要求,我将为您提供更有针对性的信息。
2025-01-16
常用的多模态大模型
以下是一些常用的多模态大模型: 1. InstructBLIP:基于预训练的BLIP2模型进行训练,在MM IT期间仅更新QFormer。通过引入指令感知的视觉特征提取和相应的指令,能够提取灵活多样的特征。 2. PandaGPT:是一种开创性的通用模型,能够理解6种不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 3. PaLIX:使用混合VL目标和单峰目标进行训练,包括前缀完成和屏蔽令牌完成。这种方法对于下游任务结果和在微调设置中实现帕累托前沿都是有效的。 4. VideoLLaMA:引入了多分支跨模式PT框架,使LLMs能够在与人类对话的同时处理给定视频的视觉和音频内容,使视觉与语言以及音频与语言保持一致。 5. 视频聊天GPT:专门为视频对话设计的模型,能够通过集成时空视觉表示来生成有关视频的讨论。 6. Shikra:Chen等人介绍了一种简单且统一的预训练MMLLM,专为参考对话(涉及图像中区域和对象的讨论的任务)而定制,展示了值得称赞的泛化能力,可以有效处理看不见的设置。 7. DLP:提出PFormer来预测理想提示,并在单模态句子数据集上进行训练,展示了单模态训练增强MM学习的可行性。 8. BuboGPT:通过学习共享语义空间构建,用于全面理解MM内容,探索不同模式之间的细粒度关系。 9. ChatSpot:引入了一种简单而有效的方法来微调MMLLM的精确引用指令,促进细粒度的交互。 10. QwenVL:多语言MMLLM,支持英文和中文,还允许在训练阶段输入多个图像,提高其理解视觉上下文的能力。 11. NExTGPT:端到端、通用的anytoany MMLLM,支持图像、视频、音频、文本的自由输入输出,采用轻量级对齐策略。 12. MiniGPT5:集成了生成voken的反演以及与稳定扩散的集成,擅长为MM生成执行交错VL输出,在训练阶段加入无分类器指导可以提高生成质量。 13. Flamingo:代表了一系列视觉语言模型,旨在处理交错的视觉数据和文本,生成自由格式的文本作为输出。 14. BLIP2:引入了资源效率更高的框架,包括用于弥补模态差距的轻量级QFormer,实现对冻结LLMs的充分利用,利用LLMs可以使用自然语言提示进行零样本图像到文本的生成。 15. LLaVA:率先将IT技术应用到MM领域,引入了使用ChatGPT/GPT4创建的新型开源MM指令跟踪数据集以及MM指令跟踪基准LLaVABench。 16. MiniGPT4:提出了一种简化的方法,仅训练一个线性层即可将预训练的视觉编码器与LLM对齐,能够复制GPT4所展示的功能。 17. mPLUGOwl:提出了一种新颖的MMLLMs模块化训练框架,结合了视觉上下文,包含一个名为OwlEval的教学评估数据集。 18. XLLM:扩展到包括音频在内的各种模式,并表现出强大的可扩展性。利用QFormer的语言可迁移性,成功应用于汉藏语境。 19. VideoChat:开创了一种高效的以聊天为中心的MMLLM用于视频理解对话,为该领域的未来研究制定标准,并为学术界和工业界提供协议。
2025-01-06
常用AI工具有什么
以下是一些常用的 AI 工具: 1. 绘图工具: Lucidchart:流行的在线绘图工具,支持多种视图创建,有拖放界面。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 draw.io(diagrams.net):免费在线图表软件,支持多种类型图表创建。 PlantUML:文本到 UML 转换工具,可自动生成相关视图。 Gliffy:基于云的绘图工具,支持创建架构图。 Archi:免费开源工具,用于创建相关模型和视图。 Rational Rose:IBM 的 UML 工具,支持创建多种视图。 2. 文章润色工具: Wordvice AI:集校对、改写转述和翻译等功能于一体,提供全面英文论文润色服务。 ChatGPT:由 OpenAI 开发,可用于多方面写作辅助。 Quillbot:人工智能文本摘要和改写工具。 HyperWrite:基于 AI 的写作助手和大纲生成器。 Wordtune:AI 驱动的文本改写和润色工具。 Smodin:提供 AI 驱动的论文撰写功能。 3. 建筑设计审核工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载建筑大模型。 Maket.ai:面向住宅行业,在户型和室内软装设计方面有探索。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,提供全新设计模式。 Fast AI 人工智能审图平台:形成全自动智能审图流程,实现数据汇总与管理。 需要注意的是,每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。同时,部分内容由 AI 大模型生成,请仔细甄别。
2025-01-04
产品经理常用的提示词
以下是一些产品经理常用的提示词: 1. 创建客户旅程:帮我写一段客户旅程,该产品功能为{功能描述},用户画像是{用户特征描述,如年龄、性别等}。为{具有功能的产品}创建针对{受众人口统计,如性别、年龄组等}的客户旅程。客户旅程应该包括用户角色、场景、目标和期望,以及接触点的体验。此外,提供有助于改善客户旅程的机会和问题等见解。请使用此提示创建一个全面的客户旅程,以帮助改善用户体验并确定需要改进的领域。 2. 竞争对手分析:帮我分析几个竞争对手,可以列出产品名字。通过研究提供类似产品或功能的公司,分析{产品/功能}的竞争对手。使用以下表格格式组织您的调查结果:公司名称|资金来源|投资者|客户|目标市场。 3. API 集成问题:帮我确定需要哪些 API 来实现以下的功能。请提供在将第三方 API 集成到此特定功能的{产品}中时需要询问的技术问题列表。 4. 用户测试问题:帮我编写一份用户测试问题,实现以下的功能。编写{产品/功能}的用户测试说明,用用户目标和目的代替逐步指导。用相关问题总结说明,以收集用户的反馈。 5. 商业计划书:我的商业目标是{……},请帮我撰写一份商业计划书。根据人们的意愿产生数字创业创意。例如,当我说{商业目标}时,你会为创业公司生成一个商业计划,包括想法名称、简短的一句话、目标用户角色、用户要解决的痛点、主要价值主张、销售和营销渠道、收入来源、成本结构、关键活动、关键资源、关键合作伙伴、想法验证步骤、估计的第一年运营成本,以及需要寻找的潜在业务挑战。将结果以 Markdown 形式写在表格中。 6. 写 PRD:你作为一名产品经理,根据{具体需求}撰写一份 PRD。请确认我的以下请求。请以产品经理的身份给我答复。我将要求提供主题,你将帮助我为它写一份 PRD,包括这些内容。主题、介绍、问题陈述、目标和目的、用户故事、技术要求、好处、关键绩效指标、开发风险、结论。不要写任何 PRD,直到我要求写一个特定的主题、功能和开发。 7. 需求文档设计:撰写清晰明了的产品需求文档,以指导开发团队实现项目目标。
2024-12-31