Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

常用的提示词框架有哪些?

Answer

常用的提示词框架有以下几种:

  1. CRISPE(Capacity and Role,Insight,Statement,Personality,Experiment)
  2. BROKE(Background,Role,Objectives,Key Results,Evolve)
  3. ICIP 框架:包括指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填)
  4. 情境(Situation):任务(Task):行动(Action):结果(Result)
Content generated by AI large model, please carefully verify (powered by aily)

References

小七姐:Prompt is not enough

在过去的一年半时间里,我一直在深度探索和使用如何更好的引导大模型生成我们需要的内容,也一直在进行提示词(prompt)系统化教学。这段经历让我对提示词的发展和应用有了深的认识,我的认知也产生了一个重要的转变:[heading3]“从单纯的提示词优化到更加关注人的底层能力的提升。”[heading2](一)提示词探索路径[content]1.OpenAI官方的六项最佳实践最初,我们主要依赖OpenAI官方给出的指导,包括写清晰具体的指令、给模型时间思考、使用分隔符等基本技巧——这些实践为我们使用大模型开了个好头。1.提示词框架随后,各种提示词框架开始出现,如CRISPE(Capacity and Role,Insight,Statement,Personality,Experiment)和BROKE(Background,Role,Objectives,Key Results,Evolve)等。我们是这用这些框架为提示词编写提供一个系统化的方法。1.明确任务目标清晰地定义我们希望大模型完成的任务是至关重要的。这个阶段强调了任务描述的精确性和完整性。1.角色扮演方法探索让大模型扮演特定角色来完成任务的方法。这种方法能够让模型更好地理解上下文并生成更相关的回答。1.结构化提示词使用基于Markdown语法和角色法框架的结构化提示词。这种方法提高了提示词的可读性和组织性,使复杂任务的分解变得更加直观。1.提示词测试和迭代随着实践的深入,开发了一些提示词测试和迭代的方法。这个过程帮助我们不断优化提示词,提高其效果。1.提示词封装为智能体将提示词封装为智能体,这使得复杂任务的处理变得更加模块化和可复用。

刘海:「AI 提示词工程师」の 见解和经验分享

"提示词工程师"是专门负责为大语言模型设计、优化和实施Prompt的技术角色。他们深刻理解模型的工作原理,能够根据具体需求定制合适的Prompt,确保其有效性。但他们的任务不止于Prompt的编写;他们还需进行细致的测试,仔细分析模型输出,以便持续优化并确保输出内容的质量。简而言之:善于发现需求,解析需求,写成专业的Prompt,解决问题。[heading3]3、什么是提示词框架?[content]提示词工程师已经发展出了多种提示词框架,它们为Prompt的构建提供了一种高度概括和结构化的方法。可以将这些框架看作是构建有效提示词的方法论或"元结构"。例如:ICIP框架:此框架包括四个部分,其中有指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填)。BROKE框架:此框架着重于五个方面,包括背景(Background)、角色定义(Role)、目标设定(Objectives)、关键成果展示(Key Result)以及持续的试验与优化(Evolve)。CRISPE框架:此框架分为六个部分,涵盖了上下文(Context)、角色(Role)、说明(Instruction)、主题(Subject)、预设(Preset)和例外(Exception)。定制化提示词编写服务:随着大语言模型在商业和研究领域的应用,定制化的Prompt编写服务日渐受到欢迎。这些专业服务往往由资深的提示词工程师提供,他们会深入了解客户的具体需求,从而为其设计、优化并定制出最合适的Prompt。

小七姐:Prompt 喂饭级系列教程 小白学习指南(二)

栗子2、比如你发现每次让AI帮你阅读文档的时候,除了甩链接你总要说点什么让它生成的答案更靠谱。你就可以简单写一个Prompt:于是这个提示词解决了你自己,和任何收到你Prompt的人微调几个关键信息就能自动让GPT或者Kimi帮你阅读一篇论文而且生成不错的总结啦!如果你觉得这些例子对你来说还是过于复杂了,请你结合你自己的生活或者工作场景来想一个能帮你简单自动化的场景:自动给班级里的每个孩子起个昵称?自动排版你微信群经常发的一些运营小文案?自动帮你安排周一到周日的减脂餐?帮你列一个清晰的学习计划,day1-day7?帮你的下一次商务会议设计一个调研问卷?……第三步、选一个好上手的提示词框架来帮你开启你第一次有效的编写如果你这时候问什么是提示词框架,那说明你第一课没认真学,回去复习吧。对框架的理解和运用是非常重要的一部分,参考上图,来源:[prompt-engineering/prompt-patterns:Prompt编写模式:如何将思维框架赋予机器,以设计模式的形式来思考prompt(](https://github.com/prompt-engineering/prompt-patterns)[github.com](http://github.com)[)](https://github.com/prompt-engineering/prompt-patterns)提示词框架有很多,有的简单有的复杂,你可以选一个看起来不那么难的先入手,比如可以从非常基础的:情境(Situation):任务(Task):行动(Action):结果(Result):开始。

Others are asking
提示词框架是什么意思
提示词框架是为构建有效提示词提供的一种高度概括和结构化的方法,可看作是构建提示词的方法论或“元结构”。 目前,提示词工程师已发展出多种提示词框架,例如: ICIP 框架:包括指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填)四个部分。 BROKE 框架:着重于背景(Background)、角色定义(Role)、目标设定(Objectives)、关键成果展示(Key Result)以及持续的试验与优化(Evolve)五个方面。 CRISPE 框架:分为上下文(Context)、角色(Role)、说明(Instruction)、主题(Subject)、预设(Preset)和例外(Exception)六个部分。 此外,还有一些标识符和属性词用于标识标题、变量、控制内容层级和标识语义结构。结构化提示词框架在行业内应用广泛且成熟度较高,您可以在很多平台看到优秀的案例。如果您对结构化提示词的理论感兴趣,还可以阅读李继刚和云中江树的相关详细理论原文。
2025-02-19
知识库框架
以下是关于知识库框架的相关内容: 智能体的目标和框架: 智能体的交互能力:包括大模型本身的交互能力、多 Agent 的灵活性、workflow 的妙用(如引导用户输入车辆信息便于大模型理解和分析)以及上下文说明。 智能体的知识体量:涵盖豆包大模型本身的行业数据和语料库、知识库(包括结构化数据与非结构化数据),以及创建知识库的步骤和参赛用知识库,还涉及大模型 RAG 检索、大模型的选择和参数设定以及新模型的调用方法。 智能体的记忆能力:包含变量、数据库和信息记录。 知识: 外置知识是由外部数据库提供,能动态更新和调整。涉及多种数据存储和组织方式,如向量数据库(常用于处理和索引非结构化数据)、关系型数据库(适用于事务性数据存储)、知识图谱(适合复杂语义分析和知识推理)。在实际应用中,外置知识的集成和管理常采用 RAG 架构,能结合检索和生成,增强模型生成能力,实时检索和整合最新外部信息。 陈财猫团队的提示词相关知识库文章索引:
2025-02-18
类似于ollama和vllm这样的LLM 框架有哪些
以下是类似于 ollama 和 vllm 的 LLM 框架: 1. Encoderonly 框架(也叫 AutoEncoder),典型代表如 BERT 等。 2. Encoderdecoder 框架,典型代表如 T5 和 GLM 等。 3. Decoderonly 框架(也叫 AutoRegressive),典型代表如 GPT 系列、LLaMa、PaLM 等。 此外,还有一些在 LLM 应用中发挥重要作用的框架,如: 1. LangChain:是当前大模型应用开发的主流框架之一,提供了一系列工具和接口,其核心在于“链”概念,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具。 2. LlamaIndex:在促进 LLM 和整合上下文数据方面表现出色,抽象出许多提示链的细节,与外部 API 的接口,从向量数据库检索上下文数据,并在多个 LLM 调用中维持内存。
2025-02-17
12个精选prompt框架
以下是 12 个精选的 prompt 框架: 1. ICIO 框架: 指令:执行的具体任务。 背景信息:提供执行任务的背景信息、上下文内容,让大模型更好地回答。 输入信息:大模型需要用到的一些信息。 输出信息:明确输出的具体信息的要求,比如字数、风格、格式。 2. BROKE 框架:通过 GPT 的设计提示,来提升整体反馈的效率。 背景:提供足够背景信息,让大模型可以理解问题的上下文。 角色设定:特定的角色,让 GPT 根据特定的角色能力的特点来形成响应。 目标:明确任务的目标,让大模型知道您想让它做什么。 结果定义:明确可以衡量的结果,让大模型清楚自己做的情况。 调整:根据具体的情况,来调整具体的结果。 3. CRISPIE 框架: 能力和角色:您期望大模型扮演的角色洞察,提供幕后洞察力、背景信息和上下文。 声明:简洁明了地说明希望完成的任务。 个性:回应的风格、个性或者方式。 实验:提供多个回答的示例。 4. 课件中的 Prompt 之术“三板斧”: 分配角色。 给出示例(fewshots)。 思维链(ChainofThought)。
2025-02-17
移动端自动化测试框架
很抱歉,目前知识库中没有关于移动端自动化测试框架的相关内容。但一般来说,常见的移动端自动化测试框架有 Appium、Espresso、XCUITest 等。Appium 支持多种移动平台和编程语言;Espresso 是 Android 平台的专用框架,具有高效和稳定的特点;XCUITest 则是用于 iOS 平台的测试框架。您可以根据您的具体需求和项目情况选择适合的框架。
2025-02-15
ai开发框架
以下是关于 AI 开发框架的相关信息: 1. AI 架构与技术选型的 4 条原则: 选主流框架:优先选择语料多、生成质量好的语言和框架。 测试覆盖率:用 AI 辅助生成测试代码,确保代码质量。 避免私有框架:尽量使用流行框架生成独立模块代码。 模块化设计:降低耦合度,方便 AI 快速开发和维护。参考链接: 2. OpenAI 相关: o1 API 正式版:速度更快,成本降低 60%,支持视觉识别、函数调用、结构化输出等功能。 语音交互升级:引入 WebRTC 支持,12 行代码即可实现实时语音交互,音频处理费用降低 60%。 偏好微调功能:让 AI 回答更具个性化,企业 AI 准确率提升显著。 新增 Go 和 Java 工具包,简化 API 密钥申请流程。参考链接: 3. 基于 Marscode 的 AI 新闻聚合器 MVP 开发实战: 项目架构主要分为三个模块:数据采集模块负责抓取新闻、AI 处理模块使用大模型处理新闻、Web 展示模块基于 gradio 构建界面。 LangChain 是强大的 AI 应用开发框架,特点包括提供统一接口调用各种大语言模型、支持记忆功能保持对话上下文、内置多种提示词模板方便构建复杂 AI 交互、支持知识库集成让 AI 基于特定领域知识回答。 Gradio 是用于快速构建机器学习应用界面的 Python 库,优势在于只需几行代码就能创建漂亮 Web 界面、支持多种输入输出类型、内置分享功能可一键生成公开链接、完全基于 Python 对开发者友好。 4. Dify: 是开源的大模型应用开发平台,通过结合后端即服务和 LLMOps 理念,为用户提供直观界面快速构建和部署生产级别的生成式 AI 应用。 具备强大工作流构建工具,支持广泛模型集成,提供功能丰富的提示词 IDE 以及全面的 RAG Pipeline 用于文档处理和检索。 允许用户定义 Agent 智能体,并通过 LLMOps 功能对应用程序性能进行持续监控和优化。 提供云服务和本地部署选项,满足不同用户需求,通过开源特性确保对数据完全控制和快速产品迭代。 一般地,如果是个人研究,推荐单独使用 Dify,如果是企业级落地项目推荐使用多种框架结合,效果更好。参考链接:Dify 官方手册:https://docs.dify.ai/v/zhhans
2025-02-15
将婴儿彩超图生成照片的AI提示词
以下是关于将婴儿彩超图生成照片的 AI 提示词相关信息: 在图生图功能中,除了文本提词框,还有图片输入口。可将照片拖入,通过反推提示词的按钮(如 CLIP 可反推出完整含义的句子,DeepBooru 可反推出关键词组)获取提示词,但可能存在瑕疵,需手动补充信息。调整宽度和高度使红框匹配图片,并注意提示词相关性和重绘幅度这两个重要参数。 以生成蜘蛛侠生日海报为例,可在 Midjoureny Feed 中寻找优秀案例,复制 prompt 来跑,如使用“baby spider man”“birthday”等关键词。还可将 prompt 交给智谱清言拆解以获取更多关键词。找到满意的图后记录 seed 值保障一致性,为增加专属定制感可增加细节,如“4 岁男孩”“英文名 Andy”“西瓜(儿子的小名)”等。MJ 擅长创意和高质量图片,但细节处理随机,可通过调整“权重”和“局部重绘”解决。
2025-02-24
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始时输入单词主题、图片风格、单词数量。 选择 deepseekr1 模型生成单词数组,以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。 提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且以特定数组形式呈现。 2. Deepseek 时代提示词的关键诉求: 观察发现完整的提示词可能不如片段有效,甚至可能干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染。 在 deepseek 时代,用户只需在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。 新旧提示法对比:传统方法像唠叨家长,费力不讨好,新型技巧像对聪明助理打暗号,精准狙击。 3. 让 DeepSeek 生成相机运动轨迹的提示词: 以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合。 现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式描写,可得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。 对空间理解和对语义的遵循能让有光影变化的泳池自然生成,海螺 AI 甚至能给主角穿上与场景匹配的拖鞋。
2025-02-24
提示词如何设计
提示词的设计需要遵循以下要点和准则: 明确描述想要的内容:模型能完成多种任务,所以要清晰展示需求,而非简单告知。 遵循三个基本准则: 展示和告知:通过说明、示例或两者结合表明需求。如让模型排序或分类,要展示示例。 提供高质量数据:构建分类器或遵循某种模式时,确保有足够且正确的示例。 检查设置:温度和 top_p 控制模型生成响应的确定性,根据需求设置合适的值。 故障排除:若 API 未达预期,检查是否清楚预期结果、提供足够示例、示例有无错误、是否正确使用温度和 top_p。 让代理明确任务以提高表现:采用合理结构并清晰指令,如为不同代理设置不同指令结构,包括角色预设、回复要求、提供示例和所需掌握的知识等。 通用流程: 数据准备:收集高质量案例数据。 模型选择:根据创作目的选合适模型。 提示词设计:结合数据设计初版,注意角色、背景、目标、约束等要点。 测试与迭代:输入提示词测试,与模型交流获取优化建议,修正提示词,重复测试、交流、修正过程,直至满意。 总结提炼:归纳优化经验,形成最佳实践。 应用拓展:将方法论用于其他创意内容设计。 使用他人写好的 prompt 时,要深入揣摩背后思路,理解编写方式的原因和逻辑,关键在于养成充分利用模型、不断迭代、深度交流和思考的习惯。
2025-02-24
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始时输入单词主题、图片风格、单词数量。 选择 deepseekr1 模型生成单词数组,以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。 提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,并以特定数组形式呈现。 2. Deepseek 时代提示词的关键诉求: 观察发现完整的提示词可能不如片段有效,甚至可能干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染。 新一代 LLM 的正确打开方式是“关键诉求直通车”模式,如像对聪明助理打暗号,让模型自主发挥。 3. 让 DeepSeek 生成相机运动轨迹的提示词: 以往提示词是场景、构图、尺寸等的组合,现在要求以“相机运动轨迹”方式描写,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。 对空间理解和语义遵循能让相关元素自然生成,如生成有光影变化的泳池和匹配场景的拖鞋。
2025-02-24
deepseek的提示词文档
以下是关于 DeepSeek 的相关信息: DeepSeek 爆火,价格亲民且实力超群,是智慧开源领航者,实时联网深度推理双冠王,用技术普惠重新定义了 AI 边界。便宜、开源且能联网,在 Appstore 排行第一,导致算力股大跌。 使用地址:https://chat.deepseek.com/(有手机客户端:扫描下面二维码) 模型下载地址:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile API 文档地址:无 DeepSeek 的提示词使用方法比较长,单独列了一篇 魔改版本:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 一个提示词让 DeepSeek 能力更上一层楼的相关内容: 效果对比:用 Coze 做了小测试,对比视频 使用方法: Step1:搜索 www.deepseek.com,点击“开始对话” Step2:将装有提示词的代码发给 Deepseek Step3:认真阅读开场白之后,正式开始对话 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不稳定) 完整提示词:v 1.3 特别鸣谢:李继刚(【思考的七把武器】在前期提供了很多思考方向)、Thinking Claude(项目是最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源)、Claude 3.5 Sonnet(最得力的助手)
2025-02-24
短视频 提示词
以下是关于短视频提示词的相关内容: Pikadditions 功能 1. 上传基础视频 点击页面下方的【Pikaddition】按钮。 拖拽或点击上传本地视频。 若自己没有视频,可在“templates”板块使用官方示例视频做测试。 2. 添加主角图片 点击【Upload Image】上传角色图片文件。 3. 编写视频提示词 若需要参考角色在视频里的相关互动,需在输入框用英文描述期望效果(支持 Emoji 辅助),然后点击生成按钮。 Pika 会提供一段默认 prompt,若没有特殊想法,可以直接使用。 建议在自己的提示词尾部加入官方提供的默认提示词,效果会更好。 该功能提示词公式参考: 事件驱动句式:As... 空间锁定技巧:使用场景物体作坐标轴:on the.../behind the.../from the... 动态呼应原则:角色动作与视频元素联动:swaying with.../reacting to.../matching... Coze 智能体创建 1. “开始”节点 共有 4 个输入变量,分别为:idea_txt(主题观点)、left_to_txt(画面左上角的文字)、right_to_txt(画面右上角的文字)、img_prmpot(画面中间图片生成提示词)。 注意:这 4 个变量名称要和智能体中提示词的变量对应一致,方便接收用户传入的参数。 2. “大模型”节点 使用 DeepSeek R1 模型,提示词要求不复杂,说出需求即可,格式可用大白话说出来。 3. “文本”节点 为将文案分句,每一句要生图、配音。选择按“句号”分句,具体可根据文案格式选择不同方式。 4. “图像生成”节点 使用官方插件,模型选“LOGO 设计”。若要生成全景图,此插件效果欠佳,建议选其它插件。 5. “抠图节点” 将上个节点生成的图片进行抠图。 编剧提示词 默认适合大框架的故事结构。若做短视频,在提交创作偏好时标注片长,比如:这是个 3 分钟的短视频。输出是分阶段的,几个来回就可以搞定剧本。
2025-02-24
常用的AI助手
以下是一些常用的 AI 助手: 辅助编程的 AI 产品: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能快速提供代码建议。 通义灵码:阿里巴巴团队推出,提供多种编程相关能力。 CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型。 Cody:Sourcegraph 推出的 AI 代码编写助手,借助强大的代码语义索引和分析能力。 CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手。 Codeium:由 AI 驱动的编程助手工具,提高编程效率和准确性。 更多辅助编程 AI 产品,可查看:https://www.waytoagi.com/category/65 。每个工具功能和适用场景不同,可根据需求选择。 营销领域的 AI 产品: Synthesia:允许创建 AI 生成的高质量视频,包括数字人视频,多种定价计划。 HeyGen:基于云的 AI 视频制作平台,可生成数字人视频。 Jasper AI:人工智能写作助手,用于生成营销文案等。 Copy.ai:AI 营销文案生成工具,有免费和付费计划。 Writesonic:AI 写作助手,专注营销内容创作。 更多营销产品可查看:https://www.waytoagi.com/sites?tag=8 。这些工具能帮助营销人员高效创作,根据需求选择。 AI 与宠物结合的方式: AI 宠物助手:基于自然语言处理和计算机视觉,帮助主人照顾宠物,如识别情绪、提供饮食建议、监测健康状况。 AI 宠物互动玩具:利用 AI 技术开发智能互动玩具,增强宠物娱乐体验。 AI 宠物图像生成:使用生成式 AI 模型生成宠物形象图像,定制个性化形象。 AI 宠物医疗诊断:利用计算机视觉和机器学习技术开发辅助诊断系统,提供初步诊断建议。 AI 宠物行为分析:基于传感器数据和计算机视觉分析行为模式,帮助主人了解宠物需求和习性。 学习路径建议:掌握基础的机器学习、计算机视觉、自然语言处理等 AI 技术;了解宠物行为学、宠物医疗等相关知识;关注业内先进案例;尝试开发原型并迭代优化。AI+宠物是新兴赛道,充满想象空间,可开发出有趣有用的应用。
2025-02-17
目前有哪些常用的AI
目前常用的 AI 包括以下方面: 应用场景: 医疗保健:医学影像分析辅助诊断疾病、加速药物研发、提供个性化医疗方案、控制手术机器人提高手术精度和安全性。 金融服务:风控和反欺诈、信用评估辅助贷款决策、投资分析、提供 24/7 客户服务并回答常见问题。 零售和电子商务:产品推荐、改善搜索结果和提供个性化购物体验、动态定价、提供聊天机器人服务。 制造业:预测机器故障进行维护、检测产品缺陷提高质量、优化供应链、控制工业机器人提高生产效率。 交通运输:尚未详细列举。 图生图产品: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:将上传照片转换为芭比风格。 Excel 相关的 AI: Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术进行数据分析和决策支持。 Microsoft 365 Copilot:整合 Word、Excel 等办公软件,通过聊天形式完成任务。 Formula Bot:提供数据分析聊天机器人和公式生成器功能。 Numerous AI:支持 Excel 和 Google Sheets,能生成文本内容、执行情感分析、语言翻译等。
2025-02-17
ai换脸 常用工具
以下是一些常用的 AI 换脸工具及相关操作方法: 1. facefusion 工具: 云服务解决方案: 选择 AutoDL 平台(官网:https://www.autodl.com/home ),注册后在算力市场中选择能接受价格且 GPU 配置较高的算力服务器。 在算法社区查找 facefusion 镜像,点击右侧合适的镜像(左侧的可能有问题)。 点击右下角的创建实例按钮,创建并启动实例(即启动一台服务器)。 点击快捷工具中顶部的 JupyterLab 打开工具,通过终端输入以下命令: 查看文件列表:输入“ls”并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录:输入“cd facefusion”并按回车,进入程序目录。 启动 facefusion:输入“python./run.pyexecutionproviders cuda cpu”(注意后面的参数“executionproviders cuda cpu”非常重要,如果不加“cuda”,默认不使用 GPU 能力,推理将非常慢)。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,会打开新的浏览器窗口,通过 web 浏览器访问 facefusion 提供的 UI 界面,上传准备好的图片、视频,在右侧可看到预览效果,点击下方的开始按钮执行换脸处理。 本机解决方案: 该软件需要 python 环境及安装视频解码器等多个依赖软件,需要一定编程知识,可参考网站 https://docs.facefusion.io/ 进行本地安装。 由于 facefusion 的运行推理计算速度非常依赖 GPU,若本地计算机没有 GPU 或 GPU 显存较小,执行速度将会非常缓慢。 2. 开源地址:https://github.com/facefusion/facefusion
2025-02-16
请问抖音中的小说短视频通常用什么软件来做
抖音中的小说短视频通常可以使用以下软件和流程来制作: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 工具与网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-02-09
ai绘画常用且可以作出商业用途的设计工具都哪些
以下是一些 AI 绘画常用且可用于商业用途的设计工具: 1. Midjourney:能够帮助设计师快速创建草图和概念图,实现自动化创意设计、颜色匹配、插图绘制等,在更多工作场景中带来降本增效的效果。 2. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具。 3. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。 4. nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 5. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型。 6. 主流 CAD 软件中的生成设计工具,如 Autodesk 系列、SolidWorks 等,可根据输入自动产生多种设计方案。 7. Recraft AI:是 AI 平面设计工具,用户可生成和编辑插画、海报、产品周边等,提供多种样式的可选风格,允许对生成的图像进行商业使用。
2025-02-08
设计师常用的文字生成图片工具
设计师常用的文字生成图片工具包括: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 2. StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量图像生成效果和用户友好界面设计而受欢迎,在创意设计人群中流行。 4. LayerStyle 副本:从文字生成图片以及遮罩,支持字间距、行间距调整,横排竖排调整,可设置文字的随机变化,包括大小和位置的随机变化。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 另外,图片生成 3D 建模工具包括: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域的模型生成。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。 这些工具通常具有用户友好的界面,允许用户通过简单操作生成 3D 模型,无需专业 3D 建模技能,广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-27