Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何构建属于自己的prompt

Answer

构建属于自己的 prompt 可以参考以下思路:

  1. 明确构建目的:如为了节省力气,根据初始问题自动生成优质 prompt。
  2. 遵循一定的流程:
    • 按照特定的方法论,如参考 CRISPE 提示
    • 以清晰的结构和灵活的表达方式进行,例如对于视频模型 MiniMax 海螺 AI,可参考其提供的两类 prompt 参考公式。
  3. 针对不同模型和需求选择合适的方式:
    • 对于 Claude,可用 Lisp 或 Markdown 格式构建 prompt,直接打开 Claude 首页发送提示词进行初始化后使用。
    • 对于视频创作,若没有明确的镜头呈现需求或期待激发创作灵感,可使用 Prompt 基础公式,即“要创建的主要表现物+场景空间+运动/变化”。

例如:“一只小狗在公园中奔跑”“一个女人打着伞在雨中的街头行走”“山谷中的一条小溪静静流淌”。

Content generated by AI large model, please carefully verify (powered by aily)

References

JackeyLiu (JK):Prompt 自动优化思路

作者:JackeyLiu(JK)[heading1]我为什么要"构建Prompt"[content]最近也算是chatgpt的深度用户了,但随着使用变长,每次我都需要重新去构建我的Prompt,虽然我已经熟知了Prompt的构建通用方法,但还是每次都需要把这个方法拿出来,根据我实际的问题去构建一遍。因为我自己平时还是喜欢用偏生活化的文字进行交流,每次构建Prompt都得动一下脑子,为了节省力气,所以就干脆一点,就写一个基于我的「初始问题」,自动生成「优质Prompt」的Prompt。构建Prompt的方法论,来自于:[CRISPE提示](https://github.com/mattnigh/ChatGPT3-Free-Prompt-List)[heading1]我怎么构建这个Prompt[content]我构建这个Prompt的大体思路基本上是按照下面这个流程来进行。[heading2]Prompt Optimizer V0.1

甲木:如何让Claude帮你来做「情绪价值营销」?

接下来,我们直接用Lisp来构建prompt,让Claude直接根据用户输入的领域和产品(也可自定义我们的产品特点),直接输出情绪营销语句~用Lisp这种编程语言是之前prompt圈李继刚刚哥带火了一波,使用下来更为凝练和简洁。当然,用我们一直倡导的Markdown的格式来写prompt的效果是一样的~[heading3]Lisp格式prompt(Claude专用)[heading3]Markdown格式prompt(GPT/国内大模型可用)@TODO待优化[content]备注:GPT等模型在卡片生成这步需要进行一些调整,不稳定。最好自定义html/css样式来进行强约束。[heading3]极简版输出(GPT o1系列,一步步思考推理)[heading2]打开Claude进行初始化[content]直接打开Claude首页,把上述提示词发送。初始化完成,接下来就可以直接进行使用~

视频模型:MiniMax海螺AI

Prompt是一把由你的灵感与创意构筑的钥匙,能够打开通往AI奇幻世界的大门。只需要在海螺AI官网的输入框内输入Prompt,等待后即可获得Prompt对应的AI视频。无论你是初次接触AI的新人,还是已经能够熟练使用AI赋能生产力的老手,通过清晰的结构和灵活的表达方式,都可以轻松掌握Prompt的编写技巧,实现“一个人+一个AI=一个专业剧组”的科幻愿景。只要掌握一些小小的规则,人人都可以成为AI魔法师!为了达到更好的表现效果,我们为大家设计了两类Prompt的参考公式:[heading4]1、Prompt基础公式[content]Prompt基础公式适用于对于视频没有明确的镜头呈现需求,或者期待使用AI视频激发创作灵感的朋友,自由的Prompt可以获得更具想象力的画面。Prompt基础公式=要创建的主要表现物+场景空间+运动/变化要创建的主要表现物:主要表现物是视频的核心信息,可以是人物、动物、其它物体亦或是不存在的想象之物。场景空间:场景空间描述的是视频表现物的周围环境信息,可以是精确的标志性空间,如图书馆、咖啡厅,也可以是幻想性的虚构场景。运动/变化:运动和变化是对于主要表现物在视频中的状态描述,例如物体的静止、运动;环境空间的转化等等。例如:一只小狗在公园中奔跑一个女人打着伞在雨中的街头行走山谷中的一条小溪静静流淌

Others are asking
优质prompts
以下是关于优质 Prompts 的分类精选: 摸鱼辅助: Role 名称:A.I.闺蜜 作者:yongtaizhou 版本:0.1 描述:你的安慰、理解的朋友。对方的基本信息未知,在聊天中可得知。适当时候询问对方昵称,作为称呼,你的昵称可由对方来定,如果没有的话,你的兜底昵称为皮皮,英文昵称 copi。你现在是我的闺蜜,请用闺蜜的口吻和我说话,需要做到模拟非线性对话模式、聊天氛围温馨有温度、增强情感模拟、使用非常口头化的语言、顺着对方的话继续往下,禁止说教、个性化和记忆、模拟真人之间的互动长度。 学习辅助: Role 名称:提示词专家 作者:pp 版本:2.1 描述:你是一名优秀的 Prompt 工程师,擅长将常规的 Prompt 转化为结构化的 Prompt,并输出符合预期的回复。具有了解 LLM 的技术原理和局限性、丰富的自然语言处理经验、迭代优化能力强等技能。
2025-02-23
prompt模板
以下是关于 prompt 模板的相关内容: 一、什么是 Prompt 简单来说,Prompt 是一套与大模型交互的语言模板。通过它可以输出对大模型响应的指令,明确大模型应做的任务、处理方式及期望的结果。大模型虽有基础文字能力,但为提升回答准确性,需借助 Prompt。在大模型时代,人机交互的主要方式之一就是 Prompt。 二、用更加专业的方式定义 大模型的本质是基于语言的概率模型,返回其认为概率最大的内容。若直接询问大模型且未提供 Prompt,相当于模型随机给出答案。有了 Prompt 则提供了模板,包括对模型的要求、输入和输出的限制,使模型在限制下得出概率最大的答案。 三、Ask Claude for rewrites 要求 Claude 进行重写 通过 API 发送请求(包括 Claude for Sheets 中的功能)时,必须在提示中包括先前生成的文本。示例提示模板为: |Role|Prompt| ||| |User|Here's a paragraph: 这是一个段落:<br><paragraph><段落><br>{{PARAGRAPH}}{{段落}}<br></paragraph></段落><br><br>I'd like you to rewrite it using the following instructions:<br>我希望您按照以下说明重新撰写它:<br><instructions><指示><br>{{INSTRUCTIONS}}{{说明}}<br></instructions></指示><br><br>Please put your rewrite in<rewrite></rewrite>tags.<br>请将您的重写放在<rewrite></rewrite>标记中。| |Assistant助手(预先填充)|<rewrite>| 对于较低使用量的情况,可将待重写的段落粘贴到{{PARAGRAPH}}的位置。要自动化此过程,可考虑设置提示链,使 Claude 对先前提示的响应替换为{{PARAGRAPH}}占位符。 四、Claude 官方提示词,中文版(含 API Prompt) 作者为金色传说大聪明赛博禅心,链接:https://mp.weixin.qq.com/s/rdKcT76ayfVH9wkfLVaJQ 。Claude 官方发布了提示词模板,涵盖工作和娱乐各方面,共 63 组,有英文版和中文版。例如“宇宙打字”,简介为:生成一个单 HTML 文件的互动打字游戏,宇宙打字,侧滚玩法,Tailwind CSS 风格。Prompt 为:编写一个完整的网络应用程序作为单个 HTML 文件,该应用程序应包含一个简单的横向滚动游戏,使用 WASD 来移动。在移动世界时,偶尔角色/精灵会遇到单词,当遇到单词时,玩家必须尽快正确输入该单词,输入单词越快,玩家获得的分数就越高,应在右上角有一个计数器来跟踪分数,单词应随机且高度可变以保持游戏有趣,应使网站美观,并使用 Tailwind。
2025-02-22
prompt是什么
Prompt 是您给 AI 模型(如 Claude)的文本,用于引发相关输出,通常以问题或指示的形式出现。例如“为什么天空是蓝色的?”。在 AI 视频生成中,Prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,用户借此控制和指导生成内容。它作用十分重要,是表达需求的方式,影响视频内容和质量。简单来说,Prompt 是一套您和大模型交互的语言模板,通过这个模板,您可以输出对于大模型响应的指令,用于指定大模型应该具体做什么、完成什么任务、如何处理具体的任务,并最终输出您期望的结果。从更专业的角度看,大模型的本质是一个基于语言的概率模型,Prompt 给了一个模板,包括对模型的要求、输入和输出的限制,让大模型在这个限制下得到概率最大的答案。如果没有提供 Prompt,大模型相当于随机给出答案,有了 Prompt 能提升模型返回的准确性。
2025-02-22
爆款短视频文案prompt
以下是为您提供的爆款短视频文案 prompt 相关信息: Kimi 新出的常用语功能中有 15 款预设好的 Prompt,其中包括生成高质量的爆款网络文案。此外,还有如整理生成高质量会议纪要、整理课程 PPT、推荐影视、生成电影评论、进行职业导航、提供营销策划、进行面试模拟、生成宣传口号、进行期刊审稿、进行诗意创作、快速写新闻、凝练要点、创作短剧脚本、优化文字排版等功能。 使用 GPT 模仿创作内容的万能思路中,核心在于 GPT 对少样本范例的学习。编写 Prompt 时,要明确提供创作的方法论和技巧供 GPT 模仿学习,例如创作标题时,要明确运用的修辞手法、写作人称、语言风格、内容结构等。在数据收集方面,可以通过人工采集(复制粘贴、OCR 识别、自己手打)或自动采集(爬虫、脚本)的方式收集几十个对标博主的视频标题,采集完毕后可导出 Excel 表格并按点赞数降序筛选。
2025-02-21
Prompt 提示词
以下是关于 Prompt 提示词的全面介绍: 一、如何编写提示词 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:明确格式、风格等要求。 5. 使用示例:提供期望结果的示例。 6. 保持简洁:避免过多信息导致困惑。 7. 使用关键词和标签:帮助模型理解任务主题和类型。 8. 测试和调整:根据生成结果检查并调整。 二、如何润色或优化 Prompt 1. 明确具体描述:使用更具体、细节的词语和短语。 2. 添加视觉参考:插入相关图片参考。 3. 注意语气和情感:用合适的形容词、语气词调整整体语气和情感色彩。 4. 优化关键词组合:尝试不同搭配和语序。 5. 增加约束条件:添加限制性条件,如分辨率、比例等。 6. 分步骤构建 Prompt:将复杂需求拆解为逐步的子 Prompt。 7. 参考优秀案例:研究有效的 Prompt 范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:多次尝试不同写法并根据效果反馈优化。 三、星流一站式 AI 设计工具中的 Prompt 输入框 1. 提示词用于描绘画面。 2. 输入语言: 星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发)。 支持中英文输入。 3. 提示词优化:启用后可扩展提示词,更生动描述画面内容。 4. 写好提示词的方法: 预设词组:小白用户可点击官方预设词组生图。 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 调整负面提示词:点击齿轮按钮弹出负面提示词框,帮助 AI 理解不想生成的内容。 利用“加权重”功能:在功能框增加提示词并调节权重,数值越大越优先,也可编辑已有提示词权重。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-21
prompt
以下是关于 prompt 的相关知识: 1. 提示简介: 提示是您给 Claude 的文本,用于引发相关输出,通常以问题或指示的形式出现。例如:用户输入“为什么天空是蓝色的?”,Claude 回答的文本被称为“响应”,有时也被称为“输出”或“完成”。 2. 改变区域+混音: 选择的大小会影响结果。更大的选择为中途机器人提供更多上下文信息,能改善新添加内容的扩展和上下文,但选择太多可能会导致新生成的元素混合或替换原始图像的部分。 提示应集中于您希望在所选区域中发生的事情,较短且聚焦的提示通常更有效,不应是对话式的。 如果要更改图像的多个部分,应一次只处理一个部分。 技术细节:使用 Vary+Remix 模式生成的作业将遵循 chaos、fast、iw、no、stylize、relax、style、version、video、weird 等参数。 3. 提示的类型: 基本提示:可以是简单的单词、短语或表情符号。中途机器人最适合用简单、简短的句子来描述您想看到的内容,应避免长长的请求列表。 高级提示:可以包括一个或多个图像 URL、多个文本短语以及一个或多个参数。图像 URL 始终出现在提示的前面,精心编写的提示有助于生成令人惊叹的图像。
2025-02-20
如何构建智能问答Agent
以下是关于构建智能问答 Agent 的相关信息: Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据自身需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在飞书上构建 FAQ 机器人: 1. 会议介绍了 WaytoAGI 社区的成立愿景和目标,以及其在飞书平台上的知识库和社区的情况。 2. 讨论了利用 AI 技术帮助用户更好地检索知识库中的内容,引入了 RAG 技术,通过机器人来帮助用户快速检索内容。 3. 介绍了基于飞书的知识库智能问答技术的应用场景和实现方法,可以快速地给大模型补充新鲜的知识,提供大量新的内容。 4. 讨论了如何使用飞书的智能伙伴功能来搭建 FAQ 机器人,以及智能助理的原理和使用方法。 5. 飞书智能伙伴创建平台(Aily)是飞书团队旗下的企业级 AI 应用开发平台,提供简单、安全且高效的环境,帮助企业轻松构建和发布 AI 应用。 本地部署资讯问答机器人: 决定先采取 Langchain + Ollama 的技术栈来作为 demo 实现,后续也会考虑使用 dify、fastgpt 等更加直观易用的 AI 开发平台。 整体框架设计思路如下: Langchain 是当前大模型应用开发的主流框架之一,提供一系列工具和接口,核心在于其“链”概念,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,可灵活组合支持复杂应用逻辑,其生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具。 Ollama 是一个开箱即用的用于在本地运行大模型的框架。 请注意,以上信息由 AI 大模型生成,请仔细甄别。
2025-02-24
如何权构建个人AI知识库,请提供详尽的方案,并提供相关工具应用案例。
以下是构建个人 AI 知识库的详尽方案及相关工具应用案例: 方案: 1. 知识收集:学习如何有效地收集、整理和检索信息,例如分新闻、观点、访谈、论文翻译来进行提炼。 2. 知识管理:通过实际操作,体验工具在知识管理方面的应用。 3. 数据处理:使用工具对数据进行转换、提取和呈现,如从图像和图形中提取数据。 4. 内容总结:总结视频内容、翻译和改换风格等。 工具应用案例: 1. 知识收集与整理: 通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 本机跑大语言模型工具:https://ollama.com 选词翻译、解读、拓展:https://snapbox.app 与各种 AI 机器人聊天:https://opencat.app 、https://chathub.gg/ 、https://www.elmo.chat/ 定义提示语,根据不同类型提取有用信息:https://memo.ac/zh/ 2. 数据获取与处理: 下载视频:Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 开源免费屏幕录制工具 OBS:https://obsproject.com/ 用 losslessCut 快速切块 3. 构建知识库: 将文本转换成向量(如使用 embeddings API),先把大文本拆分成若干小文本块(chunk),将小文本块转换成 embeddings 向量并在向量储存库中保存,当用户提问时,通过比对向量提取关联度最高的文本块与问题组合成新的 prompt 发送给 GPT API。 例如对于一篇包含多个文本块的文章,如“文本块 1:本文作者:越山。xxxx。”“文本块 2:公众号越山集的介绍:传播效率方法,分享 AI 应用,陪伴彼此在成长路上,共同前行。”等,当提问“此文作者是谁?”时,可通过比较 embeddings 向量找出关联度最高的文本块。 4. 工具入门: 提示词:现成好用的 Prompt: AI Agent:Agent 工具 小白的 Coze 之旅: AI Pic:现在主流的 AI 绘图工具网站:
2025-02-22
如果通过deepseek构建智能客服
要通过 DeepSeek 构建智能客服,可以参考以下步骤: 1. 效果对比:用 Coze 做小测试进行对比。 2. 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不稳定)。 4. 特别鸣谢:李继刚的【思考的七把武器】在前期提供了很多思考方向;Thinking Claude 是最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手。 另外,实现联网版的 DeepSeek R1 大模型的核心路径如下: 1. 拥有扣子专业版账号:如果还是普通账号,请自行升级或注册专业号后使用。 2. 开通 DeepSeek R1 大模型:访问地址 https://console.volcengine.com/cozepro/overview?scenario=coze ,打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务,添加在线推理模型,添加后在扣子开发平台才能使用。 3. 创建智能体:点击创建,先完成一个智能体的创建。 同时,GPT1 到 Deepseek R1 所有公开论文中关于智能代理的部分提到:Anthropic 的《构建有效的代理》是一篇关于 2024 年的精彩回顾,重点关注连锁、路由、并行化、协调、评估和优化的重要性。还可以在加州大学伯克利分校 LLM 代理的慕课中找到更多资料。
2025-02-18
怎么用大模型构建一个属于我自己的助手
以下是用大模型构建属于自己的助手的几种方法: 1. 在网站上构建: 创建百炼应用获取大模型推理 API 服务: 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可以输入一些 Prompt 来设置人设。 在页面右侧提问验证模型效果,点击右上角的发布。 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID 并保存到本地。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存到本地。 2. 微信助手构建: 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 搭建,作为知识库问答系统,将大模型接入用于回答问题,若不接入微信,搭建完成即可使用其问答界面。 搭建接入微信,配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 3. 基于 COW 框架构建: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 基于张梦飞同学的更适合小白的使用教程:。 实现功能包括打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)、常用开源插件的安装应用。 注意事项: 微信端因非常规使用有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保操作符合法律法规要求。 禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 支持多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 支持多消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 支持多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-17
怎么用大模型构建一个属于我自己的助手
以下是用大模型构建属于自己的助手的几种方法: 1. 在网站上构建: 创建百炼应用获取大模型推理 API 服务: 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可以输入一些 Prompt 来设置人设。 在页面右侧提问验证模型效果,点击右上角的发布。 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID 并保存到本地。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存到本地。 2. 微信助手构建: 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 搭建,作为知识库问答系统,将大模型接入用于回答问题,若不接入微信,搭建完成即可使用其问答界面。 搭建接入微信,配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 3. 基于 COW 框架构建: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 基于张梦飞同学的更适合小白的使用教程:。 实现功能包括打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)、常用开源插件的安装应用。 注意事项: 微信端因非常规使用有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保操作符合法律法规要求。 禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 支持多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 支持多消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 支持多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-17
我怎样用低代码工具去构建我的AI智能体?LLM应用?
以下是关于如何用低代码工具构建 AI 智能体和 LLM 应用的一些建议: 在构建基于 LLM 的应用时,Anthropic 建议先寻找最简单的解决方案,只在必要时增加复杂度。智能系统通常会以延迟和成本为代价来换取更好的任务表现,开发者需要考虑这种权衡是否合理。当需要更复杂的解决方案时,工作流适合需要可预测性和一致性的明确任务,而智能体则更适合需要灵活性和模型驱动决策的大规模场景。不过,对于许多应用来说,优化单个 LLM 调用(配合检索和上下文示例)通常就足够了。 目前有许多框架可以简化智能系统的实现,例如: 1. LangChain 的 LangGraph。 2. 亚马逊 Bedrock 的 AI Agent 框架。 3. Rivet(一个拖放式 GUI 的 LLM 工作流构建器)。 4. Vellum(另一个用于构建和测试复杂工作流的 GUI 工具)。 这些框架通过简化标准的底层任务(如调用 LLM、定义和解析工具、链接调用等)使入门变得容易,但它们往往会创建额外的抽象层,可能会使底层提示词和响应变得难以调试,也可能诱使开发者在简单设置就足够的情况下增加不必要的复杂性。建议开发者先直接使用 LLM API,许多模式只需要几行代码就能实现。如果确实要使用框架,请确保理解底层代码。 此外,还有以下相关工具和应用: 1. VectorShift:能在几分钟内构建和部署生成式人工智能应用程序,利用大型语言模型(例如 ChatGPT)构建聊天机器人、文档搜索引擎和文档创建工作流程,无需编码。 2. Unriddle:帮助更快阅读、写作和学习的工具,能简化复杂的主题,找到信息,提问并立即获得答案。 工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加了一个新的层。一些流行的原语如网页浏览(Browserbase、Tiny Fish)、代码解释(E2B)和授权+认证(Anon)已经出现,它们使 LLM 能够导航网络、与外部软件(如 CRM、ERP)交互并运行自定义代码。Omni 的计算 AI 功能体现了这种方法,它利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。 详细示例请参考:https://github.com/anthropics/anthropiccookbook/tree/main/patterns/agents
2025-02-17
想要搭建属于自己的知识库应该用什么软件
以下是一些可用于搭建个人知识库的软件及相关信息: 1. Coze 或 FastGPT 等工具:在当下技术条件下,其 RAG 能力对问答场景较友好,其他场景效果一般。若需企业级复杂知识库场景,可能需找专业团队,收费几万到几十万不等。 2. 推荐文章《手把手教你本地部署大模型以及搭建个人知识库》中提到的 AnythingLLM 软件: 包含所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 该软件中有 Workspace 的概念,可创建独有 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式和 Query 模式),配置完成后可进行对话测试。 3. 基于 GPT API 搭建定制化知识库:涉及给 GPT 输入定制化知识,因 GPT3.5 交互容量有限,OpenAI 提供了 embedding API 解决方案,可参考 OpenAI embedding documents 理解 embeddings 相关知识。
2025-02-23
大模型和小模型区别是什么?是否大模型都属于生成式AI,小模型属于判别式AI,为什么大模型有幻觉小模型没有?
大模型和小模型的区别主要体现在以下几个方面: 1. 规模和参数数量:大模型通常具有更多的参数和更复杂的架构,能够处理更大量和更复杂的数据。 2. 能力和性能:大模型在语言理解、生成等任务上往往表现更出色,能够生成更准确、丰富和连贯的内容。 3. 应用场景:大模型适用于广泛的通用任务,而小模型可能更专注于特定的、较狭窄的领域。 并非大模型都属于生成式 AI,小模型都属于判别式 AI。生成式 AI 能够生成新的内容,如文本、图片等;判别式 AI 则主要用于对输入进行分类或判断。模型的分类与其大小并无直接的必然联系。 大模型出现幻觉的原因主要是其通过训练数据猜测下一个输出结果,可能会因错误或不准确的数据导致给出错误的答案。而小模型相对来说数据量和复杂度较低,出现幻觉的情况相对较少,但这并非绝对,还取决于模型的训练质量、数据的准确性等多种因素。优质的数据集对于大模型减少幻觉现象非常重要。
2025-02-21
如何创建属于自己的智能体
以下是创建属于自己的智能体的一般步骤: 1. 对于 Coze 智能体: 打开扣子官网:https://www.coze.cn/ 。 “画小二智能小助手”Coze 商店体验地址:https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cqnnu5qo7g00 。 点击创建 Bot,在对话框中工作空间选择“个人空间”,命名为画小二智能小助手。 设置画小二助手的提示词。 2. 对于用 Coze 的工作流创建: 打开 Coze 官网 https://www.coze.cn/home 。 创建图像工作流,图像流分为智能生成、智能编辑、基础编辑三类。 空间风格化插件有相关参数,如 image_url 是毛坯房的图片地址;Strength 是提示词强度,影响效果图;Style 是生成效果的风格,如新中式、日式、美式、欧式、法式等;user_prompt 是用户输入的 Promot 提示词。 按照构架配置工作流,调试工作流毛坯房测试用例:https://tgi1.jia.com/129/589/29589741.jpg 。 开始节点对应配置三项内容,进行提示词优化。 设定人设和回复逻辑,然后点击右上角发布。 3. 对于智谱 BigModel 共学营第二期的微信助手: 注册智谱 Tokens 智谱 AI 开放平台:https://bigmodel.cn/ 。 参与课程至少需要有 token 体验资源包,获取资源包的方式有:新注册用户注册即送 2000 万 Tokens;充值/购买多种模型的低价福利资源包,如直接充值现金,所有模型可适用:https://open.bigmodel.cn/finance/pay ,语言资源包:免费 GLM4Flash 语言模型/ ,所有资源包购买地址:https://bigmodel.cn/finance/resourcepack ,共学营报名赠送资源包。 先去【财务台】左侧的【资源包管理】查看自己的资源包,本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。 进入智能体中心我的智能体,开始创建智能体。
2025-02-16
我想组织一个团队,完成属于自己的一套数字人制作技术
以下是组织一个团队完成属于自己的一套数字人制作技术的相关内容: 方案一:剪映数字人“个性化“—无限免费私模数字人 1. 准备谷歌账号(可在淘宝或“”购买)。 2. 第一步:打开谷歌浏览器,点击链接https://github.com/facefusion/facefusioncolab 并点击 open colab 进入程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 3. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 4. 第三步:等待专属数字人视频出炉。 方案二:借助开源社区力量构建高质量的 AI 数字人 1. 推荐借助开源社区的像 dify、fastgpt 等成熟的高质量 AI 编排框架,它们有大量开源工作者维护,集成各种主流模型供应商、工具及算法实现等。 2. 可通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。 在开源项目中,使用 dify 框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,实现相对复杂功能,如知识库搭建、工具使用等,无需编码和重新部署工作。 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于此可将数字人的语音识别和语音生成都交由 Dify 控制,低门槛做出高度定制化的数字人。具体部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。 若有更高度定制的模型,也可在 Dify 中接入 XInference 等模型管理平台部署自己的模型。 数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块,能保持更好的扩展。 注意事项: 1. 使用 Dify 接口时,必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,可自行选择方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可根据个人喜好添加。 制作数字人的工具: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-01-21