Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

意图识别如何通过提示词实现

Answer

通过提示词实现意图识别通常有以下几种方式:

  1. 准备特定于任务的数据集,对模型进行 Fine-tuning,以提升其在特定意图识别任务上的表现。但此过程需要较多训练数据和计算资源。
  2. 使用 Prompt-tuning 方法,通过精心设计的提示词来引导模型识别和响应用户意图。这种方法具有灵活性和快速适应性。
  3. 对用户的指令通过提示词进行分类,以识别不同的意图,然后根据识别出的意图执行相应动作,最终输出 JSON 格式的结果。
  4. 对用户提问进行分类,如分为导航类、信息查询类、交易类、本地信息类等,匹配更准的信息源和更好的回复提示词。例如搜索“笔记本电脑”,提取出“shopping”意图,挂载相关电商平台信息源进行更小范围搜索,并加载匹配的提示词模板控制大模型回答内容。
  5. 利用大模型提供的 Function Calling 能力进行意图识别。

但目前主流的实现方案,不管是成熟的大模型还是微调的小模型,准确度都不够高。

Content generated by AI large model, please carefully verify (powered by aily)

References

新的一年,新年心语——优秀创作者

实现的整体思路如下:1.首先通过意图识别节点来识别用户他的意图1.1.春联1.2.祝福语1.3.运势1.4.闲聊2.如果是春联,则需要两个大模型节点和一个图像申城2.1.大模型节点1:生成藏头的对联2.2.大模型节点2:根据对象生成图像提示词2.3.调用一个代码节点使用文生图的能力3.如果是祝福语3.1.大模型节点1:生成祝福语3.2.大模型节点2:生成生图提示词3.3.调用代码节点使用文生图的能力4.如果是新年运势4.1.则直接通过一个大模型节点生成,要结合人的生肖、生日、出生地和性别这个智能体最关键的部分是提示词+生图的代码节点[heading1]视频教程[content][20250119213041_rec_.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/C7aAbBbtDo69nNxtSgHcjY3Tnke?allow_redirect=1)[heading1]附录提示词[heading2]配合意图识别的大模型提示词[heading2]祝福语提示词[heading2]祝福语生图提示词[heading2]运势提示词[heading2]对联生成提示词[heading2]根据对联生图提示词[heading2]接入即梦API代码节点

AI Agent系列(二):Brain模块探究

在当前使用大型模型进行意图识别的实践中,通常有两种主要方法。第一种方法是通过准备特定于任务的数据集,然后利用这些数据对模型进行Fine-tuning,以提升其在特定意图识别任务上的表现。这个过程涉及到在预训练模型的基础上进一步训练,以调整模型参数,使其更适应特定的任务需求。第二种方法是Prompt-tuning,这种方法不需要对模型的参数进行大规模调整。而是通过精心设计的提示词来引导模型,使其能够识别和响应用户的意图。这种方法的优势在于其灵活性和快速适应性,能够在不改变模型参数的情况下,迅速适应新的任务或领域。这两种方法各有千秋:微调能够提供更高的准确性,但需要较多的训练数据和计算资源;而提示词调优则在创造性和灵活性方面表现更为突出。然而,在使用大型模型进行意图识别时,我们需要注意一些潜在的问题。例如,由于意图识别在智能系统中扮演着守门人的角色,如果其准确性不足,整个系统的后续环节,包括记忆、规划和反思等,都可能受到影响,无法正常发挥作用。此外,在落地设计时,意图识别通常与特定的业务场景紧密相关,如果脱离了具体的业务需求,意图识别将失去其实际意义。因此,在设计意图识别系统时,必须将其与业务需求紧密结合,确保其能够准确地理解和响应用户的需求。如果意图识别脱离了业务背景,那么可能不如利用模型的泛化能力去执行更基本的意图识别任务。以下给大家提供一个使用prompt来设计意图识别的例子:在上述使用提示词进行意图识别的例子中,我们可以观察到几个关键点。首先,提示词对用户的指令进行了分类,以识别不同的意图。然后,根据这些识别出的意图,系统执行相应的动作。最终,系统会输出一个JSON格式的结果,这通常包含了对用户指令的解析和响应。

工具:我做了一个 AI 搜索引擎

第一种方案会有枚举无法穷尽的问题,第二种方案主要问题在于大模型的识别准确度不够高。意图识别另一个关键作用,是对用户提问进行分类,比如可以把用户的搜索意图分为:导航类:用户希望找到特定的网站或网页。例如:搜索“ThinkAny”,是为了打开ThinkAny官网;信息查询类:用户希望找到某个问题的答案或关于某个事物的详细信息。例如:搜索“什么是AI搜索引擎”,是为了了解这类产品或这个行业;交易类:用户希望进行某种交易。例如:搜索“笔记本电脑”是为了找到电脑相关的产品信息和价格信息,并进入推荐的电商网站购买。本地信息类:用户希望根据特定地理位置查找本地信息。例如:搜索“附近的烤肉店”是为了找到附近的餐馆。还有其他一些分类,包括多级子分类。照样面临枚举无法穷尽的问题。对搜索意图进行分类,可以匹配更准的信息源和更好的回复提示词。比如搜索“笔记本电脑”,如果能提取出一个“shopping”意图,就可以挂载亚马逊/淘宝/京东等电商平台的信息源进行更小范围内的搜索,召回的信息会更加精准。同时也可以加载跟此类搜索意图匹配的提示词模板,来控制搜索后的大模型回答内容。意图分类是搜索前一个非常关键的步骤,可以很大程度提升检索召回率,通过不同的提示词模板总结输出,保证了搜索结果的个性化。目前主流的实现方案,主要是通过提示词,请求大模型完成识别。不管是成熟的大模型,还是微调的小模型,准确度都不够高。大模型提供的Function Calling能力也可以理解为一种意图识别。1.问题改写Query Rewrite

Others are asking
怎么让AI识别对话,并生成结构化数据存储到我的软件系统里
要让 AI 识别对话并生成结构化数据存储到软件系统里,可以参考以下方法: 1. 基于结构化数据来 RAG:如果原始数据本身就是结构化、标签化的,不必将这部分数据做向量化。结构化数据的特点是特征和属性明确,可用有限标签集描述,能用标准查询语言检索。以餐饮生活助手为例,流程包括用户提问、LLM 提取核心信息并形成标准查询、查询结构化数据、LLM 整合回复。 2. 利用 Coze 平台设计 AI 机器人:创建好 Bot 后,从“个人空间”入口找到机器人,进行“编排”设计。Coze 平台常用的概念和功能包括提示词(设定 Bot 身份和目标)、插件(通过 API 连接集成服务)、工作流(设计多步骤任务)、触发器(创建定时任务)、记忆库(保留对话细节,支持外部知识库)、变量(保存用户个人信息)、数据库(存储和管理结构化数据)、长期记忆(总结聊天对话内容)。设计 Bot 时要先确定目的,比如“AI 前线”Bot 的目的是作为 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,并提供高效站内信息检索服务。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问也可查阅该指南。
2025-02-18
自动语音识别加字幕
以下是关于自动语音识别加字幕的相关内容: 制作 AI 数字人视频添加字幕的方法: 在显示区域,拖动背景图的角将其放大到适合尺寸,如覆盖视频窗口,并将数字人拖动到合适位置。点击文本 智能字幕 识别字幕,然后点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,可点击右上角“导出”按钮导出视频备用。 文旅片添加字幕的方法: 选择朗诵男生或清爽男生的音色进行朗读,点击开始朗读自动生成音频。鼠标右键点击当前音轨,找到识别字幕/歌词,耐心等待生成对应文本字幕。操作复杂的部分可观看录制的视频。若剪映的识别字幕功能需要 VIP,可准备好字幕文件,点击本地字幕并导入文件。 视频自动字幕工具推荐: 1. Reccloud:免费的在线 AI 字幕生成工具,可上传视频精准识别,能翻译字幕并生成双语字幕,处理过 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,可自定义字幕样式。 3. Arctime:能对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台及 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 您可根据自身需求选择适合的工具。
2025-02-14
通过图片,识别其中的内容,然后生成可以编辑的PPT文件,使用什么AI工具可以完成?
以下是一些可以通过图片识别其中内容并生成可编辑 PPT 文件的 AI 工具: 1. 增强版 Bot:这是一个基于 AI 驱动的智能创作平台,能够实现一站式内容生成,包括图片、PPT、PDF 等。您可以在对话框输入诉求,如“帮我生成一篇包含以上架构风格的完整 PPT”,它会为您生成幻灯片内容和相关模板选择。 2. Gamma:在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片,还支持嵌入多媒体格式,如 GIF 和视频。网址:https://gamma.app/ 3. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素。网址:https://www.xdesign.com/ppt/ 4. Mindshow:AI 驱动的 PPT 辅助工具,提供一系列的智能设计功能,如自动布局、图像选择和文本优化等。网址:https://www.mindshow.fun/ 5. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 6. GPT4、WPS AI 和 chatPPT:卓 sir 在完成 PPT 作业时使用的三个 AI 工具。
2025-02-08
一、学习内容 1. AI工具的操作:了解并掌握至少一种AI工具的基本操作,如智能代码、流程管理、智能报表、数据分析、图像识别、文字生成等。 2. AI工具在本职工作的应用:思考并提出AI工具如何帮助你更高效地完成本职工作,包括但不限于提高工作效率、优化工作流程、节约成本、提升交付质量等。 3. AI工具在非本职工作的潜力推演:探索AI工具如何在你的非本职工作领域发挥作用,比如在公司管理、团队领导、跨部门合作、团队发展以及市场研究等方面。提出这些工具如何被有效利用,以及它们可能带来的改
以下是关于学习 AI 的相关内容: 一、AI 工具的操作 要了解并掌握至少一种 AI 工具的基本操作,如智能代码、流程管理、智能报表、数据分析、图像识别、文字生成等。 二、AI 工具在本职工作的应用 思考并提出 AI 工具如何帮助更高效地完成本职工作,包括但不限于提高工作效率、优化工作流程、节约成本、提升交付质量等。 三、AI 工具在非本职工作的潜力推演 探索 AI 工具在非本职工作领域,如公司管理、团队领导、跨部门合作、团队发展以及市场研究等方面的作用,思考如何有效利用这些工具以及它们可能带来的改变。 四、学习路径 1. 对于不会代码的学习者: 20 分钟上手 Python+AI,在 AI 的帮助下可以完成很多基础的编程工作。若想深入,需体系化了解编程及 AI,至少熟悉 Python 基础,包括基本语法(如变量命名、缩进等)、数据类型(如字符串、整数、浮点数、列表、元组、字典等)、控制流(如条件语句、循环语句)、函数(定义和调用函数、参数和返回值、作用域和命名空间)、模块和包(导入模块、使用包)、面向对象编程(类和对象、属性和方法、继承和多态)、异常处理(理解异常、异常处理)、文件操作(文件读写、文件与路径操作)。 2. 新手学习 AI: 了解 AI 基本概念,建议阅读「」部分,熟悉术语和基础概念,浏览入门文章。 开始 AI 学习之旅,在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获证书。 选择感兴趣的模块深入学习,掌握提示词技巧。 实践和尝试,理论学习后通过实践巩固知识,在知识库分享实践作品和文章。 体验 AI 产品,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式。 五、工具推荐 1. Kimi 智能助手:ChatGPT 的国产平替,上手体验好,适合新手入门学习和体验 AI。不用科学网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解做得好,能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。 PC 端: 移动端(Android/ios): 2. 飞书:汇集各类 AI 优质知识库、AI 工具使用实践的效率工具,助力人人成为效率高手。
2025-02-07
我想要搭建一个可以视频和图片识别宠物猫品种和品相的智能体
以下是为您提供的关于搭建可以视频和图片识别宠物猫品种和品相的智能体的相关信息: 目前有一种技术叫 PixelLLM,它是由 Google 开发的新型视觉语言模型。其完善后在弱视(眼疾)用户方面会有较好的应用场景。这个模型不仅能够对图片进行详细描述,还能精确指出图片中每个词汇对应的具体位置。例如,若图片中有一只猫和一只狗,PixelLLM 不仅能识别出“猫”和“狗”,还能指出它们在图片中的具体位置。这种能力使得模型在处理需要图像和文字紧密结合的任务时表现出色,比如在一张图片中找到特定的物体或区域,并对其进行描述。 主要特点包括: 1. 像素级词汇对齐:不仅能告知图片里有什么,还能准确指出这些东西在图片的具体位置。 2. 多种功能:具备多种处理图像和文字结合任务的能力。 您可以考虑基于类似的技术来搭建您所需的智能体。
2025-02-06
假设你是经验丰富的AI工程师,现在需要搭建能够自行识别电商直播平台中客户提出的问题并给出不死板且AI痕迹弱的回答,同时直播的主播是我们虚拟的数字人,请问需要怎么做,请给出具体步骤
以下是搭建能够自行识别电商直播平台中客户提出的问题并给出自然回答,且直播主播为虚拟数字人的具体步骤: 1. 选择数字人工具软件: 考虑实时驱动和非实时驱动两类。实时驱动能在直播时更改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,但效果差,类似放视频的伪直播,市场价格混乱。 2. 确定数字人运营服务模式: 按直播间成交额抽佣。 3. 明确适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;适用于虚拟商品,如门票、优惠券等;店播效果较好,数据能保持跟真人一样;不适用于促销场景和服装品类。 4. 了解 AI 直播的壁垒和未来市场格局: 目前有技术门槛,如更真实的对口型、更低的响应延迟等,但长期看技术上无壁垒。 市场不会一家独大,可能 4 5 家一线效果公司,大多为二三线效果公司。 能把客户服务好、规模化扩张的公司更有价值,疯狂扩代理割韭菜的公司售后问题多。 有资源、有业务的大平台下场可能带来降维打击,如剪映若不仅提供数字人,还提供货品供应链、数据复盘分析等全环节服务,会对其他公司形成竞争压力。
2025-02-06
有生成示意图的好工具么?
以下是一些生成示意图的好工具: 1. Creately: 简介:在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制流程图、组织图、思维导图等。 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能,适合团队使用。 官网:https://creately.com/ 2. Whimsical: 简介:专注于用户体验和快速绘图的工具,适合创建线框图、流程图、思维导图等。 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能,适合团队工作。 官网:https://whimsical.com/ 3. Miro: 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等。 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具(如 Jira、Trello)集成。 官网:https://miro.com/ 4. Lucidchart: 简介:强大的在线图表制作工具,集成了 AI 功能,可以自动化绘制流程图、思维导图、网络拓扑图等多种示意图。 功能:拖放界面,易于使用;支持团队协作和实时编辑;丰富的模板库和自动布局功能。 官网:https://www.lucidchart.com/ 5. Microsoft Visio: 简介:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可以帮助自动化布局和优化图表设计。 功能:集成 Office 365,方便与其他 Office 应用程序协同工作;丰富的图表类型和模板;支持自动化和数据驱动的图表更新。 官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 6. Diagrams.net: 简介:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。 功能:支持本地和云存储(如 Google Drive、Dropbox);多种图形和模板,易于创建和分享图表;可与多种第三方工具集成。 官网:https://www.diagrams.net/ 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求,添加并编辑图形和文字。利用 AI 自动布局功能优化图表布局。 5. 协作和分享:如果需要团队协作,可以邀请团队成员一起编辑。完成后导出并分享图表。 示例:假设需要创建一个项目管理流程图,可以按照以下步骤使用 Lucidchart: 1. 注册并登录:https://www.lucidchart.com/ 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-12
举例说明,意图和FAQ训练的区别
意图和 FAQ 训练是两种不同的概念。 意图训练主要侧重于理解用户的核心意图或目的。例如,在一个客服场景中,用户的意图可能是查询产品信息、寻求技术支持或进行投诉等。通过对大量的用户交互数据进行分析和学习,模型能够识别出这些不同的意图类别。 FAQ 训练则侧重于常见问题及其对应的标准答案。比如常见的“产品如何退换货”“售后服务的联系方式是什么”等问题,以及相应的准确回答。 总的来说,意图训练更注重对用户目的的分类和理解,而 FAQ 训练更侧重于对特定常见问题的准确回答。
2025-01-13
意图和FAQ最明显的区别是什么
意图和 FAQ 最明显的区别在于:意图通常指的是用户行为背后的目的或期望,它更侧重于理解用户的深层需求和动机。而 FAQ(常见问题解答)则是预先准备好的一系列常见问题及其对应的标准答案,主要用于快速回答用户可能提出的一般性问题。 总的来说,意图关注的是挖掘用户潜在的想法和目标,FAQ 则是针对常见问题提供现成的解答。
2025-01-13
意图识别
意图识别是根据输入的内容决定后续环节的一种方式,类似于 if/else 。从输出看,其 reason 通常为英文。它可以被理解为简化版的大语言模型节点,为更精准识别,可优化选项,若不行可换大语言模型节点。 在自然语言处理领域,意图识别虽已被广泛讨论,但随着大型模型兴起,尤其在用作智能体的 Brain 模块时,承担了主要工作任务。其本质是对用户输入指令的分类任务,在单一或多智能体系统中都至关重要。通过如 Siri、小爱同学等常见智能助手的例子可更直观理解。大型模型执行意图识别任务主要基于大量数据训练得到的模型,可通过微调适应特定领域需求。 在 AI 搜索中,意图识别的关键作用是对用户提问进行分类,如分为导航类、信息查询类、交易类、本地信息类等,还包括多级子分类,但面临枚举无法穷尽的问题。对搜索意图分类可匹配更准的信息源和更好的回复提示词,很大程度提升检索召回率,保证搜索结果个性化。目前主流实现方案主要通过提示词请求大模型完成识别,但准确度不够高,大模型的 Function Calling 能力也可理解为一种意图识别。
2024-12-25
你如何使语音助手掌握情感意图
要使语音助手掌握情感意图,可以从以下几个方面考虑: 1. 明确“情绪识别系统”的概念:根据欧洲议会和欧盟理事会的规定,“情绪识别系统”是指根据自然人的生物数据识别或推断其情绪或意图的人工智能系统,例如快乐、悲伤、愤怒等,但不包括身体状态如疼痛或疲劳,也不包括仅仅检测容易察觉的表情、手势或动作,除非用于识别或推断情绪。 2. 借鉴相关研究和观点:如 AI 教父 Hinton 探讨的如果助手具有自我反省的能力,可能会有感觉,以及他提出的新的感觉模型。 3. 理解情感的重要性:情感对人类具有生存、沟通、决策、动机和维系等功能。比如,人类会因适应环境做出有利生存的生理反应,不同情感表达会使相同文字语言内涵不同,大脑决策依赖情感,情感能激发和维持个体行为,也是人类社会化维系的纽带。 4. 以情感计算为目标:情感计算旨在使计算机能够识别、感知、推断和理解人类的情感,最终赋予计算机类似人的情感能力。 总之,使语音助手掌握情感意图需要综合多方面的知识和技术,不断探索和创新。
2024-11-11
意图识别
以下是关于意图识别的全面介绍: 意图识别在自然语言处理领域是常见话题,随着大型模型兴起,其在智能体的 Brain 模块中承担主要工作。 意图识别的定义:当用户输入指令,通过感知模块传递到 Brain 模块,Brain 模块对其做出反应,本质上是一种分类任务,区分用户具体意图,在单一或多智能体系统中都至关重要。 通过常见智能助手如 Siri、小爱同学的例子可更直观理解。 在 AI 搜索中,意图识别的关键作用包括对用户提问进行分类,如导航类(如搜索“ThinkAny”为打开官网)、信息查询类(如搜索“什么是 AI 搜索引擎”为了解行业)、交易类(如搜索“笔记本电脑”为购买)、本地信息类(如搜索“附近的烤肉店”为找附近餐馆)等,还存在其他分类和多级子分类,但面临枚举无法穷尽的问题。 对搜索意图分类可匹配更准的信息源和更好的回复提示词,提升检索召回率,保证搜索结果个性化。目前主流实现方案主要通过提示词请求大模型完成识别,但准确度不够高,大模型的 Function Calling 能力也可理解为一种意图识别。 在提示词中使用意图分类的理论依据是人工智能的意图识别理论,其核心观点包括通过自然语言处理技术从用户查询中识别目的或需求,考虑上下文理解以更全面理解意图,将识别出的意图分类并与预定义指令或操作匹配执行相应任务。具体步骤包括定义意图类别、分析用户输入、进行意图分类和执行相应操作。
2024-11-07
提示词如何写
写提示词(prompt)是一个关键步骤,决定了 AI 模型如何理解并生成文本。以下是一些编写提示词的要点和方法: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有格式或风格要求,在提示词中明确指出。 5. 使用示例:提供期望结果的示例,帮助 AI 理解需求。 6. 保持简洁:简洁明了,避免过多信息导致模型困惑。 7. 使用关键词和标签:有助于模型理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整提示词,可能需多次迭代。 在文生图方面,例如在 SD 中,括号和特定符号(如:1.2)可用来增加权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时,还可增加反向提示词告知 AI 不要的内容。 对于星流一站式 AI 设计工具: 提示词用于描绘画面,输入语言支持中英文,不同基础模型对输入形式有要求。 写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 可调整负面提示词,帮助 AI 理解不想生成的内容。 利用“加权重”功能让 AI 明白重点内容,还能对已有提示词权重进行编辑。 有翻译、删除所有提示词、会员加速等辅助功能。
2025-02-20
DeepSeek提示词
以下是关于 DeepSeek 提示词的相关内容: 生成小红书爆款单词视频: 开始:输入单词主题、图片风格、单词数量。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,为用户输出指定数量的单词,并以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 Deepseek 时代提示词之关键诉求: 观察发现完整的提示词可能不如片段有效,甚至干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染,在多轮对话中,用户只需在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。新旧提示法对比,传统方法像唠叨家长,新型技巧像对聪明助理打暗号。 集合·DeepSeek 提示词方法论: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重、符号强调敏感)。 基础指令框架:如果不知道如何表达,可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-02-20
有什么提示词教程
以下是一些提示词相关的教程和资源: 提示词模板相关网站: 操作指南和提示词教程示例: prompt:甄嬛眉庄跨屏拥抱、小猫张大嘴,脸上是困惑表情,很多问号、图中的小猫带上了眼镜,叫了一声、图中的小人眨眨眼睛,旁边的爱心在动,画风保持原图一致、女子的泪从脸上流下来,眼神中是震撼、不解与绝望、图中的蜡笔小新眨眨眼睛,表情小委屈,旁边的星星在转动、画中鸡踩着滑板飞快的滑行着等。 视频:等。 小七姐的提示词教程:
2025-02-20
画ICON的提示词
以下是一些画 ICON 的提示词相关内容: 视角:LowAngle(仰视) 介质:abstract expressionist art style(抽象表现主义艺术风格) 镜头:superresolution microscopy(超分辨率显微镜) 灯光:ambient lighting(环境照明) 颜色:white(白色的) 描述:classical realism(古典现实主义) 艺术家:抽象主义 1940 1950 电影:2001 A Space Odyssey(2001 太空漫游)、The Prestige(威望) 游戏:Age of Empires(帝国时代)、Gears of War(战争机器) 其他相关词汇:icon(图标)、decorative papercraft(装饰纸艺)、camouflage(伪装)、Gian Lorenzo Bernini(吉安·洛伦佐·贝尔尼尼)、Jurassic Park(侏罗纪公园)、Rust(锈)、lightpurple(浅紫色)、gradient color(渐变色)、torch light(手电筒灯) 此外,DALL·E 自动优化提示词中提到: 绘画:提及绘画种类、画布纹理和笔触形状/纹理(列表) 数字:注明使用的软件、阴影技术和多媒体方法(列表) 生成图像基于详细提示词使用 DALL E 3。 总是通过大胆和有趣的选择使每个提示元素生动起来。 始终遵循提示指南 建议四个全新的想法。 这些应该是简单的概念,不是完整的提示词。 尝试从给出的最后一个建议中获取灵感,而不是完整的提示词。 默认设置(除非另有指定/暗示): 默认纵横比:使用正方形纵横比(1:1)。 默认风格:照片。包括相机设置、摄影类型和设备。 总是生成四张图像并建议四个新想法。 重要:避免违反服务条款的单词或概念。不侵犯任何人的版权;在提示词中不使用暗示性或明确的图像。不强调或暗示任何不符合 G 级的元素。
2025-02-19
提示词框架是什么意思
提示词框架是为构建有效提示词提供的一种高度概括和结构化的方法,可看作是构建提示词的方法论或“元结构”。 目前,提示词工程师已发展出多种提示词框架,例如: ICIP 框架:包括指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填)四个部分。 BROKE 框架:着重于背景(Background)、角色定义(Role)、目标设定(Objectives)、关键成果展示(Key Result)以及持续的试验与优化(Evolve)五个方面。 CRISPE 框架:分为上下文(Context)、角色(Role)、说明(Instruction)、主题(Subject)、预设(Preset)和例外(Exception)六个部分。 此外,还有一些标识符和属性词用于标识标题、变量、控制内容层级和标识语义结构。结构化提示词框架在行业内应用广泛且成熟度较高,您可以在很多平台看到优秀的案例。如果您对结构化提示词的理论感兴趣,还可以阅读李继刚和云中江树的相关详细理论原文。
2025-02-19
帮助产品经理根据产品原型截图写产品需求文档的AI工具和提示词有哪些
以下是一些帮助产品经理根据产品原型截图写产品需求文档的 AI 工具和提示词: AI 工具: 1. 产品管理工具:如 Aha!、ProductPlan 等,帮助管理整个产品生命周期。 2. 协作工具:如 Google Docs、Microsoft Office 365,支持团队协作和文档共享。 3. 项目管理软件:如 JIRA、Trello,用于任务分配和进度跟踪。 4. 市场研究工具:如 Google Trends、SEMrush,分析市场趋势和用户行为。 5. 用户调研工具:如 SurveyMonkey、Typeform,收集用户反馈和需求。 6. 数据分析工具:如 Tableau、Power BI,对市场数据进行可视化分析。 7. 思维导图软件:如 MindMeister、XMind,帮助组织思路和概念。 8. 流程图软件:如 Lucidchart、Visio,绘制产品功能和流程图。 提示词: 1. 行业洞察分析:对行业现状、趋势和未来发展方向进行深入研究和预测。 2. 方法论专家:精通各类管理和研发方法论,能根据具体情况选择和应用最佳方法。 3. 头脑风暴:团队成员自由提出各种想法和见解,快速产出创意解决方案。 4. 需求文档设计:根据产品特性和用户需求,设计产品需求文档。 5. 功能价值分析:评估产品各项功能的重要性和价值,辅助优化资源配置。 6. 竞品分析报告:对竞争对手的产品进行全面的分析比较,找出优劣势。 7. 流程图/图表设计:直观地呈现业务流程、组织结构或统计数据。 8. 思维导图设计:以树状图形式展示思路和知识框架。 9. 解决方案专家:根据问题分析,提供切实可行的解决方案。 10. 周报生成器:自动化生成工作周报,提高工作效率。 学习 Prompt 提示词可以参考这份文档:https://www.promptingguide.ai/zh 。 在写提示词时,要注意以下几点: 1. 提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 2. 调整负面提示词,帮助 AI 理解不想生成的内容,比如:不好的质量、低像素、模糊、水印。 3. 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,更优先。 4. 对于星流一站式 AI 设计工具,其提示词用于描绘画面,支持中英文输入,启用提示词优化后能更生动地描述画面内容,小白用户可以点击提示词上方官方预设词组进行生图。 使用这些提示词和工具,可以帮助产品经理更高效地撰写产品需求文档,确保文档全面覆盖了市场和产品的关键方面。同时,它们也有助于提高团队之间的沟通效率和文档的可管理性。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-19
实现基于个人聊天记录的数字分身的最佳实践
实现基于个人聊天记录的数字分身的最佳实践包括以下方面: 虚拟数字人的类型和驱动方式: 虚拟数字人通过各种技术创造,具有外观、行为和思想等人类特征,呈现为虚拟形象。 从驱动层面可分为中之人驱动和 AI 驱动两类。中之人驱动运用动作捕捉和面部捕捉技术实现交互,有上限且缺乏高并发和量产化能力;AI 驱动使用 AI 技术创建、驱动和生成内容,赋予感知和表达等交互能力。 虚拟数字人的应用类型: 服务型:如虚拟主播、助手、教师、客服和医生等,为物理世界提供服务。 表演型:如虚拟偶像,用于娱乐、影视等场景。 身份型:是物理世界“真人”进入虚拟世界的数字分身,在元宇宙中有广泛应用场景。 相关开源项目: 熊猫大侠基于 COW 框架的 ChatBot 最新版本支持多端部署、基础对话、语音识别、图片生成、丰富插件、Tool 工具和知识库等功能。可接入个人微信、微信公众号、企业微信应用,支持多种模型和个性化插件扩展,通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用。项目地址包括 Github:https://github.com/zhayujie/chatgptonwechat ,Gitee:https://gitee.com/zhayujie/chatgptonwechat 。
2025-02-20
模型微调是怎么实现的
模型微调是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练的模型,已学会一些基本模式和结构,然后在特定任务数据上继续训练以适应新任务。 以下是关于模型微调的具体实现步骤: 1. 准备和上传训练数据。 2. 训练新的微调模型: LoRA 微调: 脚本见:。 具体实现代码见。 单机多卡的微调可通过修改脚本中的include localhost:0 来实现。 全量参数微调: 脚本见:。 具体实现代码见。 3. 加载微调模型: LoRA 微调:基于 LoRA 微调的模型参数见基于 Llama2 的中文微调模型,LoRA 参数需和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数。 全量参数微调:调用方式同模型调用代码示例,只需修改其中的模型名称或保存路径。 微调的优点包括: 1. 比即时设计更高质量的结果。 2. 能够训练比提示中更多的例子。 3. 由于更短的提示而节省了 Token。 4. 更低的延迟请求。 微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。 以下是两个帮助理解微调概念的例子: 1. 情感分类:先使用大量语料库预训练模型,使其学会基本语法和单词语义,再收集标注过的电影评论(积极或消极)继续训练模型,使其学会判断评论情感。 2. 图像分类:先使用大量图片(如 ImageNet 数据集)预训练模型,使其学会识别图片中的基本形状和纹理,再收集标注过的猫和狗的图片继续训练模型,使其学会区分猫和狗。
2025-02-19
在coze上实现notebookllm
以下是关于在 Coze 上实现 NotebookLLM 的相关信息: LLM 作为知识问答工具有缺陷,如无法实时获取最新信息、存在“幻觉”问题、无法给出准确引用来源等。搜索引擎虽体验不够简便直接,但加上 LLM 可能带来更优信息检索体验。 在生成标题、导语、大纲时,因为涉及文本理解与创作,这是 LLM 节点的工作,需要对其进行配置。为减少 token 消耗和节省模型调度费用,在满足预期情况下,应尽量减少大模型处理环节。经过实测,豆包·function call 32k 模型能在一轮对话中稳定生成相关内容。每个大模型节点配置项丰富,入门用户主要关注一些方面,如在“标题、导语、大纲”节点中,希望 LLM 接收原文信息后一次性生成所需内容,还需视实际情况调大模型的最大回复长度,并设计填入用户提示词。
2025-02-19
RAG和微调是什么,分别详细讲讲一下它是怎么实现的
RAG(RetrievalAugmented Generation,检索增强生成)是解决大语言模型在实际应用中存在的一些问题的有效方案。 大语言模型存在以下问题: 1. 知识的局限性:模型自身的知识完全源于训练数据,对于实时性、非公开或离线的数据无法获取。 2. 幻觉问题:基于数学概率的文字预测导致可能提供虚假、过时或通用的信息。 3. 数据安全性:企业担心私域数据上传第三方平台训练导致泄露。 RAG 可以让大语言模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制生成的文本输出,用户也能深入了解模型如何生成最终结果。它类似于为模型提供教科书,适用于回答特定询问或解决特定信息检索任务,但不适合教模型理解广泛领域或学习新的语言、格式或样式。 微调类似于让学生通过广泛学习内化知识。这种方法在模型需要复制特定结构、样式或格式时非常有用。微调可以提高非微调模型的性能,使交互更有效率,特别适合强调基础模型中的现有知识,修改或自定义模型的输出,并向模型提供复杂的指令。然而,微调不适合合并模型中的新知识或需要新用例的快速迭代。 参考资料:《RetrievalAugmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf)
2025-02-19
哪一款AI 可以实现参考一张柱状图,使用我提供的数据,生成同样的柱状图
以下两款 AI 可以实现参考一张柱状图,使用您提供的数据生成同样的柱状图: 1. PandasAI:这是让 Pandas DataFrame“学会说人话”的工具,在 GitHub 已收获 5.4k+星。它并非 Pandas 的替代品,而是将 Pandas 转换为“聊天机器人”,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。例如,输入“pandas_ai.run”,即可生成相关柱状图。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:这是一款自动进行数据清理并可视化执行过程的数据分析工具,能帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/
2025-02-18
数字员工如何实现?
数字员工的实现方式主要包括以下步骤: 1. 声音克隆:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits(GPTSoVITS 实现声音克隆)克隆声音,做出文案的音频。 2. 视频整合:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址为 https://github.com/Rudrabha/Wav2Lip 。产品可参考 https://synclabs.so/ 。 从学习路径的角度来看,结合“一人公司”的愿景,需要大量的智能体(数字员工)替我们打工。未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。数字员工(agent)=学历(大模型)+察言观色(观察)+逻辑思维(推理)+执行(SOP)。创造者的学习也依照这个方向,用大语言模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。 Agent 工程(基础版)如同传统的软件工程学,有一个迭代的范式: 1. 梳理流程:梳理工作流程 SOP,并拆解成多个单一「任务」和多个「任务执行流程」。 2. 「任务」工具化:自动化每一个「任务」,形成一系列的小工具,让机器能完成每一个单一任务。 3. 建立规划:串联工具,基于 agent 框架让 bot 来规划「任务执行流程」。 4. 迭代优化:不停迭代优化「任务」工具和「任务执行流程」规划,造就能应对实际场景的 Agent。 在摊位信息方面,有摊位主题为“AI 数字员工”的展示,内容为为企业和个人提供数字劳动力,解决重复性、创意性工作难题。体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。
2025-02-17