Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

使用RAG要注意什么?

Answer

使用 RAG 时需要注意以下几点:

  1. 不能随意输入任何文档就期望得到准确回答。尽管 RAG 的基本概念不难理解,但有效实现 RAG 系统需要考虑多个复杂因素,如文档预处理、高效索引、相关性排序等,这些都需要专业知识和持续优化。
  2. RAG 不能完全消除 AI 的幻觉。虽然它可以显著减少幻觉,但模型仍可能在检索到的信息基础上进行不当的推理或生成错误信息,只要有大模型参与,就有可能产生幻觉。
  3. RAG 仍然消耗大模型的 Token。从流程上看,最终还是将知识库中检索的结果给到 LLM,然后由 LLM 进行重新整理输出。
  4. 从评估角度看,如果检索到的知识是无效的,会严重影响 LLM 应用的表现,因此将检索过程的精确度和召回率与整个 LLM 应用程序分开进行研究尤为重要。
  5. RAG 存在局限性,它适合打造专才,不适合打造通才,能够为模型提供新的信息、专有领域知识等,但并不适合为模型提供通用领域知识。同时,在让模型保持稳定的风格或结构输出、降低 token 消耗等方面存在不足,这两点需要使用微调技术解决。
Content generated by AI large model, please carefully verify (powered by aily)

References

胎教级教程:万字长文带你理解 RAG 全流程

RAG技术无疑是AI领域的一个重要技术,但了解其局限性和正确使用方法同样重要。这一章节,我们来聊聊大家在学习了RAG了之后常见的一些误区。[heading2]随意输入任何文档就能得到准确回答[content]这是最常见的误区,这也是我写这篇文章的一个主要原因之一。很多人在了解了RAG之后,尤其是看过很多营销号的内容之后,感觉像捡到了宝贝。这会给人一种错觉:好像随意的输入任何文档就可以得到准确的回答。上文我们已经讲了RAG的流程,主要包含:离线环节:文档解析,文档切割以及向量化写入向量数据库在线检索环节:用户问题理解、初步检索、重排序以及大模型生成上述的任何一环节而言都会影响RAG的最终质量。尽管RAG的基本概念不难理解,但有效实现RAG系统需要考虑多个复杂因素,如文档预处理、高效索引、相关性排序等。这些都需要专业知识和持续优化[heading2]RAG完全消除了AI的幻觉[content]虽然RAG可以显著减少幻觉,但并不能完全消除。模型仍可能在检索到的信息基础上进行不当的推理或生成错误信息。简单来讲:只要有大模型参与,就有可能产生幻觉[heading2]RAG不消耗大模型的Token了[content]从上面的最后大模型生成结果环节可以看出,最终还是将知识库中检索的结果给到LLM。然后由LLM进行重新整理输出,所以RAG仍然是消耗大模型的Token的请注意:RAG技术并不是简单的将知识库的内容直接检索出来给到用户,而是要经过大模型的处理,从而生成上下文更通顺的回答

3. 如何让 LLM 应用性能登峰造极

如果检索到的知识是无效的,会严重影响LLM应用的表现,因此将检索过程的精确度和召回率与整个LLM应用程序分开进行研究尤为重要。如下图所示,需要建立一个评估框架,将检索性能与整个LLM应用程序隔离开来。所以这里需要既需要从模型角度出发评估生成结果的质量,也需要从检索的角度出发,用精确度和召回率评估检索,并评估整个系统。模型角度(generation)回答真实性:模型结果真实性多高(少一些模型幻觉)回答相关度:结果和问题有多相关,不能南辕北辙检索角度(retrieval)召回率(recall):相关信息有多少包含在返回的检索内容里,越全越好准确率(precision):返回的检索内容中有用信息占比多少,越多越好RAGAS是一个用于RAG评估的知名开源库,推荐使用:[https://github.com/explodinggradients/ragas](https://github.com/explodinggradients/ragas)[heading3]RAG局限性[content]如果LLM应用面临的问题与上下文有关,那么RAG就是一个强大的工具。它使模型能够访问外部数据源,提供模型训练数据中不存在的必要上下文。这种方法可以显著提高模型的性能,尤其是在最新信息或特定领域信息至关重要的情况下。为模型提供参考文本的情况下,也能大大降低模型幻觉。需要注意的是RAG的局限性如下:适合打造专才,不适合打造通才。虽然能够为模型提供新的信息、专有领域知识等,但并不适合为模型提供通用领域知识。让模型保持稳定的风格或结构输出,降低token消耗等。也就是我们在prompt工程局限性的后两点,而这两点需要使用微调技术解决。

胎教级教程:万字长文带你理解 RAG 全流程

从用户提出问题开始:我们经历了用户问题的理解根据用户问题进行路由进行初步的检索对初步检索的结果进行重排序现在终于要到了生成结果的时候了,这个环节的流程可以简化如下:将重排序后的结果和用户的查询意图组合成上下文输入给大模型大模型通过指定的提示词生成输出结果这个环节理解起来很简单,但是同样有几个需要注意的点重排序的结果通常不会都被用作大模型的上下文,因为大模型的上下文有限制可以设置一个阈值进行截断,比如只使用前3-5个文档可以设置一个相关性分数的阈值,只取相关性分数大于某个值的文档一些先进的RAG系统会对选中的文档进行摘要或压缩,以在有限的空间内包含更多相关信息。[heading3]后置处理[heading3][content]在大模型输出结果后就是一些后置的处理了,这可能包括敏感内容检测和移除格式化输出.....这些不是本文的重点,我们就不再这里展开了至此,关于普通的RAG的原理基本就全部讲完了,非常感谢你能耐心看到这里!这里我再引用智谱清言的一张图给大家复习,看完上述流程,我理解这张图理解起来更容易

Others are asking
我想搭建个人rag知识库,实现本地化部署,可以调用本地大模型去分析知识库的内容进行解答
以下是搭建个人 rag 知识库并实现本地化部署,调用本地大模型分析知识库内容进行解答的详细步骤: 一、通过 Open WebUI 使用大模型 1. 访问相关网址,使用邮箱注册账号。 2. 登陆成功后,Open WebUI 一般有两种使用方式,包括聊天对话和 RAG 能力(让模型根据文档内容回答问题,这是构建知识库的基础之一)。 3. 如果要求不高,此时已搭建本地大模型,并通过 Web UI 实现与大模型对话。ChatGPT 访问速度快且回答效果好的原因在于其服务器配置高、训练参数多、数据更优及训练算法更好。 二、本地知识库进阶 1. 若要更灵活掌控知识库,需使用额外软件 AnythingLLM,其包含 Open WebUI 的所有能力,并额外支持选择文本嵌入模型和向量数据库。 2. 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 3. 在 AnythingLLM 中有 Workspace 的概念,可创建独有 Workspace 与其他项目数据隔离。首先创建工作空间,然后上传文档并在工作空间中进行文本嵌入,选择对话模式(包括 Chat 模式和 Query 模式),最后进行测试对话。 三、RAG 是什么 利用大模型搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前,需对 RAG 有大概了解。RAG 应用可抽象为 5 个过程: 1. 文档加载:从多种来源加载文档,LangChain 提供 100 多种不同的文档加载器,包括非结构化、结构化数据及代码等。 2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或“文档片”。 3. 存储:涉及将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。 文本加载器是将用户提供的文本加载到内存中,便于后续处理。
2025-03-25
请推荐一份学习rag的资料
以下是为您推荐的学习 RAG(RetrievalAugmented Generation,检索增强生成)的资料: 1. 《RetrievalAugmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf),该资料对 RAG 进行了较为全面的介绍和分析。 2. 关于新知识的学习,您可以参考“胎教级教程:万字长文带你理解 RAG 全流程”。其中提到可以通过 Claude 帮助了解细节概念,然后再通过 Coze 搭建 Demo 来实践学习。还不知道 Coze 是什么的同学可以看公开分享: 。 3. 了解“RAG 是什么?”:RAG 是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型提供额外的、来自外部知识源的信息。通过检索模式为大语言模型的生成提供帮助,使生成的答案更符合要求。同时,还介绍了大模型存在的缺点以及 RAG 的优点,如数据库对数据存储和更新稳定、敏捷、可解释等。 希望这些资料对您学习 RAG 有所帮助。
2025-03-25
什么是ai中的RAG
RAG 是检索增强生成(RetrievalAugmented Generation)的缩写,是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给 AI 大模型,让大模型“知道”我们的私有知识,变得越来越“懂”我们。 RAG 的核心流程是:根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。 RAG 的最常见应用场景是知识问答系统,用户提出问题,RAG 模型从大规模的文档集合中检索相关的文档,然后生成回答。 RAG 的基本流程如下: 1. 首先,给定一个用户的输入,例如一个问题或一个话题,RAG 会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录。这些文本片段称为上下文(context)。 2. 然后,RAG 会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大模型,例如 GPT。这个输入通常会包含一些提示(prompt),指导模型如何生成期望的输出,例如一个答案或一个摘要。 3. 最后,RAG 会从大模型的输出中提取或格式化所需的信息,返回给用户。
2025-03-23
RAG
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 引入 RAG 来完成这类任务,它把信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入并检索相关/支撑文档,给出来源,与原始提示词组合后送给文本生成器得到最终输出,能适应事实随时间变化的情况,让语言模型获取最新信息并生成可靠输出。 大语言模型(LLM)存在一些缺点,如无法记住所有知识尤其是长尾知识、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有以下优点:数据库对数据的存储和更新稳定,无学习风险;数据更新敏捷,可解释且不影响原有知识;降低大模型输出出错可能;便于管控用户隐私数据;降低大模型训练成本。 在 RAG 系统开发中存在 12 个主要难题,并针对每个难题有相应的解决策略。
2025-03-23
RAG技术是什么,你找到了什么文档
RAG(RetrievalAugmented Generation)即检索增强生成,是一种结合了检索和生成的技术。 其在多个基准测试中表现出色,如在 Natural Questions、WebQuestions 和 CuratedTrec 等中。用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体且多样,FEVER 事实验证使用后也有更好结果。基于检索器的方法越来越流行,常与 ChatGPT 等流行 LLM 结合使用以提高能力和事实一致性。 RAG 是一种结合检索和生成的技术,能让大语言模型在生成文本时利用额外的数据源,提高生成质量和准确性。基本流程是:先根据用户输入从数据源检索相关文本片段作为上下文,然后将用户输入和上下文拼接传递给大语言模型,最后提取或格式化大语言模型的输出给用户。 大语言模型存在一些缺点,如无法记住所有知识尤其是长尾知识、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有诸多优点,如数据库对数据的存储和更新稳定,数据更新敏捷且可解释,能降低大模型输出出错可能,便于管控用户隐私数据,还能降低大模型训练成本。
2025-03-20
RAG 开发实战
以下是关于 RAG 开发实战的详细内容: RAG 是一种结合了检索和生成的技术,能让大模型在生成文本时利用额外的数据源,提高生成质量和准确性。其基本流程为:首先,用户给出输入,如问题或话题,RAG 从数据源中检索相关文本片段(称为上下文);然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型(如 GPT),此输入通常包含提示,指导模型生成期望输出(如答案或摘要);最后,从大模型输出中提取或格式化所需信息返回给用户。 以餐饮生活助手为例进行 RAG 的 Langchain 代码实战,需完成以下步骤: 1. 定义餐饮数据源:将餐饮数据集转化为 Langchain 可识别和操作的数据源(如数据库、文件、API 等),注册到 Langchain 中,并提供统一接口和方法,方便 LLM 代理访问和查询。 2. 定义 LLM 的代理:通过 Langchain 的代理(Agent)实现,代理管理器可让开发者定义不同 LLM 代理及其功能逻辑,并提供统一接口和方法,方便用户与 LLM 代理交互。
2025-03-20
构建知识库有什么要注意的?
构建知识库时需要注意以下几点: 1. 在使用在线检索流程生成结果时: 重排序的结果通常因大模型上下文有限制而不会都被使用,可以设置阈值进行截断,如只使用前 3 5 个文档,或只取相关性分数大于某个值的文档。 一些先进的 RAG 系统会对选中的文档进行摘要或压缩,以在有限空间内包含更多相关信息。 2. 对于后置处理,可能包括敏感内容检测和移除、格式化输出等。 3. 创建智能体的知识库时: 手动清洗数据可提高准确性,如创建画小二课程的 FAQ 知识库时,飞书在线文档中每个问题和答案以分割。 对于本地文档,不能一股脑全部放进去训练,应先放入大的章节名称内容,再按固定方式细化处理。 4. 使用 Coze 搭建知识库时: 文档的分片策略会严重影响查询结果,RAG 方案存在跨分片总结和推理能力弱、文档有序性被打破、表格解析失败等问题。 希望以上内容对您有所帮助。
2025-03-25
背景:我是一名高中生,想学习AI知识,逐步从入门到精通 目标:希望在<3个月>内具备一定能力。 请结合我的背景和优势,为我设计一份学习路线: - 列出每阶段(例如每一个礼拜)的学习重点(比如编程基础、数学)。 - 为每个阶段推荐<具体资源>(书籍、在线课程、练习项目等)。 - 提供一些学习技巧或注意事项。
以下是为您设计的一份在 3 个月内从入门到具备一定能力的 AI 学习路线: 第一个月: 学习重点:了解 AI 基本概念,包括术语、主要分支及它们之间的联系;掌握编程基础,如 Python 语言。 推荐资源: 书籍:《人工智能:一种现代方法》 在线课程:Coursera 上的“人工智能入门”课程 练习项目:使用 Python 实现简单的数据分析和可视化 学习技巧和注意事项:多做笔记,理解概念,注重实践。 第二个月: 学习重点:深入学习数学基础,包括统计学、线性代数和概率论;了解算法和模型中的监督学习和无监督学习。 推荐资源: 书籍:《概率论与数理统计》《线性代数及其应用》 在线课程:edX 上的“机器学习基础”课程 练习项目:使用监督学习算法进行数据分类预测 学习技巧和注意事项:通过实际案例加深对数学知识的理解,多做练习题。 第三个月: 学习重点:掌握神经网络基础,包括网络结构和激活函数;学习模型的评估和调优。 推荐资源: 书籍:《深度学习》 在线课程:Udacity 上的“深度学习入门”课程 练习项目:构建并优化一个简单的神经网络模型 学习技巧和注意事项:积极参与在线讨论,及时解决学习中的问题。 在整个学习过程中,您还可以: 体验 AI 产品,如 ChatGPT、文心一言等,了解其工作原理和交互方式。 掌握提示词的技巧,提高与 AI 的交互效果。 参与相关的社区和论坛,分享学习经验和成果。
2025-03-21
知识库搭建注意事项
以下是关于知识库搭建的注意事项: 1. 数据清洗方式: 可选择手动清洗数据以提高准确性,避免自动清洗数据可能出现的不准确情况。 对于本地文档,要注意合理拆分内容以提高训练数据准确度,不能将所有内容一股脑放入训练。 2. 在线知识库: 点击创建知识库,可创建如画小二课程的 FAQ 知识库。 飞书在线文档中每个问题和答案以分割,可点击编辑修改和删除。 选择飞书文档,选择自定义的自定义,输入。 点击添加 Bot 并在调试区测试效果。 3. 本地文档: 对于本地 word 文件,要注意拆分内容的方法。例如,对于画小二课程,将 80 节课程分为 11 个章节,先放入大章节名称内容,再按固定方式细化章节内详细内容。 选择创建知识库自定义清洗数据。 4. 发布应用: 点击发布,确保在 Bot 商店中能够搜到,否则无法获取 API。 5. 文档格式和分片策略: 以创建外贸大师产品的帮助文档知识库为例,可选择使用 Local doucuments 方式上传 Markdown 格式文档,每个问题以开头。 文档的分片策略会严重影响查询结果,RAG 方案存在跨分片总结和推理能力弱、文档有序性被打破、表格解析失败等缺点。 此外,在信息管理和知识体系搭建中,“拎得清、看得到、想得起、用得上”是四个核心步骤: 1. 拎得清:主动选择和判断高质量、与目标相关的信息源,利用 AI 搜索引擎筛选信息,加入优质社群、订阅号等建立信息通路。 2. 看得到:确保所选信息能频繁且不经意地触达个人,通过浏览器插件、笔记工具等组织信息,使其易于检索和浏览。 3. 想得起:做好信息的索引和关联,存储时做好标记(关键词、tag)、选择合适存放位置,推荐使用 PARA 笔记法等方法组织串联信息。 4. 用得上:将积累的知识转化为实际行动和成果,在解决问题或创造价值时从知识库中调取相应信息。
2025-03-17
出图是动漫/真人有什么区别和需要注意的点?
动漫出图和真人出图有以下区别和需要注意的点: 版权和法律意识:对于知名动漫角色的使用,要特别注意版权和法律问题。 模型和文件:LORA 在提炼图片特征方面功能强大,其文件通常有几十上百兆,承载的信息量远大于 Embedding,在还原真人物品时,LORA 的细节精度更高。下载的 LORA 需放在特定文件夹,使用时要注意作者使用的大模型,通常配套使用效果最佳,同时还需加入特定触发词保证正常使用。 提示词:设置文生图提示词时,正向提示词和负向提示词的准确设定对出图效果有重要影响。 参数设置:包括迭代步数、采样方法、尺寸等参数的合理设置,会影响出图的质量和效果。
2025-03-16
trae与cursor有什么区别,用它开发微信小程序需要注意些什么?
Trae 与 Cursor 的区别主要体现在以下方面: 1. 在处理自然语言提出的非常具体的需求时,Trae 可能会在查找文件的步骤中出错,而 Cursor 在某些复杂任务中的表现可能更好。 2. Trae 中很多功能是免费的,而 Cursor 可能并非如此。 3. Trae 从底层架构开始就围绕着 AI 能力构建,比传统在 IDE 里集成 AI 的逻辑更具优势,使用起来更流畅、准确和优质。在插件式的使用方式下,用户使用 Cursor 仍需要具备一定的编程知识,而完全零编程知识也可以用 Trae 开发出应用,降低了编程门槛。 用 Trae 开发微信小程序需要注意以下几点: 1. 打开 Trae 并打开创建的文件夹,使用 Chat 模式明确需求,然后切换到 Builder 模式进行开发。 2. Trae 会在本地文件夹内生成代码,微信开发者工具从同一本地文件夹读取代码,且有实时预览功能。 3. 开发过程中若有报错需修改错误,直至在微信开发者工具内调试正常。 4. 上传时需在微信开发者工具右上角点击“上传”,在弹出的弹窗里选择“确定”,接着在弹出的选项里填写版本号和项目备注。 5. 上传完毕后,可在微信小程序后台的版本管理里查看开发版本的信息,可选择点击体验版进行线上体验或提交审核。
2025-03-10
我是一个小白,但是想学习AI相关的知识,你有什么推荐吗,我需要注意什么,有什么技术学习路线
对于想学习 AI 的小白,以下是一些推荐和需要注意的方面,以及技术学习路线: 一、基础知识 1. 了解 AI 基本概念 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 数学基础 学习线性代数、概率论、优化理论等。 3. 编程基础 掌握 Python、C++等编程语言。 二、学习路径 1. 偏向技术研究方向 机器学习基础:监督学习、无监督学习、强化学习等。 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:语言模型、文本分类、机器翻译等。 计算机视觉:图像分类、目标检测、语义分割等。 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:论文阅读、模型实现、实验设计等。 2. 偏向应用方向 机器学习基础:监督学习、无监督学习等。 深度学习框架:TensorFlow、PyTorch 等。 应用领域:自然语言处理、计算机视觉、推荐系统等。 数据处理:数据采集、清洗、特征工程等。 模型部署:模型优化、模型服务等。 行业实践:项目实战、案例分析等。 三、深入学习和实践 1. 选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 2. 实践和尝试 理论学习之后,通过实践巩固知识,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 3. 体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-08
使用coze提取包含我指定的几个关键词的小红书内容数据进行汇总及分析
以下是关于使用 Coze 提取包含指定关键词的小红书内容数据进行汇总及分析的相关内容: 首先,在“一枚扣子:Coze 应用+多维表格的高速数据分析”中提到: 1. 需求是根据博主链接获取笔记并自动写入多维表格,然后进行批量分析。 2. 完成后端准备工作后,需找到博主地址,批量读取笔记并写入多维表格的 note_url 列。 3. 打开 Coze 创建应用,可选择 PC 模式,需要几个参数如多维表格地址、数据表名、小红书博主首页地址。 4. 设计读取博主笔记列表的工作流,包括创建应用、开发工作流等步骤。工作流实际上只有读取、转换、写入三步,开始节点设置三个参数,第二步需进行数据转换,添加代码节点,最后在插件市场选择多维表格插件并配置参数。 其次,在“舆情管理大师汽车 bot 小队.pptx”中: 1. 提到采集结果实时更新、智能总结链接内容、智能打分辅助判断等功能。 2. 构建高效数据流转体系,包括数据入表、关键词库等。 3. 任意关键词的工作流都适配,只需要调整 prompt。 最后,在“一枚扣子:2.0Coze 应用+多维表格+数据分析”中: 1. 介绍了配置管理,通过用户变量保存设置用于其他工作流。 2. 编排工作流,在开始节点添加变量接收 UI 输入的配置参数。 3. 包括账号分析、关键词/赛道分析等工作流,基础工作流用于查询,同步数据工作流涉及代码节点。 综上所述,使用 Coze 提取小红书内容数据进行汇总及分析需要创建应用、配置参数、设计工作流,并结合多维表格等工具实现相关功能。
2025-03-25
使用coze提取小红书数据进行汇总及分析
以下是关于使用 Coze 提取小红书数据进行汇总及分析的相关内容: 一、使用 Coze 应用与多维表格结合 1. 准备工作 完成后端准备工作。 2. 创建应用 打开 Coze,创建应用,可选择 PC 模式。 需要几个参数:多维表格地址、多维表格对应的数据表名、小红书博主首页地址。 界面设计为三个输入框和一个按钮。 3. 开发工作流 设计读取博主笔记列表的工作流,切换到业务逻辑,新建工作流。 工作流包括读取、转换、写入三步。 开始节点设置三个参数,分别代表多维表格地址、表名称、博主首页地址。 第一步选读取作者笔记的插件,将开始节点的 auth_link 关联到 userProfileUrl。 第二步的节点需要把数据转换为符合多维表格插件接收的数据格式,添加代码转换节点并复制代码。 在插件市场搜索官方的多维表格插件,选择 add_records 并分配配置参数。 结束节点配置一个值。 二、使用 Coze 智能体(字段捷径)获取笔记+评论信息 1. 创建智能体 使用单 Agent 对话流模式。 2. 编排对话流 点击创建新的对话流并与智能体关联。 配置两个小红书插件,在获取笔记详情节点和笔记评论节点分别配置 cookie,note_link 使用开始节点的 USER_INPUT。 使用代码节点对两个插件获取的结果进行数据处理。 3. 测试 找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。 回到智能体的编排页面进行测试,确保对话流执行成功。 4. 发布 点击发布,选择多维表格,然后进行配置。 输出类型选文本,输入类型选字段选择器。 完善上架信息,填写表格,选择发布范围。 三、总结 1. 仿写分析的操作与问题处理 新增仿写表,确定字段。 执行仿写动作。 设置字段与评级。 添加智能标签。 处理数据错误。 2. AI 相关内容的分享与讲解 数据提取分析。 潜力笔记判断。 爆款笔记仿写。 3. 社区资源获取 相关文档、代码、教程放在社区,可通过 3W 点 vtwoagi.com 直达飞书知识库,关注公众号找小伙伴获取进群二维码。 4. 活动消息介绍 扣子老师的开发版与硬件结合活动,3 月 22 号或 23 号将在另一城市举办,消息后续发给大家。
2025-03-25
我是ai视频入门新手,我该如何从零学习可使用的工具组合与降低工作流程
对于 AI 视频入门新手,从零学习可用的工具组合与降低工作流程,您可以参考以下内容: 工具组合方面: Runway:在真实影像方面质感较好,战争片全景镜头处理出色,控件体验感不错,但存在爱变色、光影不稳定的问题。 SVD:在风景片测试中表现较好,其他方面一般。 Pixverse:擅长物体滑行运动。 Pika:在生成人物表情自然的画面方面表现出色,可用于局部重绘。 11labs:用于制作 AI 声音,英文效果较好,但存在声音没有情绪和情感的问题。 MJ:局部重绘功能强大。 ComfyUI:可进行高清放大和细节增强。 可灵:图生视频效果质量高且稳定,但贵且慢。 Pika 2.2 版本:在首尾帧过渡上有不错表现。 Pixverse:生成速度最快的视频生成平台。 工作流程方面: 1. 分析小说内容:使用如 ChatGPT 等 AI 工具提取关键场景、角色和情节。 2. 生成角色与场景描述:借助如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成脚本。 5. AI 声音制作:利用如 11labs 等工具将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用如剪映等视频编辑软件将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看视频,根据需要重新编辑某些场景或调整音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体的操作步骤和所需工具可能因项目需求和个人偏好有所不同。同时,AI 工具的可用性和功能可能会随时间变化,建议直接访问工具网址获取最新信息和使用指南。
2025-03-24
"如何使用Midjourney"
以下是关于如何使用 Midjourney 的详细介绍: 1. “人物参考”功能: 在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;在强度 0(`cw 0`)时,只会关注面部,适合改变服装、发型等。 2. 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 过程:上传单张或者一组(4 到 5 张)到 Midjourney 输入框里,有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+所描述的关键词。 常见问题:小白新手找不到输入框频道。解决方法是找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 3. Midjourney V6 更新角色一致性命令“cref”: 官方说明:在提示后键入`cref URL`,其中 URL 是一个角色图像的网址。可以使用`cw`来修改参考的“强度”。 用途:这个功能在使用由 Midjourney 图像制作的角色时效果最佳,不适用于真实的人物/照片。 高级功能:可以使用多个 URL 来混合信息/来自多个图像的角色。 在网页 alpha(测试最初版)上的操作:拖动或粘贴图像到想象栏,有三个图标。选择这些图标设置它是一个图像提示,一个风格参考,还是一个角色参考。按住 Shift 键选择一个选项以将图像用于多个类别。 需注意,虽然 MJ V6 还处于 alpha 测试阶段,但这个和其他功能可能会突然更改,V6 官方 beta 版本即将推出。
2025-03-24
我的行业是专门的信息安全服务商(针对网络安全、数据安全等),请帮我分析有什么AI工具是可以跟我的行业进行结合使用,我需要学习哪些内容
以下是一些与您所在的信息安全服务行业相结合的 AI 工具及您需要学习的内容: AI 工具: 1. 自然语言处理模型,如 ChatGPT、文心一言、通义千问等,可用于分析和理解大量的安全相关文本数据。 2. 图像识别模型,如 DALLE 等,有助于检测和识别网络中的异常图像或数据安全中的图像相关问题。 需要学习的内容: 1. 了解 GenAI(生成式 AI)和 AIGC 的基本概念,包括其工作原理、应用场景和潜在风险。 2. 熟悉相关法律法规,如国内的《网络安全法》《数据安全法》《个人信息保护法》以及相关管理规定,以确保在使用 AI 工具时符合法律要求。 3. 掌握 AI 工具在信息安全领域的应用方法和技巧,例如如何利用自然语言处理模型进行安全文本分析,如何防范图像识别模型可能带来的安全漏洞。 4. 研究 AI 带来的特定风险,如未经授权收集信息、提供虚假信息、侵害个人隐私等,并学习相应的防范和应对措施。 5. 关注 AI 技术在网络安全攻击方面的新趋势,如利用大型语言模型进行自动化、加速和增强网络攻击的手段,以及相应的防御策略。
2025-03-24
cursor使用教程
以下是 Cursor 的使用教程: 1. 下载 Cursor:访问 https://www.cursor.com/ 。 2. 注册账号:可以使用自己的邮箱登录,如 google、github、163、qq 邮箱,直接接受二维码登录。 3. 安装中文包插件。 4. 参考相关文章: 。 5. 在设置中进行 Rule for AI 配置。 6. 按 ctrl/cmd+i ,输入需求,例如:帮我做一个贪吃蛇游戏,在网页中玩。 清晰表达需求: 游戏界面:在矩形网格上进行,玩家控制蛇。 蛇的移动:持续移动,玩家通过按键控制方向(上、下、左、右)。 食物:随机出现,蛇吃到食物增长身体。 增长:每次吃到食物身体增加一节。 死亡条件:撞墙或撞自己。 得分:吃到食物获得分数,与食物数量成正比。 难度递增:蛇速度加快或食物出现频率降低。 游戏结束:蛇死亡时结束,显示得分。 此外,还有一些关于 Cursor 的相关信息: 中文教程网站:Cursor101,网址 https://cursor101.com/zh 。 对于制作 2048 游戏,可使用任意 AI 工具获得代码,如: Cursor:不用下载 Pycharm,通过对话获得代码,使用大语言模型 Claude3.5sonnet、GPT4o 等,指令更详细效果更好。 Deepseek(新手推荐):网址 https://www.deepseek.com/zh ,国内能访问,网页登录方便,目前完全免费。 通义灵码:在 Pytharm 中,“文件”“设置”“插件”红色框位置搜索“通义灵码”安装(目前免费)。 JetBrains 自身的助手插件:在 Pytharm 中,“文件”“设置”“插件”红色框位置搜索“Jetbrains AI assistant”安装(收费,目前有 7 天免费试用)。 无影的晓颖 AI 助手:内置在云电脑里,使用流畅,需在无影的云电脑中。
2025-03-23