Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想知道如果我上传给Coze数据库,我的数据安全有保障吗

Answer

关于您上传数据到 Coze 数据库的数据安全保障问题,以下是相关信息:

  • 合规说明方面:
    • 不存在产出违法违规内容,包括色情暴力、政治敏感和违法犯罪等。
    • 不存在爬取行为,遵循 robot.txt 爬虫协议,未使用匿名代理。
    • 不存在版权争议问题,未爬取强版权资源、付费内容等。
    • 不存在跨境数据传输,未使用海外 API 和海外模型。
    • 有安全合规声明,作者声明作品没有侵权,作品安全可用且公开可接受。
  • Coze 数据库的功能特点:
    • 知识库功能不仅支持上传和存储外部知识内容,还提供多样化的检索能力,能解决大模型可能出现的幻觉问题和专业领域知识的不足,显著提升回复准确性。支持从多种数据源上传文本和表格数据,自动将知识内容切分成多个片段进行存储,并允许用户自定义内容分片规则,提供多种检索方式,适应各种使用场景。
    • 数据库具备记忆能力,可以存储和检索用户的交互历史,以提供更加个性化的服务。支持实时更新,确保信息最新。能存储用户的交互历史,包括提问、回答和反馈,用于理解用户需求和优化对话流程,可进行个性化服务和错误纠正与学习。

综上所述,从目前的信息来看,您上传给 Coze 数据库的数据在一定程度上是有安全保障的。但具体情况还需参考 Coze 数据库的最新政策和规定。

Content generated by AI large model, please carefully verify (powered by aily)

References

清: coze比赛作品[菜品秀秀]大揭密

|合规项|具体说明|作者回答(请回答是/否)|<br>|-|-|-|<br>|是否会产出违法违规内容?|1.色情暴力2.政治敏感3.违法犯罪是否存在爬取行为?若是,补充使用的爬虫服务3.1.是否遵循robot.txt爬虫协议3.2.是否使用了匿名代理?|[未完成]是[已完成]否|<br>|存在版权争议问题|1.涉及强版权资源,包括影视、音乐、游戏(游戏本身)、新闻的信息爬取、完整结果(新闻原文本、资源下载链接)返回2.是否爬取了付费内容?|[未完成]是[已完成]否|<br>|跨境数据传输:数据是否会跟海外交互|1.是否使用了海外API2.是否使用了海外模型,如GPT|[未完成]是[已完成]否|<br>|安全合规声明|本人声明此作品没有侵权,作品安全可用且公开可接受|[已完成]是[未完成]否|<br>|是否愿意开源|是否愿意公开配置(非强制,可以选择不公开~)|[已完成]是[未完成]否|

蓝衣剑客:四万字长文带你通学扣子

详细内容可至Coze官方手册了解:https://www.Coze.cn/docs/guides/knowledge[heading3]3.1知识库[content]Coze的知识库功能不仅支持上传和存储外部知识内容,还提供了多样化的检索能力。这一功能特别设计来解决大模型可能出现的幻觉问题和专业领域知识的不足,显著提升了大模型回复的准确性。Coze的知识库主要包括两大核心能力:一是能够存储和管理外部数据;二是增强检索能力。数据管理与存储Coze支持从多种数据源,如本地文档、在线数据、Notion、飞书文档等渠道上传文本和表格数据。上传后,系统会自动将知识内容切分成多个片段进行存储,并允许用户自定义内容分片规则,比如通过分段标识符或字符长度等方式进行内容分割。增强检索此外,Coze还提供了多种检索方式来对存储的内容片段进行高效检索,例如全文检索可以通过关键词快速找到相关的内容片段并召回。基于这些召回的内容片段,大模型将生成最终的回复内容。应用场景Coze支持上传文本内容及结构化表格数据,以适应各种使用场景。例如,在创建虚拟形象与用户交流时,你可以将相关语料保存在知识库中。后续Bot将通过向量匹配召回最相关语料,并模仿该虚拟形象的语言风格进行回答。在客服场景中,将用户常见问题和产品使用手册等信息上传至Coze知识库中,Bot可以利用这些信息精准地解答用户疑问。对于特定行业应用,如汽车领域,你可以创建包含各种车型详终参数的数据库,在用户查询特定车型信息时,Bot可通过召回相关记录进一步提供精确信息,如百公里油耗等详情。

Coze 全方位入门剖析 - 免费打造自己的 AI Agent (国内版)

扣子平台内置了强大的知识库功能,允许开发者上传和维护大量的数据,这些数据可以用于训练AI Bot,使其能够更准确地理解和回应用户的需求。同时,平台还具备数据库记忆能力,可以存储和检索用户的交互历史,以提供更加个性化的服务。[heading4]知识库功能[content]数据上传与管理:开发者可以通过平台的界面轻松上传各种形式的数据,如文本、图片、视频等,这些数据可以是FAQ文档、产品手册、行业报告等。平台提供了直观的编辑工具,使得数据的整理和分类变得简单高效。训练与优化:上传的数据被用于训练AI Bot,使其能够更好地理解用户的问题并提供准确的回答。平台的机器学习算法会分析这些数据,学习其中的模式和关联,从而提高回答的准确性和相关性。实时更新:知识库支持实时更新,确保AI Bot获取到的信息是最新的。这对于需要频繁更新信息的行业(如金融、法律等)尤为重要。[heading4]数据库功能[content]用户交互记录:平台能够存储用户的交互历史,包括用户的提问、AI Bot的回答以及用户的反馈。这些数据对于理解用户需求和优化对话流程至关重要,目前数据库的设置只能在创建AI bot的时候设置和修改,你不需要懂得数据库语法甚至是编程,只需要用自然语言告诉AI Bot做哪些数据操作即可。个性化服务:通过分析用户的交互历史,AI Bot能够提供更加个性化的服务。例如,如果用户之前询问过某个产品的信息,AI Bot在后续的对话中可以主动提供该产品的更新或相关推荐。错误纠正与学习(进阶玩法):当AI Bot在回答中出现错误时,开发者可以利用数据库中的交互记录进行错误分析,快速定位问题并进行修正。这种持续的学习过程有助于提高AI Bot的整体性能。

Others are asking
用ai做ppt会有数据安全和隐私泄露 风险吗
使用 AI 制作 PPT 可能存在一定的数据安全和隐私泄露风险。 一方面,取决于所使用的 AI 工具及其数据处理政策。如果该工具的开发者或服务提供商没有采取足够的安全措施来保护用户数据,那么数据就有可能被泄露。 另一方面,在输入数据到 AI 系统时,如果包含了敏感信息,且该信息未经过妥善处理和加密,也存在被窃取或不当使用的风险。 然而,许多正规和知名的 AI 工具通常会采取一系列措施来保障数据安全和用户隐私,例如数据加密、严格的访问控制、遵循相关法律法规等。但用户在选择使用 AI 工具制作 PPT 时,仍需仔细阅读服务条款和隐私政策,了解数据的处理和存储方式,以最大程度降低潜在的风险。
2024-09-22
如何使用coze工作流
Coze 的工作流主要具有以下特点和使用方法: 工作流是其核心,在创建相关 Bot 前需梳理清楚。例如对于类似秘塔搜索的 Bot,要明确其主要能力,如使用搜索引擎进行搜索、对搜索内容整理成答案、给出答案中的引用等,从而形成创建思路。 工作流是一种可视化的方式,允许用户组合各种功能模块,如插件、大语言模型、代码块等,实现复杂和稳定的业务流程编排。 由多个节点组成,包括 Start 节点和 End 节点,用户可在节点间添加各种功能模块构建业务流程。 支持丰富的功能模块,包括调用大语言模型进行文本生成、调用插件进行数据处理等,用户可灵活组合。 创建和编辑通过可视化拖拽界面完成,无需编写代码,降低搭建门槛。 创建好的工作流可直接集成到 Coze 的聊天机器人中使用,实现复杂业务逻辑。 具体操作步骤:首先进入 Coze,点击「个人空间工作流创建工作流」,打开创建工作流的弹窗。根据弹窗要求自定义工作流信息,点击确认完成新建。在左侧「选择节点」模块中,根据子任务需要,实际用上的有插件、大模型、代码等。按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,即可完成工作流框架的搭建。 总的来说,Coze 的工作流为用户提供了一种可视化、低代码的方式,来快速搭建满足业务需求的 AI 应用和服务,极大地降低了开发门槛,让更多人可以利用 AI 技术来提升工作效率。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-21
coze中的工作流该如何使用到bot中
以下是关于如何将 Coze 中的工作流使用到 Bot 中的相关内容: 首先,将工作流看作一个函数,其输入参数通常只有用户的提问(query),这是一个字符串。 在工作流中,会按以下步骤进行操作: 1. 设置输入参数。 2. 调用 Google 搜索插件搜索互联网上的信息,可通过设置 `num` 参数控制返回搜索结果的数量,一般设置为 7 以平衡响应速度和信息量。 3. 格式化搜索结果,利用“Code”组块插入 Python 代码,将 Google 搜索返回结果格式化成两个字符串,一个是相关信息拼接而成的字符串(retrieved_contexts),另一个是网页链接拼接而成的字符串。前者用于插入 LLM 的提示词,后者用于 Workflow 的最终输出结果。 4. 获取用户的语言偏好,使用“Variable”组块获取 Bot 内设置的变量值(如 user_language)。 对于创建 Bot 并封装工作流,步骤如下: 1. 创建 Bot。 2. 填写 Bot 介绍。 3. 切换 Bot 模式为“单 Agent(工作流模式)”,若只需每次输入英文文章时返回精读结果,可直接调用工作流。 4. 将配置好的工作流添加到 Bot 中。 5. 填写开场白引导用户使用。 6. 关闭开场白预置问题。 完成封装后,可在「预览与调试」区进行最终体验与调试。但需注意,外层 bot 可能存在一定未知 bug,同一段 USER_INPUT 在工作流编辑面板中试运行正常,但在外层 bot 运行时可能报错,原因可能是外层 bot 的并发不够稳定。
2025-01-20
怎么在coze的智能体总加入一个使用MARKDOWN编写的代码的prompt?
在 Coze 的智能体中加入使用 Markdown 编写的代码的 prompt 可以参考以下方法: 首先,了解相关的任务和目标,比如像实现输入任意文章链接后,AI 自动生成适合微信分享的文章推荐卡片。为达到这一效果,大模型对话产品通常需要完成网页爬取、内容总结、二维码生成、卡片样式生成等关键步骤。 在编写 prompt 时,可以发现新的词生卡 Prompt 组织方法,把设计要求拆分为“设计规范”和“内容结构”,再细分为“布局与尺寸”“字体规范”“颜色规范”的独立模块,并结合“内容结构”进行要求提示。这种提示词组织方式具有模型通用性、提示简易性和生成稳定性等显著优势。 对于刚入门的朋友,首推 LangGPT 结构化提示词,直观易懂,可以快速上手。对于想要进阶的用户,一方面可以继续选择 LangGPT,另一方面如有额外精力和好奇心,不妨尝试刚哥推崇的 Lisp 伪代码格式,有助于精炼提示词和提升对措辞理解、概念认知的能力。但需要注意的是,真正重要的不是提示词的外在形式,而是内容是否与 AI 的“理解机制”相契合。同时,在实际应用中,还需要经过多次调试,并根据测试 bug 微调提示词,直至稳定运行。
2025-01-19
coze的使用教程
以下是关于 Coze 的使用教程: Coze 概述: 字节的官方解释:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都能在该平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单问答到处理复杂逻辑对话,并可将 Bot 发布到各类社交平台和通讯软件上与用户互动。 个人观点:Coze 是字节针对 AI Agent 领域的初代产品,在 Coze 中称 AI Agent 为 Bot。 部署站点: 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用字节自研的云雀大模型,国内网络可正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可参考文档白嫖 ChatGPT4),访问需突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程: Bot 的开发和调试页面布局主要分为以下几个区块: 提示词和人设的区块 Bot 的技能组件 插件 工作流 Bot 的记忆组件 知识库 变量 数据库 长记忆 文件盒子 一些先进的配置 触发器:例如定时发送早报 开场白:用户和 Bot 初次对话时,Bot 的招呼话语 自动建议:每当和 Bot 一轮对话完成后,Bot 给出的问题建议 声音:和 Bot 对话时,Bot 读对话内容的音色 搭建教学: 基础框架:本 bot 基于三部分构成,包括提示词(使用结构化提示词框架,通过提示要求大模型根据不同行为调用不同工作流)、数据库(能够记录不同用户历史记账记录的关键,工作流里会用到)、工作流(增加记账调用 add_accounting_record 工作流;查询账户余额调用 query_accounting_balance 工作流;删除所有记账记录调用 init_accounting_records)。 数据库:数据库是 Coze 用来长久存放用户自己生成的数据的功能,可通过 mysql 语句写入数据到数据库中,也可从数据库中读取已存储数据用于加工或显示。本次记账功能定义了三个字段:item(记账的事项,字段类型 string)、occurrence_time(记账发生时间,字段类型 string)、account_change(变得的金额,即收入或花费的金额数,字段类型 integer,单位是分,例如 1.23 元,记录进入数据库是 123,注意一定要用 integer 类型,不能使用 number,不然当金额有小数时计算会不准)。
2025-01-18
怎么做 agent,有什么 coze做 agent 的视频教程
以下是一些关于如何做 Agent 以及相关的 Coze 视频教程: 基础教程: 大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库 (https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb) 大聪明:保姆级教程:Coze 打工你躺平 (https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb) 安仔:Coze 全方位入门剖析 免费打造自己的 AI Agent (https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb) 基础教程:Coze“图像流”抢先体验 (https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf) YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏 (https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe) 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档 (https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ) 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑
2025-01-18
coze平台中bot的沟通能力与哪些因素有关。如果希望bot有极强的沟通能力应该重点强化哪些
在 Coze 平台中,Bot 的沟通能力与以下因素有关: 1. Agent 意图:定义了 Agent 的工作任务和适用场景,明确其核心功能和角色。 2. Agent 提示词:包含系统级别的提示词,与人物设定和逻辑处理紧密相关,帮助 Agent 更好地理解和响应用户需求。 3. Agent 技能:允许 Agent 调用预设的工具、工作流和知识库,包括自身创建的工具、Coze 市场上的公开工具及相关工作流程。 如果希望 Bot 有极强的沟通能力,应重点强化以下方面: 1. 准确设置每个 Agent 的使用场景和意图,这对于控制 Agent 跳转至关重要,确保在执行不同任务时系统能准确切换。 2. 清晰指定节点切换的判断时机和参考上下文的轮数,一般建议参考五轮左右的对话内容,以确保 Bot 能根据充分的上下文信息做出恰当跳转决策。 Coze 是由字节跳动推出的 AI 聊天机器人和应用程序编辑开发平台,具有以下特点: 1. 多语言模型支持,如 GPT48K、GPT4128K 及云雀语言模型等。 2. 集成超过 60 款插件,涵盖多种功能,支持用户创建自定义插件。 3. 具备知识库功能,允许上传和管理多种格式的文档及获取在线内容和 API JSON 数据。 4. 提供数据库和记忆能力,允许 Bot 访问会话内存和上下文,持久记住重要参数或内容。 5. 支持工作流设计,用户可通过拖拉拽方式搭建复杂任务流。 6. 采用多代理模式,一个机器人中可运行多个任务,添加多个独立执行特定任务的代理。 7. 免费使用,无需支付费用。 8. 易于发布和分享,可将搭建的 Bot 发布到各类社交平台和通讯软件上。 Bot 的开发和调试页面主要分为提示词和人设区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置(如触发器、开场白、自动建议、声音)等区块。
2025-01-18
向量数据库和矢量数据库的区别
向量数据库和传统数据库(可视为您所提到的“矢量数据库”)主要有以下区别: 1. 查找方式: 传统数据库需要精确的关键词或类别进行查找,如同在普通图书馆中需知道书的具体位置或分类。 向量数据库可以通过自然语言描述所需内容,系统能理解意图并找到最相关的内容。 2. 组织方式: 传统数据库中信息被严格分类和组织,类似图书馆里的书架和编号系统。 向量数据库中信息根据内在特征和相似性自然聚集,如同魔法图书馆里书籍自动根据内容相似性浮动聚集。 3. 灵活性: 传统数据库若要更换组织方式,可能需重新安排整个架构。 向量数据库中,新加入的数据会自动找到合适位置,无需重新组织整个系统。 4. 发现新内容: 传统数据库较难偶然发现相关但之前未知的内容。 向量数据库在搜索时可能发现许多相关但之前不知道的内容,因其理解内容本质而非仅依赖标签。 此外,向量数据库以多维向量形式保存信息,代表某些特征或质量,能根据数据的向量接近度或相似度快速、精确地定位和检索数据,从而实现根据语义或上下文相关性进行搜索。而传统数据库通常以表格形式存储简单数据,搜索依赖精确匹配或设定标准。 为了在人工智能和机器学习应用中利用非结构化数据(如文本、图像和音频等),需要使用嵌入技术将其转换为数字表示,嵌入过程通常通过特殊神经网络实现,使计算机能更有效地辨别数据中的模式和关系。
2025-01-10
coze工作流中数据库如何应用?主要是返回数据
在 Coze 工作流中,数据库的应用如下: 工作流由多个节点构成,节点是基本单元。Coze 平台支持的节点类型包括数据库节点。 数据库节点的输入:用户可以定义多个输入参数。 数据库节点的输出:如果数据库是查询作用,则输出会包含查询出来的内容。通过 SQL 语句告诉数据库要执行的动作,这里的 SQL 语句可以让 AI 自动生成并进行适当改动。 注意事项:Coze 平台的逻辑是数据库与 bot 绑定,使用数据库功能时,需要在 bot 中设置相同名称和数据结构的数据库进行绑定。 测试工作流:编辑完成的工作流无法直接提交,需要进行测试。点击右上角的“test run”,设定测试参数,查看测试结果,完成后发布。 相关参考文档和示例: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本示例: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent 在【拔刀刘】自动总结公众号内容,定时推送到微信的案例中,循环体内部的数据库节点用来在数据库中查询是否已经推送过该篇文章,输入项为上一步中的 url 和开始节点的 key(重命名为 suid)。查询数据库需要文章 url 和用户的 suid 两个值来判断这名用户的这篇文章是否推送过。记得设置输出项“combined_output”。同时,Coze 平台中使用数据库功能需要在 bot 中设置相同名称和数据结构的数据库进行绑定,具体设置方法参见“相关资源”。
2025-01-08
AI智能数据库查询助手
以下是关于您提出的“AI 智能数据库查询助手”的相关信息: 能联网检索的 AI: 存在能联网检索的 AI,它们通过连接互联网实时搜索、筛选并整合所需数据,为用户提供更精准和个性化的信息。例如: ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。 Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 Bing Copilot 作为 AI 助手,旨在简化您的在线查询和浏览活动。 还有如 You.com 和 Neeva AI 等搜索引擎,提供基于人工智能的定制搜索体验,并保持用户数据的私密性。 AI 新产品|网站精选推荐: AIHelperBot 自动生成 SQL Queries,支持数据库一键链接或导入。当前收费$5 每月,可免费试用 7 天。链接:https://skybox.blockadelabs.com/ ChartGPT by CadLabs 由 CadLabs 开发工具,基于 GPT3.5,可以根据数据生成图表并回答问题。链接:https://chartgpt.cadlabs.org/ Embedding Store 功能如其名,是一站式 Embedding Marketplace,支持公开、私有及第三方数据,用于发现、评估和访问相关的嵌入(embeddings),产品还未上线。链接:https://www.embedding.store/ AI 在医疗药品零售领域的应用: AI 在医疗药品零售领域有着多方面的应用前景: 药品推荐系统:利用机器学习算法分析用户购买记录、症状描述等数据,为用户推荐合适的非处方药品和保健品,提升销售转化率。 药品库存管理:通过分析历史销售数据、天气、疫情等因素,AI 系统可以预测未来某段时间内的药品需求量,优化药店的库存管理策略,降低成本。 药品识别与查询:借助计算机视觉技术,用户可以用手机拍摄药品图像,AI 系统自动识别药名并提供说明、用法、禁忌等信息查询服务。 客户服务智能助手:基于自然语言处理技术,AI 虚拟助手可以回答顾客关于购药、用药、保健等常见问题,减轻人工客服的工作压力。 药店运营分析:AI 可以分析药店的销售、顾客流量、库存等大数据,发现潜在的运营问题和优化空间,为决策提供参考。 药品质量监控:通过机器视觉、图像识别等技术,AI 能够自动检测药品的包装、标签、颜色等是否合格,及时发现问题。 药品防伪追溯:利用区块链等技术,AI 可以实现全流程的药品溯源,确保药品供应链的安全性和真实可信度。 总之,AI 技术在药品零售领域可以提升购药体验、优化库存管理、降低运营成本、保障药品质量安全,是一个值得重视的发展方向。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-07
如何部署本地的智能数据库
以下是关于如何部署本地智能数据库的详细步骤: 1. 引言: 作者是致力于使用 AI 工具将自己打造为超级个体的程序员,目前沉浸于 AI Agent 研究。 本文将分享如何部署本地大模型以及搭建个人知识库,让您了解相关流程和技术。 2. 本地知识库进阶: 若要更灵活掌控知识库,可使用额外软件 AnythingLLM,它包含所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 AnythingLLM 中有 Workspace 的概念,可创建独有 Workspace 与其他项目数据隔离。 构建本地知识库的步骤: 首先创建一个工作空间。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,包括 Chat 模式(大模型根据训练数据和上传文档综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 完成配置后即可进行测试对话。 3. 写在最后: 作者推崇“看十遍不如实操一遍,实操十遍不如分享一遍”。 若对 AI Agent 技术感兴趣,可联系作者或加入其免费知识星球(备注 AGI 知识库)。
2024-12-02
大模型如何接入企业数据库
大模型接入企业数据库的相关内容如下: 原理介绍: 从文档处理角度来看,实现流程包括配置要求。 配置要求: ChatGLM6B 模型硬件需求: 模型文件下载至本地需要 15GB 存储空间。 量化等级不同,最低 GPU 显存(推理)和最低 GPU 显存(高效参数微调)要求不同: FP16(无量化):分别为 13GB 和 14GB。 INT8:分别为 8GB 和 9GB。 INT4:分别为 6GB 和 7GB。 MOSS 模型硬件需求: 模型文件下载至本地需要 70GB 存储空间。 量化等级不同,最低 GPU 显存(推理)和最低 GPU 显存(高效参数微调)要求不同: FP16(无量化):分别为 68GB 和 。 INT8:分别为 20GB 和 。 Embedding 模型硬件需求:默认选用的 Embedding 模型约占用显存 3GB,也可修改为在 CPU 中运行。 项目启动: Web 启动:运行 web.py,若显存不足则调整 configs/model_config.py 文件中 LLM_MODEL 参数更换模型,若连接无法连接修改 web.py 文件末尾 lauch 中 0.0.0.0 为 127.0.0.1,点击 URL 进入 UI 界面。 API 模式启动。 命令行模式启动。 上传知识库: 左侧知识库问答中选择新建知识库,可传输 txt、pdf 等。可以调整 prompt,匹配不同的知识库,让 LLM 扮演不同的角色。例如上传公司财报,充当财务分析师;上传客服聊天记录,充当智能客服;上传经典 Case,充当律师助手;上传医院百科全书,充当在线问诊医生等等,MOSS 同理。 使用数据表: 通过在工作流中添加数据库节点对数据表进行操作。在工作流中可通过 NL2SQL 方式和代码方式进行调用,支持完整读写模式。参考以下操作,在工作流中添加并配置工作流节点。在工作流中配置数据库节点前,确保已经搭建了一个 Bot,并在这个 Bot 中创建好了数据表。 1. 单击页面顶部的工作流页签,然后单击创建工作流。 2. 输入工作流名称和工作流的使用描述,然后单击确认。工作流名称和描述可以帮助大语言模型理解什么场景下需要调用该工作流。 1. 在基础节点页签下,将数据库节点拖入到工作流配置画布区域。 2. 根据以下信息配置数据库节点。 输入:添加 SQL 执行中需要的参数,可以是一个变量,也可以是一个固定值。 SQL:输入要执行的 SQL 语句,可以直接使用输入参数中的变量。可单击自动生成使用大模型生成 SQL。在弹出的页面中,选择这个数据库工作流生效的 Bot 和数据表,然后使用自然语言描述要执行的操作,单击自动生成生成 SQL 语句,最后单击使用。 注意:不支持 Select语法,不支持多表 Join 操作,最多返回 100 行数据。
2024-10-11
向量数据库
向量数据库是大语言模型从工具走向生产力实践中热门的 RAG 方式所必备的基础设施。 RAG 能够从海量文本数据中检索相关信息并生成高质量文本输出,而向量数据库在其中发挥着重要作用。 目前市面上的向量数据库众多,操作方式无统一标准。本文将基于 LangChain 提供的 VectorStore 类中的统一操作方法,以 chroma 向量数据库作为示例,从最为基础的 CRUD 入手介绍其使用方法。 向量数据库的工作原理如下: 如果是文本,会通过模型转换成向量对象,对象存入数据库中再去使用。传统数据库以表格形式存储简单数据,向量数据库处理的是复杂的向量数据,并使用独特方法进行搜索。常规数据库搜索精确匹配数据,向量数据库则使用特定相似性度量寻找最接近匹配,使用特殊的近似近邻(ANN)搜索技术,包括散列搜索和基于图的搜索等方法。 要理解向量数据库的工作原理及其与传统关系数据库(如 SQL)的不同,必须先理解嵌入的概念。非结构化数据(如文本、图像和音频)缺乏预定义格式,给传统数据库带来挑战。为在人工智能和机器学习应用中利用这些数据,需使用嵌入技术将其转换为数字表示,嵌入就像给每个项目赋予独特代码,以捕捉其含义或本质。
2024-09-02