Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

知识库设计

Answer

以下是关于知识库设计的相关内容:

在基于大模型+知识库的 Code Review 实践中:

  • 为什么需要知识库:大模型基座只包含互联网上的公开数据,对公司内部的框架知识和使用文档不了解。例如公司内的框架 Lynx,需要让大模型从内部文档中知道“什么是 Lynx?”“怎么写 Lynx?”,这里的“强化模式”会使用向量数据库,并将匹配的知识库片段和问题生成 Prompt,发送到 LLM 执行。
  • 怎样找到相关度高的知识:通过三个过程,即 Text Embeddings(文本向量化)、Vector Stores(向量存储)、Similarity Search(相似性搜索)。

在「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人中:

  • 确定功能范围:
    • 编写【prompt】提示词,设定 Bot 的身份和目标。
    • 创建【知识库】,整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。创建知识库路径为个人空间-知识库-创建知识库,知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。按照操作指引上传文档、分段设置、确认数据处理。小技巧是在内容中加上特殊分割符“###”以便于自动切分数据,分段标识符号选择“自定义”,内容填“###”。如果内容有误可编辑或删除。
    • 创建【工作流】,告诉 AI 机器人处理信息的流程。创建工作流路径为个人空间-工作流-创建工作流。工作流设计好后先试运行,无误后发布。如果任务和逻辑复杂,可结合“节点”工具,如调用【大模型】总结分析知识库内容、调用【数据库】存储用户输入信息、调用【代码】处理复杂逻辑等。个人建议工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很重要。
Content generated by AI large model, please carefully verify (powered by aily)

References

信鑫:基于大模型 + 知识库的 Code Review 实践

大模型基座只包含互联网上的公开数据,对公司内部的框架知识和使用文档并不了解。举个例子:公司内有个框架叫Lynx,让大模型从内部文档中知道『什么是Lynx?』、『怎么写Lynx?』一图胜千言这里的『强化模式』会使用向量数据库,并将匹配的知识库片段和问题『什么是Lynx?』生成Prompt,发送到LLM执行。[heading3]怎样找到相关度高的知识?[content]有了知识库后,怎样将我们『搜索的问题/代码』在『知识库』中找到『相关度最高的内容』?答案是通过三个过程:1.Text Embeddings(文本向量化)2.Vector Stores(向量存储)3.Similarity Search(相似性搜索)文本相似度匹配流程图,图源Langchain-Chatchat

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。[heading5]4)创建【工作流】,告诉AI机器人应该按什么流程处理信息。[content]创建工作流路径:个人空间-工作流-创建工作流“AI前线”Bot的工作流最终结果如上,本次只用到了“知识库”进行处理。工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布啦。如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等等;💡个人建议:工作流不必复杂,能实现目的即可,所以在设计Bot前“确定目的”和“确定功能范围”很重要。

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。[heading5]4)创建【工作流】,告诉AI机器人应该按什么流程处理信息。[content]创建工作流路径:个人空间-工作流-创建工作流“AI前线”Bot的工作流最终结果如上,本次只用到了“知识库”进行处理。工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布啦。如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等等;💡个人建议:工作流不必复杂,能实现目的即可,所以在设计Bot前“确定目的”和“确定功能范围”很重要。

Others are asking
对作为知识库的数据进行预处理,用哪个软件比较哈
以下是一些可用于对作为知识库的数据进行预处理的软件和方法: 1. LangchainchatGLM:对于知识库内容的组织要求较高,无需微调训练,适合有结构、界限分明的数据。可使用langchain库比对字典的关键词keys部分,找到相似度最高的相关keys对应的内容文本,送进提示词模板(prompt_template),然后送到LLM进行后处理。 2. 在检索原理方面,可通过嵌入模型(如Word2Vec、GloVe、BERT)将问题文本转化为向量,用于后续检索。例如,在商业化问答场景中,会对接收的问题进行预处理和向量化。 3. 在创建知识库并上传表格数据时,可通过API获取在线API的JSON数据上传,或手动自定义创建数据表结构和数据。需注意指定语义匹配字段,在响应用户查询时,将用户查询内容与该字段内容进行比较,根据相似度进行匹配。
2025-02-17
我手里有一个文件知识库,想锻炼一个ai,按照这个文件知识库的习惯帮我改写新的文件
以下是为您整理的内容: 南瓜博士:平生第一次写小说获奖,是 AI 帮我的! 三、丰富细化 接下来要让 AI 一段一段进行细节描写。为确保文章前后一致,先让 AI 帮助写故事概要和角色背景介绍,并按自己的审美略做修改。使用了一个重要技巧,让 AI 以表格形式输出细节描述,这样有三个好处: 1. 打破 AI 原本的叙事习惯,避免出现陈词滥调。 2. 按编号做局部调整容易,指哪改哪,其他内容能稳定不变。 3. 确保内容都是具体细节,避免整段输出时因缩减而丢光细节只剩笼统介绍。 四、串联成文 把上一步生成的五个表格依次复制粘贴,AI 就照着写文章了,偶尔需要帮忙给点建议。 五、失败的局部修改 小说大赛要求最后的作品必须是 AI 直接吐出来的,不能有任何改动且不能超过 2000 字,而自己的小说 2300+字,只好让 GPT4 做修改,一开始它表现不错,但很快暴露出记性不好的缺点。还没来得及高兴,就发现它失忆得很彻底。眼看截止时间快到了,只能求助 Claude,把文章和 GPT 生成的修改意见都给它,让它生成作品,匆匆截图提交。没想到,Claude 把关键情节改没了,如马克偷偷看艾拉、无名猫受伤的原因等。 熊猫 Jay:AI 编程 Cursor 来了,你没理由说不会写代码了 四、初体验:Cursor 的安装和使用 三、新增/修改代码、文字 选中代码,使用 Command+K 打开窗口,并输入修改要求。不选中代码打开窗口,可要求 AI 实现新功能,比如让 AI 增加一个广告位。当然,除了代码,也可选中文字进行修改,如改写、翻译等。 四、自动补全代码、注释、文字 输入代码或注释,Cursor 会自动补全代码,按 Tab 生效。除补全代码外,还能补全文字,可尝试。 五、对话窗口 Mac 使用 Shift+Command+L 打开聊天窗口,输入优化页面的需求,AI 能提供不同方案。比如倾向于使用好看的配色方案,点击 Apply,再点击 Accept 生效。要记得保存文件,Mac 的快捷键是 Command+S。这不是成品,若要做完整功能,需不停和 Cursor 对话,在案例部分会介绍完整制作过程。 六、全局搜索 还可把它当作简易的 AI 搜索工具,让它根据现有文件夹下的内容回答问题,比如问到基于文件内容,温度值设置的误区在哪里,回答准确度很高,甚至能定位到具体文件的行。
2025-02-17
给我flux的提示词结构的知识库我以他作为知识库
以下是关于 Flux 提示词结构的相关知识: 大语言模型就像一个学过无数知识、拥有无穷智慧的人,但在工作场景中,需要通过提示词来设定其角色和专注的技能,使其成为满足需求的“员工”。知识库则相当于给“员工”发放的工作手册,提供特定的信息。 提示词可以设定 Bot 的身份及其目标和技能,例如产品问答助手、新闻播报员、翻译助理等,决定 Bot 与用户的互动方式。详情可参考。 学习提示词可以分为五个维度,从高到低依次是思维框架、方法论、语句、工具和场景。但舒适的学习顺序应反过来,先从场景切入,直接了解在不同场景下提示词的使用及效果对比;然后使用提示词工具,如 Meta Prompt、Al 角色定制等;接着学习有效的提示语句,包括经典论文中的相关语句;再学习有效的方法论,将有效语句及其背后的原理整合成稳定可控的方法;最后掌握思维框架。 此外,还可以通过插件、工作流、记忆库等功能定制 AI Bot。插件可通过 API 连接集成各种平台和服务扩展 Bot 能力,详情参考。
2025-02-16
知识库RAG方案
RAG(检索增强生成)是一种在 AI 领域中用于处理知识库的方案。 大模型的训练数据有截止日期,当需要依靠不包含在大模型训练集中的数据时,RAG 是主要方法之一。 RAG 的应用可以抽象为以下 5 个过程: 1. 文档加载:从多种不同来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据以及代码等。 2. 文本分割:把文档切分为指定大小的块,称为“文档块”或“文档片”。 3. 存储:包括将切分好的文档块进行嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。 基于 Coze 的知识库问答是典型的 RAG 方案,其重要一环是文档切片。但 RAG 方案存在一些缺点,如跨分片总结和推理能力弱、文档有序性被打破、表格解析失败等。 相关的海外官方文档:https://www.coze.com/docs/zh_cn/knowledge.html ,国内官方文档:https://www.coze.cn/docs/guides/use_knowledge 。 在实际操作中,如使用外贸大师产品的帮助文档创建知识库时,要注意文档的分片策略会严重影响查询结果。
2025-02-16
你的知识库架构是怎样的,普通人如何迅速找到目标靶向,比如我想学ai绘画
以下是关于您想学习 AI 绘画的相关内容: 1. 知识库提到明天银海老师将详细讲解 AI agent,同时表示知识库内容丰富,您可挑选感兴趣的部分学习,比如较轻松的 AI 绘画等。 2. 强调 AI 绘画是视觉基础,还介绍了针对 AI 绘画学社做的关键词词库精选活动。 3. 讲述了 AI 绘画中的 stable diffusion 扩散模型的运作方式,是通过加噪和去噪,随机生成种子来形成最终图像,还提到生成式 AI 做高清放大可增加细节的原理。 您可以根据以上信息,逐步深入了解 AI 绘画的相关知识。
2025-02-15
知识库里面哪里有讲解AI在各行业应用现状的材料
以下是知识库中关于 AI 在各行业应用现状的相关材料: 在音乐创作方面,通过输入更高级的词汇与 AI 音乐对话能产生更好效果,有 AI 音乐的版块、挑战、分享会和教程,可通过王贝加入 AI 音乐社区。 在数字人语音合成方面,介绍了声音克隆技术,提到了微软、阿里等的相关成果,常用的是 JPT service。 在 config UI 的应用方面,能降低成本、提高效率,在图书出版、引流等方面有应用,岗位稀缺,社区有相关共学课程。 在零售电商行业,有《2024 生成式 AI 赋能零售电商行业解决方案白皮书》。 在招聘领域,牛客的《AI 面试实践手册(2024)》深入探讨了 AI 面试的应用现状、价值和未来发展,指出其在多个行业尤其在管培生、产品、IT 基础岗位和蓝领岗位中广泛应用。 在 PC 行业,腾讯广告 TMI 与 GfK 联合发布了《AI PC 行业趋势与潜力消费者洞察白皮书(2024 版)》。 在医疗领域,蛋壳研究院发布了《医疗人工智能走到新的十字路口》。 在新闻媒体领域,新华社研究院发布了《人工智能时代新闻媒体的责任与使命》。 在情感陪伴方面,头豹研究院发布了《AI 情感陪伴:缔造温情链接,拥抱智慧关怀新纪元》。
2025-02-15
Ai工业机械设计
以下是关于 AI 工业机械设计的相关信息: AI 绘画在工业机械设计中的应用: Midjourney 可生成包含工业机械的相关图片,如一个数据图标,蓝色渐变磨砂玻璃,磨砂玻璃建筑,白色透明科技感白色城市建筑场景,数据线链接,芯片等元素,具有高细节灰色背景与简单的线性细节,工作室照明,3d,c4d,纯白背景,8k 等特点。质感不错,可多尝试喂不同构图的图片,喂图玩法对图片影响最大的是参考图,建议多跑跑图。 AI 在航天器零部件设计中的应用: NASA 研究工程师瑞安·麦克莱兰使用商业 AI 工具设计既轻又坚固的任务硬件。AI 工具能在一小时内生成 30 或 40 个想法,设计的零件比人类设计的更强壮、更轻,且会提出人类想不到的想法,但有时也会犯人类不会犯的错误。 获取 AI 生成 CAD 图相关资料的途径: 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索。 专业书籍:查找相关专业书籍了解应用和案例。 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的课程,在 YouTube 等平台查找教程和演示视频。 技术论坛和社区:加入如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与专业人士交流学习,关注相关博客和新闻网站。 开源项目和代码库:探索 GitHub 等开源平台上的相关项目,如 OpenAI 的 GPT3、AutoGPT 等在 CAD 设计中的应用。 企业案例研究:研究如 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用。 在学习和研究 AI 生成 CAD 图时,掌握相关基础知识和技术细节很重要,通过多种途径逐步掌握其应用和实现。随着 AI 技术发展,在 CAD 设计中的应用会更广泛,为设计师和工程师提供更多辅助和支持。
2025-02-17
Ai工业设计
以下是关于 AI 工业设计的相关信息: 在小红书博主方面,有诸如 Ai HFBY 等博主从事工业设计相关内容的分享,您可以通过相应链接查看他们的作品和教程。 腾讯研究院的报告中提到,工业设计在基础模型和开源生态方面有所涉及,包括产品迭代、VR 构建的虚拟环境等。当前存在训练数据稀缺、泛化能力有限等瓶颈,未来方向包括 GANs 数据生成、迁移学习优化等。同时,在 3D 生成方面,须解决空间几何难题,材质还原方面基于几何模型的空间结构特征生成真实感材质与纹理映射,纹理生成方法多元化,核心技术不断突破,AI 赋能加速发展,应用场景持续扩展。 分众传媒携手阿里通义大模型开拓了品牌广告 AI 营销新模式,其中的 AI 创意设计包含 AI 设计、AI 生图、模板中心等能力,可通过对话方式表达设计需求,利用文生图/图生图能力解决各类营销场景素材生成需求,并提供数十万精选模板降低创意制作门槛。
2025-02-17
我是一个有23年软件系统开发和设计经验的架构师,但是对AI还没有系统化了解过,请问我该如何开始?如何在短时间内掌握AI的使用、原理以及二次开发?
以下是为您提供的在短时间内系统化学习 AI 的建议: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。我建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 如果希望继续精进,对于 AI,可以尝试了解以下内容作为基础: 1. AI 背景知识 (1)基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 (2)历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 (1)统计学基础:熟悉均值、中位数、方差等统计概念。 (2)线性代数:了解向量、矩阵等线性代数基本概念。 (3)概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 (1)监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 (2)无监督学习:熟悉聚类、降维等算法。 (3)强化学习:简介强化学习的基本概念。 4. 评估和调优 (1)性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 (2)模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 (1)网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 (2)激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,以证件照为例,Code AI 应用开发教学中,智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求扣子推出了 AI 应用,其低代码或零代码的工作流等场景做得较好。但 AI CODING 虽强,目前适用于小场景和产品的第一个版本,复杂应用可能导致需求理解错误从而使产品出错。在创建 AI 应用时,要学习操作界面、业务逻辑和用户界面,包括布局、搭建工作流、用户界面及调试发布,重点熟悉桌面网页版的用户界面。
2025-02-17
你是一名电商专家,有没有哪个AI大模型或者智能体可以完成以下功能:输入材质图片,得到经过设计后的成品衣服
目前尚未有成熟的 AI 大模型或智能体能够直接实现输入材质图片就得到经过设计后的成品衣服的功能。但在 AI 领域的不断发展中,可能会有相关的技术和模型在未来出现。
2025-02-16
你是一名电商专家,有没有哪个AI大模型或者智能体可以完成以下功能:输入衣服材质图片,得到经过设计后的材质成品衣服
目前尚未有专门的 AI 大模型或智能体能够直接实现您所描述的输入衣服材质图片就得到经过设计后的材质成品衣服的功能。但随着 AI 技术的不断发展,未来可能会出现相关的应用。
2025-02-16
室内设计在agi的软件和用法
以下是关于室内设计在 AGI 方面的软件和用法的相关信息: 软件及用法: 1. Stable Diffusion: 选用原因:DallE 缺乏室内设计能力,MidJourney 出图效果好但无法基于现实环境重绘,Stable Diffusion 出图成功率较低,但可调用 controlnet 的 MLSD 插件捕捉现实环境线条特征做二次设计。 安装:安装 Stable Diffusion WEB UI。 配置:修改 webuiuser.bat 文件加上 listen 和 API 参数,让 Stable Diffusion 处于网络服务状态。 具备室内设计能力:下载室内设计模型(checkpoint 类型)放到 stable diffusion 目录/models/stablediffusion 下面,安装 controlnet 插件,使用 MLSD 插件实现空间学习。通过 API 方式让前端连接到 Stable Diffusion 后台。 2. HDAidMaster:云端工具,在建筑设计、室内设计和景观设计领域表现惊艳,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值在线。 3. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索,输入房间面积需求和土地约束可自动生成户型图。 4. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范约束生成的设计结果。 5. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内的信息集成,实现数据汇总与管理。 使用 AI 进行室外设计的最佳实践: 1. 充分利用 AI 的创意生成能力,输入关键词生成多种创意方案,获取新颖灵感。 2. 结合 AI 的模拟和可视化功能,利用 AR/VR 技术模拟和评估设计方案。 3. 运用 AI 的分析和优化能力,对采光、动线、材料等进行优化。 4. 借助 AI 的自动化设计功能,生成符合规范的平面图、立面图等。 5. 融合 AI 与人工设计的协作模式,发挥各自优势,提升设计效率和质量。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-15