以下是关于知识库的相关信息:
[title]创建并使用知识库扣子的知识库功能提供了简单易用的方式来存储和管理外部数据,让你的Bot可以与指定的数据进行交互。将数据上传到知识库后,扣子会自动将你的文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。知识库由大到小可分为:知识库:一整套领域知识,是Bot加载的最小单位。单元:知识库的一部分,可上传的最小内容单位可以是一个.txt、.pdf、.csv文件或一个网页。分段:一个单元切分成多个分段,模型查询的最小单位。分段内容的完整度和准确性度会影响模型回答问题的准确性。
[title]知识表示和专家系统[heading1]专家系统符号人工智能的早期成就之一是专家系统——为充当某个有限问题领域的专家而设计的计算机系统。它们基于从一个或多个人类专家那里提取的知识库,并包含一个推理引擎,在此基础上进行推理。专家系统就像人类的推理系统一样,包含短期记忆和长期记忆。同样,在以知识为基础的系统中,我们会区分以下几个部分:问题记忆(Problem memory):包含与当前要解决的问题有关的知识,如病人的体温或血压、是否有炎症等。这种知识也被称为静态知识(static knowledge),因为它包含了快照信息,记录着我们在当前状态下对问题的了解——即所谓的问题状态(problem state)。知识库(Knowledge base):代表某个问题领域的长期知识。它是从人类专家那里人工提取的,不会因外部的咨询而改变。由于它允许我们从一个问题状态前往另一个问题状态,因此也被称为动态知识(dynamic knowledge)。推理引擎(Inference engine):协调在问题状态空间中搜索的整个过程,必要时向用户提问。它还负责找到适用于每个状态的正确规则。举例来说,下面这个专家系统是根据动物的物理特征来判断动物的:这种图称为AND-OR树,是一组产生式规则的图形表示。在从人类专家那里提取知识的早期阶段,绘制树形图非常有用。要在计算机中表示知识,使用规则更为方便:你可以注意到,规则左侧的每个条件和操作本质上都是对象-属性-值(OAV)三元组。工作记忆包含与当前要解决的问题相对应的OAV三元组。规则引擎会查找满足条件的规则,并应用这些规则,从而向工作记忆中添加另一个三元组。✅为你喜欢的主题写一个AND-OR树!
法学硕士的一个新兴应用是将其用作管理组织内基于文本(或可能基于图像或视频)知识的手段。创建结构化知识库所涉及的劳动密集性使得许多大公司难以进行大规模知识管理。然而,[一些研究](https://arxiv.org/abs/1909.01066)表明,当模型培训针对组织内特定的基于文本的知识体系进行微调时,法学硕士可以有效地管理组织的知识。法学硕士中的知识可以通过提示问题来获取。一些公司正在与领先的商业法学硕士提供商一起探索基于法学硕士的知识管理理念。例如,[摩根士丹利](https://news.microsoft.com/wp-content/uploads/prod/2022/10/KEY01-Satya-Nadella.pdf)正在与OpenAI的GPT-3合作,微调财富管理内容的培训,以便财务顾问既可以搜索公司内部的现有知识,又可以轻松地为客户创建量身定制的内容。此类系统的用户可能需要培训或帮助来创建有效的提示,并且法学硕士的知识输出在应用之前可能仍需要编辑或审查。然而,假设这些问题得到解决,法学硕士可以[重新点燃](https://www.wsj.com/articles/BL-CIOB-7428)知识管理领域的火花,并使其更有效地扩展。