Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

智能合规性分析

Answer

以下是关于智能合规性分析的相关内容:

在金融服务业中,生成式 AI 能带来更好的合规性,具体表现为:

  1. 高效筛查:迅速汇总个体在不同系统中的关键信息,让合规官员更快得出交易是否存在问题的答案。
  2. 更准确地预测洗钱者:根据过去 10 年的可疑活动报告训练模型,创建对洗钱者构成的定义。
  3. 更快的文档分析:分析大量文档,标记潜在问题或关注区域。
  4. 培训和教育:开发培训材料,模拟真实场景,教育合规官员。

欧洲议会和欧盟理事会规定了人工智能的统一规则,包括成员国的市场监督管理机关和委员会应能提议联合行动,促进合规、查明不合规情况等。对于建立在通用人工智能模型基础上的人工智能系统,明确了国家和联盟一级的责任和权限。

未来,拥抱生成式 AI 的合规部门有望阻止每年在全球范围内非法洗钱的巨额资金。如今,合规软件主要基于“硬编码”规则,存在诸多问题,生成式 AI 可能带来改变。

Content generated by AI large model, please carefully verify (powered by aily)

References

金融服务业将比你想象得更快地接纳生成式 AI

高效筛查:一个生成式AI模型可以迅速将任何个体在不同系统中的关键信息汇总并呈现给合规官员,使合规官员能更快地得出交易是否存在问题的答案。更准确地预测洗钱者:现在想象一个模型,它是根据过去10年的可疑活动报告(SARs)进行训练的。无需明确告诉模型洗钱者是什么,AI可以用来检测报告中的新模式,并创建其自己对洗钱者构成的定义。更快的文档分析:合规部门负责确保公司的内部政策和程序得到遵守,并且遵循监管要求。生成式AI可以分析大量的文档,如合同、报告和电子邮件,并标记需要进一步调查的潜在问题或关注区域。培训和教育:生成式AI可以用于开发培训材料,并模拟真实世界的场景,以教育合规官员关于最佳实践以及如何识别潜在风险和不合规行为。新进入者可以使用来自数十个机构的公开可用合规数据进行自我启动,并使搜索和综合变得更快、更便捷。较大的公司从多年收集的数据中受益,但他们需要设计适当的隐私功能。合规长期以来一直被视为一个由过时技术支持的不断增长的成本中心。生成式AI将改变这一点。—Angela Strange和Joe Schmidt

AI ACT 中译本.pdf

欧洲议会和欧盟理事会规定人工智能的统一规则,并修正300/2008号、167/2013号、168/2013号、2018/858号、2018/1139号和2019/214号条例以及2014/90/EU号、2016/797号和20(160)成员国的市场监督管理机关和委员会应能够提议联合行动,包括由市场监督管理机关或市场监督管理机关与委员会联合开展的联合调查,其目的是促进合规、查明不合规情况、提高认识,并针对发现在多个成员国构成严重风险的特定类别的高风险人工智能系统提供与本条例有关的指导。应根据2019/1020号条例第9条开展促进合规的联合行动。人工智能办公室应为联合调查提供协调支持。(161)对于建立在通用人工智能模型基础上的人工智能系统,有必要明确国家和联盟一级的责任和权限。为避免权限重叠,如果人工智能系统基于通用人工智能模型,且模型和系统系由同一提供者所提供,则应在欧盟层面通过人工智能办公室进行监管,为此,该办公室应拥有2019/1020号条例所指的市场监督管理机关的权力。在所有其他情况下,国家市场监督管理机关仍负责人工智能系统的监管。然而,对于部署者可直接用于至少一个被归类为高风险的目的的通用人工智能系统,市场监督管理机关应与人工智能办公室合作,对其合规性进行评估,并相应地通知欧洲人工智能委员会和其他市场监督管理机关。此外,如果市场监督管理机关因无法获得与高风险人工智能系统所基于的通用人工智能模型相关的特定信息而无法完成对高风险人工智能系统的调查,市场监督管理机关应能够请求人工智能办公室提供协助。在这种情况下,应类推适用2019/1020号条例第六章中关于跨境案件互助的程序。

金融服务业将比你想象得更快地接纳生成式 AI

未来拥抱生成式AI的合规部门可能有望阻止每年在全球范围内非法洗钱的8000亿到[2万亿美元](https://www.zippia.com/advice/money-laundering-statistics/)。毒品贩运、有组织犯罪和其他非法活动都将看到数十年来最大幅度的减少。如今,目前花费在合规性上的数十亿美元仅在阻止犯罪洗钱方面具有[3%的有效性](https://a16z.com/2020/01/21/every-company-will-be-a-fintech-company-2/)。合规软件主要是建立在“硬编码”规则之上。例如,反洗钱系统使合规官员能够运行像“标记任何超过1万美元的交易”这样的规则,或者扫描其他预定义的可疑活动。应用这样的规则可能是一种不完美的科学,导致大多数金融机构被他们法律上有义务调查的假阳性结果淹没。合规员工花费大量时间从不同的系统和部门中收集客户信息,以便调查每一笔被标记的交易。为了[避免巨额罚款](https://a16z.com/2021/10/15/open-source-is-finally-coming-to-financial-services/),他们雇佣了数千人,通常占银行员工总数的10%以上。生成式AI的未来可能实现:

Others are asking
我希望通过ai做好我企业内部的智能巡检。巡检内容主要是针对企业的门店的招牌门头是否合规给出意见。主要合规性检查包括:Logo是否符合公司的设计标准;门头的颜色搭配、尺寸是否符合标准(还要提醒褪色),请问大体应该是各什么思路?
很抱歉,飞书知识库中没有与您关于通过 AI 做好企业内部门店招牌门头智能巡检思路的直接相关内容。但一般来说,您可以考虑以下思路: 1. 数据采集:使用图像采集设备获取门店招牌门头的图像数据。 2. 图像识别技术:运用 AI 的图像识别能力,对采集到的图像进行分析,识别 Logo、颜色、尺寸等元素。 3. 建立标准模型:根据公司设计的标准,建立合规性的模型,以便与采集到的图像进行对比。 4. 智能判断:通过算法判断门头的各项元素是否符合标准,包括 Logo 是否与标准一致,颜色搭配、尺寸是否在规定范围内,以及是否存在褪色等问题。 5. 生成报告和提醒:根据判断结果生成详细的报告,并及时提醒相关人员进行整改。
2025-02-25
合规性审查
以下是关于合规性审查的相关内容: 套壳产品的合规管理策略: 1. 深入了解相关法律法规:企业应熟悉涉及知识产权、消费者权益保护、产品安全、市场监管等方面的法律法规,确保产品设计、生产、销售和营销活动符合这些法律法规。 2. 尊重知识产权:对于采用或参考他人作品的产品,确保已获得必要的许可和授权,避免侵犯版权、商标权、专利权等。 3. 进行产品合规性审查:在产品开发阶段,进行合规性审查,确保产品设计、材料和功能符合所有适用的行业标准和法规。 4. 建立风险管理机制:制定风险评估和管理流程,定期评估产品的合规性风险,并制定相应的风险缓解措施。 5. 加强质量控制:确保产品经过严格的质量控制流程,符合消费者安全和产品质量的标准。 6. 透明和诚实的营销:在产品推广和营销中,确保所有声明都是准确、透明和不具误导性的。 7. 建立监督和审计流程:定期对产品和业务流程进行内部审计,以确保持续的合规性。 8. 员工培训和意识提升:对员工进行合规和道德培训,确保他们理解公司政策和相关法律法规,以及他们在维护合规性方面的责任。 9. 建立应急响应计划:制定应对潜在合规问题和危机情况的应急计划,包括迅速反应机制、责任分配、沟通策略等。 10. 与法律顾问合作:在关键的产品开发和市场推广阶段,与法律专家合作,以确保所有操作符合法律要求。 AI 陪伴产品的合规措施: 为了确保 AI 陪伴产品的合规性,制造商和开发者需要采取一系列措施。这包括遵循数据保护法规,设计安全的软硬件,确保儿童用户的隐私和安全,提供产品的透明度和可解释性,避免偏见和歧视,确保用户充分理解他们的权利和义务,考虑产品对用户心理健康和社会行为的影响,定期对产品进行监测和更新,进行合规性审核和认证,以及提供用户教育和支持服务。 金融服务业中生成式 AI 对合规性的作用: 1. 高效筛查:生成式 AI 模型可以迅速将任何个体在不同系统中的关键信息汇总并呈现给合规官员,使合规官员能更快地得出交易是否存在问题的答案。 2. 更准确地预测洗钱者:根据过去 10 年的可疑活动报告(SARs)进行训练的模型,无需明确告诉模型洗钱者是什么,AI 可以用来检测报告中的新模式,并创建其自己对洗钱者构成的定义。 3. 更快的文档分析:合规部门负责确保公司的内部政策和程序得到遵守,并且遵循监管要求。生成式 AI 可以分析大量的文档,如合同、报告和电子邮件,并标记需要进一步调查的潜在问题或关注区域。 4. 培训和教育:生成式 AI 可以用于开发培训材料,并模拟真实世界的场景,以教育合规官员关于最佳实践以及如何识别潜在风险和不合规行为。 5. 新进入者可以使用来自数十个机构的公开可用合规数据进行自我启动,并使搜索和综合变得更快、更便捷。较大的公司从多年收集的数据中受益,但他们需要设计适当的隐私功能。合规长期以来一直被视为一个由过时技术支持的不断增长的成本中心。生成式 AI 将改变这一点。 总之,套壳产品虽可能带来短期经济效益,但长期潜在风险不容忽视,企业应采取全面合规管理策略。AI 陪伴产品在带来便利的同时也带来挑战,制造商和开发者须承担社会责任确保合规性和安全性。金融服务业中生成式 AI 能改善合规性,但也需注意隐私功能设计等问题。
2025-02-22
COZE智能体全自动制造视频发布媒体
以下是关于 COZE 智能体全自动制造视频发布媒体的相关内容: 概述: 基于其他博主开源的视频生成工作流进行功能优化,实现视频全自动创建。感谢开源,还提供了相关教程。 先看效果: 可查看 功能: 通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 工作流调试完成后,加入到智能体中,可选择工作流绑定卡片数据。 选择发布渠道为飞书多维表格,填写上架信息等待审核,审核通过后即可使用。 3. 在多维表格中使用字段捷径,引用该智能体。 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,自动调用工作流生成视频。 进行表单分享,实现填写表单自动创建文案短视频的效果。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档 创建智能体: 1. 知识库 本次创建知识库使用手动清洗数据。 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割。 本地文档:注意拆分内容,提高训练数据准确度,按章节进行人工标注和处理。 2. 发布应用:点击发布,确保在 Bot 商店中能够搜到。
2025-03-28
我想做个专业领域的智能客服,请问您有一些类似案例吗?
以下是为您提供的一些相关案例: 在 Manus 案例中,有让其创建需要上传文件的 dify 工作流,如根据多篇文章写脱口秀段子,并制作简便美观的网页和接入工作流的 api 等复杂操作。 有关于智能客服场景如何帮助企业更好地对内服务客服、对外服务客户的案例。 在通用 AGENT 案例合集中,包括生活娱乐类 AGENT 方面的案例,如根据出差计划做成的具有多种功能的互动式网页,如供应商工厂探索地图;还有整活娱乐方面的案例,如荒谬句子生成器和豆瓣品味分析师。荒谬句子生成器实现了小时候的线下游戏功能,并增加了扩展句子和虚拟专家评论功能;豆瓣品味分析师能根据用户的豆瓣 id 获得评价信息并生成锐评报告。
2025-03-28
人工智能的意义
人工智能具有多方面的重要意义: 从监管角度看,有效监管人工智能需要对其有共同的理解。目前对于人工智能没有广泛共识的通用定义,但通过参考其“适应性”和“自主性”这两个产生定制监管响应需求的特性来定义。“适应性”使解释系统结果的意图或逻辑变得困难,“自主性”使结果的责任分配变得困难。 从产业发展角度看,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,加速与实体经济深度融合,改变工业生产模式和经济发展形态,对新型工业化、制造强国、网络强国和数字中国建设发挥重要支撑作用。我国人工智能产业在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模,伴随新技术加速迭代,呈现创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,亟需完善产业标准体系。 从学科本身角度看,人工智能是一门研究如何使计算机表现出智能行为,例如做人类擅长之事的科学。对于一些无法明确编程的任务,如根据照片判断人的年龄,正是人工智能感兴趣的领域。在金融、医学和艺术等领域,人工智能也带来了诸多益处。
2025-03-28
如何创建一个属于自己的智能体,需要怎么投喂
创建属于自己的智能体并进行投喂,主要包括以下步骤: 1. 工作流调试完成后,将其加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。绑定卡片数据可自行研究,如有疑问可留言。 2. 发布智能体: 选择需要的发布渠道,重点如飞书多维表格。 记得智能体提示词的 4 个变量,发布时会自动出现。 填写上架信息(为快速审核,选择仅自己可用),确认发布并等待审核。审核通过后,即可在多维表格中使用。 3. 创建飞书多维表格,添加相关字段。配置相关内容,选择“自动更新”,输入 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 4. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 5. 点击多维表格右上角的“自动化”,创建想要的自动化流程。 此外,创建智能体还包括以下具体操作: 1. 使用单 Agent 对话流模式创建智能体。 2. 编排对话流,创建新的对话流并与智能体关联。 3. 进行测试,找到一篇小红书笔记,试运行对话流,在对话窗口输入地址,看到数据则成功。回到智能体编排页面同样测试,确保对话流执行成功。 4. 发布智能体,选择多维表格,进行配置。包括输出类型选文本、输入类型选字段选择器,完善上架信息,选择发布范围等。 如果没有创建智能体的灵感,可以查看相关案例集或通过与特定工具进行对话获取。通过扣子助手可快速进行创建,参考相应的 Prompt 进行操作。最后发布作品。
2025-03-28
ai在人力资源工作中可以做什么?有哪些好用的智能体?
AI 在人力资源工作中可以发挥以下作用: 1. 招聘与选拔:利用 AI 进行简历筛选、人才匹配和面试评估,提高招聘效率和准确性。 2. 员工培训与发展:通过个性化的学习路径推荐、在线培训课程和培训效果评估,优化员工的培训体验和效果。 3. 绩效管理:借助数据分析来评估员工绩效,提供更客观的绩效评估结果。 4. 员工关系管理:预测员工离职风险,及时采取措施改善员工满意度和忠诚度。 以下是一些好用的 AI 智能体: 1. (用于客户服务和支持)。 2. (用于软件开发)。 3. (用于财务后勤)。 需要注意的是,智能体和工作流有所不同。智能体是特定任务的“助手”,用于局部执行任务,擅长做具体、重复性的任务,如客服聊天、推荐商品、处理订单等,但只能按照预先设定的规则和任务做事,遇到超出范围的情况可能无法应对。工作流则是一个“计划”或“路线图”,指导整个任务的流程,更灵活,能够适应变化,可处理一个完整的过程,涵盖所有步骤和环节。在业务中,通常需要的是工作流而非单个智能体,因为整个业务流程设计至关重要。
2025-03-27
我希望了解人工智能大模型公司的整体产业情况
以下是关于人工智能大模型公司的整体产业情况: 2024 年被称为国内大模型落地元年,经过一年时间的发展,呈现出以下特点: 1. 竞争格局:国内大模型行业基本形成了以百度、阿里、字节等科技大厂和创业“AI 六小虎”为主要玩家的竞争态势。 2. 落地增长:2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长。中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 3. 厂商表现:百度在中标数量和金额方面排名所有厂商之首,科大讯飞居第二。在金融行业,百度也排名第一。 4. 行业应用:在智能终端行业,超半数手机厂商使用文心大模型,多家车企已接入百度文心大模型。 5. 能力要求:大模型进入产业落地后,除模型本身能力外,落地应用所需的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业落地大模型需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力,大模型的竞争正成为体系化之战。 此外,2023 年国内大模型发展情况包括:智谱推出了 4 代 GLM,MiniMax 推出新模型及“星野”APP,月之暗面在长 Token 能力上表现出色。但在 2C 端真正出圈的产品较少,在 2B 行业中,大模型对收入撬动有限。硬件层上,国内仍缺乏胜任大模型训练的芯片,华为昇腾在单卡指标上接近,但存在稳定性和生态问题。
2025-03-27
竞品分析提示词
以下是关于竞品分析提示词的相关内容: 提示词工程的实践与优化: 建立提示词模板库是提高效率的重要策略。随着时间推移,发现特定类型提示词在特定任务中的有效性,将其保存为模板,如市场分析、产品开发策略、竞争对手分析、财务预测、风险评估等模板。每个模板应包含适用场景描述、提示词结构、关键参数、最佳实践和注意事项。以竞争对手分析模板为例,可快速适应不同需求,提高分析效率和一致性。 AI 辅助提示词工程是新兴趋势,包括自动生成提示词、提示词评估、提示词优化和动态调整。例如,可使用相关提示让 AI 协助优化提示词,这是一个持续的过程,通过不断迭代、建立模板库和利用 AI 辅助,能提高提示词效果,支持企业决策和战略规划。 优化提示词/shorten: 若想制作洒满甜甜圈的东西,给出原始提示后,使用 /shorten 命令,机器人会返回信息并提供可能的简短提示。重要标记以粗体突出显示,最不重要的标记以删除线显示。 SD 新手入门图文教程中的提示词: 根据想画的内容写提示词,多个提示词用英文半角符号隔开。 一般概念性、大范围、风格化的关键词写在前,叙述画面内容的其次,描述细节的最后,如(画面质量提示词)、(画面主题内容)(风格)、(相关艺术家)、(其他细节)。 模型中每个词语自带权重不同,训练集中出现多的关键词影响大,反之则小。提示词顺序重要,越靠后权重越低,关键词应具特异性,措辞避免抽象,可使用括号人工修改提示词权重。
2025-03-28
基于AI技术的阅读、裁剪、分析、笔记的软件有哪些。
以下是一些基于 AI 技术的阅读、裁剪、分析、笔记的软件: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,可提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,能精简和优化内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 4. 笔记相关: Obsidian:可搭配浏览器剪藏插件,一些 AI 插件能实现内置助手功能,如检索笔记、基于笔记生成新内容等。 Cursor:能帮助用模糊问题检索笔记库,基于笔记库进行研究,生成和修改笔记。 使用这些软件时,应结合自身写作风格和需求,选择最合适的辅助工具。需注意,部分内容由 AI 大模型生成,请仔细甄别。
2025-03-28
数据挖掘评论分析生成可视化的免费方法
目前暂时没有关于数据挖掘评论分析生成可视化免费方法的相关内容。但您可以通过以下途径寻找免费的解决方案: 1. 利用开源的数据挖掘和可视化工具,如 R 语言中的 ggplot2 库、Python 中的 matplotlib 和 seaborn 库等。 2. 搜索在线的免费数据可视化平台,部分平台可能提供一定程度的数据挖掘和评论分析的可视化功能。 3. 参考相关的技术论坛和社区,获取其他用户分享的免费方法和经验。
2025-03-26
你是一个财务总监,市场分析师,但是你没有数据,现在需要你寻找一下有没有可以自动查找数据,并且根据数据生成饼状图的 AI工具
以下是为您推荐的可以自动查找数据并根据数据生成饼状图的 AI 工具: 1. Claude Financial Data Analyst:可视化金融数据分析工具,能生成多种图表,包括饼图。上传文档后可快速生成动态图表,适用于趋势分析和分布分析。详细介绍:https://xiaohu.ai/p/14811 ,GitHub:https://github.com/anthropics/anthropicquickstarts/tree/main/financialdataanalyst ,https://x.com/imxiaohu/status/1847617781594030583 。 2. PandasAI:让 Pandas DataFrame“学会说人话”的工具,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,会以自然语言、表格或者图表等形式进行回答,目前仅支持 GPT 模型,OpenAI API key 需自备。示例:pandas_ai.run 。GitHub 链接:https://github.com/gventuri/pandasai 。 3. DataSquirrel:自动进行数据清理并可视化执行过程,帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告的数据分析工具。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/ 。
2025-03-25
有关国内Ai Agent的行业分析
以下是关于国内 AI Agent 的行业分析: 市场研究报告: 《爱分析:2024 中国 AI Agent 市场研究报告》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《爱分析:2024 年 AI Agent 实施的明路应用实践报告》指出企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 行业发展现状: 2024 年是大模型持续落地的一年,行业内普遍认为明年将迎来 Agent 的爆发。 从大模型落地具体方式来看,2024 上半年中国 MaaS 市场规模达 2.5 亿元,中国 AI 大模型解决方案市场规模达 13.8 亿元,百度智能云在这两个市场中均获得第一名。 百度智能云旗下有千帆行业场景解决方案,沉淀了制造、能源、交通,政务、金融、汽车、教育、互联网八大行业解决方案。在 2024 百度世界大会上,百度智能云千帆大模型平台发布了工作流 Agent 能力。 AI Agent 特点: 是一种智能代理系统,接近人类大脑,可形成记忆、达成行动规划、自动交互、主动预测。 具有个性化特点,能随着用户使用了解其习惯和想法并作出喜好预测。 能够自主完成任务,如 Auto GPT 可在用户输入目标后自主执行任务、递归地开发和调试代码。 具备多 Agent 协作能力,如斯坦福大学的 SmallVille 项目和 Fixie AI。 应用场景: 目前 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品较少,个人消费者方向目前主要是“私人助理”场景。
2025-03-25
我想搭建个人rag知识库,实现本地化部署,可以调用本地大模型去分析知识库的内容进行解答
以下是搭建个人 rag 知识库并实现本地化部署,调用本地大模型分析知识库内容进行解答的详细步骤: 一、通过 Open WebUI 使用大模型 1. 访问相关网址,使用邮箱注册账号。 2. 登陆成功后,Open WebUI 一般有两种使用方式,包括聊天对话和 RAG 能力(让模型根据文档内容回答问题,这是构建知识库的基础之一)。 3. 如果要求不高,此时已搭建本地大模型,并通过 Web UI 实现与大模型对话。ChatGPT 访问速度快且回答效果好的原因在于其服务器配置高、训练参数多、数据更优及训练算法更好。 二、本地知识库进阶 1. 若要更灵活掌控知识库,需使用额外软件 AnythingLLM,其包含 Open WebUI 的所有能力,并额外支持选择文本嵌入模型和向量数据库。 2. 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 3. 在 AnythingLLM 中有 Workspace 的概念,可创建独有 Workspace 与其他项目数据隔离。首先创建工作空间,然后上传文档并在工作空间中进行文本嵌入,选择对话模式(包括 Chat 模式和 Query 模式),最后进行测试对话。 三、RAG 是什么 利用大模型搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前,需对 RAG 有大概了解。RAG 应用可抽象为 5 个过程: 1. 文档加载:从多种来源加载文档,LangChain 提供 100 多种不同的文档加载器,包括非结构化、结构化数据及代码等。 2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或“文档片”。 3. 存储:涉及将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。 文本加载器是将用户提供的文本加载到内存中,便于后续处理。
2025-03-25