Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

请问你的大模型底座用的是什么

Answer

大模型的底座相关知识如下:

  • 大模型像一个多功能的基础平台(有时也被称为“基座模型”),可以处理多种不同的任务,应用范围广泛,拥有更多通识知识。
  • 大模型的知识来源于训练过程中接触到的数据,这些数据是有限的,其知识库不会自动更新,只能回答在训练过程中见过或类似的问题,在某些特定或专业领域的知识可能不够全面。
  • 从整体分层的角度来看,大模型整体架构的基础层为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。数据层包括企业根据自身特性维护的垂域数据,分为静态的知识库和动态的三方数据集。模型层有 LLm(大语言模型)或多模态模型,如 GPT 一般使用 transformer 算法实现,多模态模型训练所用数据与 llm 不同,用的是图文或声音等多模态的数据集。平台层是模型与应用间的部分,如大模型的评测体系或 langchain 平台等。表现层即应用层,是用户实际看到的地方。
  • 零跑汽车基于百炼实现大模型落地零跑座舱,阿里云通过百炼平台实现大模型落地零跑座舱,为用户的多种互动提供支持,零跑汽车构建了开放、可扩展的大模型应用架构,基于统一的大模型底座,实现了零跑座舱大模型应用场景的快速扩展与迭代。
Content generated by AI large model, please carefully verify (powered by aily)

References

十七问解读生成式人工智能

“小模型”确实有其优势,尤其是在特定任务上表现得非常出色。比如,如果你训练了一个专门识别猫🐱或狗🐶的模型,它在这个任务上可能非常精准。然而,这个模型就无法用于其他任务(因为用来训练模型的数据主要是由猫猫狗狗的照片组成的)。而“大模型”则不同,它像一个多功能的基础平台(有时也被称为“基座模型”)。大模型可以处理多种不同的任务,应用范围非常广泛,并且拥有更多的通识知识。这就是为什么尽管“小模型”在某些特定领域内表现优异,我们仍然需要“大模型”的原因:它们能够在更广泛的场景中提供支持和解决问题。[heading1]问题十一、大模型拥有无限知识吗?[content]大模型并不拥有无限知识。大模型的知识来源于它们在训练过程中接触到的数据,而这些数据是有限的。虽然大模型可以处理和生成大量的信息,但它们的知识来自于它们所训练的数据集,这些数据集虽然庞大,但仍然是有限的。因此,大模型只能回答它们在训练过程中见过或类似的问题。大模型在训练之后,其知识库不会自动更新。也就是说,它们无法实时获取最新的信息,除非重新训练或通过其他方式更新模型。大模型在某些特定或专业领域的知识可能不够全面,因为这些领域的数据在训练集中可能较少。[heading1]问题十二、大型语言模型的运作机制是什么?[content]大型语言模型的运作机制主要是通过大量的数据训练来学习语言的结构和模式,然后根据输入生成相应的文本。这些模型通过阅读大量的文本数据,学习到语言中的词汇、语法、句子结构以及上下文关系。当你给它一个输入时,它会根据这些学习到的知识生成一个连贯的回答。所以它永远在猜测下一个字符将要生成什么,类似于词语接龙游戏。

零跑汽车基于百炼实现大模型落地零跑座舱

零跑汽车成立于2015年12月24日,是一家创新型的智能电动汽车品牌,零跑汽车自成立以来,始终坚持核心技术的自主研发,是拥有智能电动汽车完整自主研发能力以及掌握核心技术的整车厂家,2023年零跑已位列新能源品牌销量前三。从2017年起,零跑汽车便与阿里云展开深度合作。近日,零跑汽车已对OTA功能完成大规模升级,携手阿里云首次在座舱场景中增加“语音大模型”功能,用于聊天、基础知识问答、文生图等场景,提升用户驾驶体验。[heading1]阿里云的解决方案[content]阿里云通过百炼平台实现大模型落地零跑座舱,为用户的信息查询、车辆控制、娱乐与媒体服务、秒极生图等互动提供支持,提升用户的座舱体验。接入通义大模型实现开放式语音交互阿里云通义大模型帮助零跑汽车改变了传统的固定形式的问答模式,支持用户与零跑智能座舱进行开放式语音交互(闲聊场景),进行自然、连贯的多轮对话,可秒级响应,同时结合企业知识库和互联网知识库,满足用户多元化的需求。基于语音调用通义万相实现秒级作图零跑采用语音助手调用云端通义系列大模型,帮助用户通用语音调用通义万相实现文生图换壁纸,实现秒级作图,提升娱乐互动;支持语音查找如何使用汽车功能、规划路径等功能,丰富用户操作体验;知识库内容覆盖了零跑全系汽车知识和其他汽车品牌开放领域的信息。基于百炼构建大模型应用架构基于百炼平台,零跑汽车构建了开放、可扩展的大模型应用架构,基于统一的大模型底座,实现了零跑座舱大模型应用场景的快速扩展与迭代,降低大模型应用的创新门槛与成本。

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

首先为方便大家对大模型有一个整体的认知,我们先从大模型的整体架构着手,来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看,目前大模型整体架构可以分为以下几层:[heading3]1.基础层:为大模型提供硬件支撑,数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集,而是企业根据自己的特性,维护的垂域数据。分为静态的知识库,和动态的三方数据集[heading3]3.模型层:LLm或多模态模型[content]LLm这个大家应该都知道,large-language-model,也就是大语言模型,例如GPT,一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型,训练所用的数据与llm不同,用的是图文或声音等多模态的数据集[heading3]4.平台层:模型与应用间的平台部分[content]比如大模型的评测体系,或者langchain平台等,提供模型与应用间的组成部分[heading3]5.表现层:也就是应用层,用户实际看到的地方[content]这个就很好理解了,就不用我多作解释了吧

Others are asking
我想把黑白老照片修复成彩色,然后给人物换衣服。请问哪个AI网站或者软件可以免费使用
以下为您介绍可免费使用的将黑白老照片修复成彩色并给人物换衣服的方法: 使用 Stable Diffusion 可以实现此需求。在新上线的 controlnet 模型中,新增的 Recolor 模型能将黑白图片重新上色。操作时选择 realisian 的写实大模型,提示词直接描述颜色和对应的内容,如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景等。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰,可参考文章——。 之后将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的,可参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免对原图产生干扰。 原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2025-02-04
请问现在有哪些ai可以优化ppt
以下是一些可以优化 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ AI 生成 PPT 的主要思路: 以爱设计为例,将大纲导入工具生成 PPT。其他工具操作方式大同小异,都是基于 Markdown 语法的内容来完成 PPT 的生成。具体步骤,可以移步到 MindShow、闪击、爱设计等章节。 优化整体结构: 按照公司要求,可以自行优化字体、图片等元素。针对下载后的 PPT,可以删改内容以达到心理预期。 此外,还有以下受欢迎的 AI PPT 工具: 1. 爱设计 2. 闪击 3. Process ON 4. WPS AI 每一款工具都有其独特的优势,能助您快速、高效地完成 PPT 设计。
2025-02-03
我是一个小白,想画一个卫生间结构的CAD图,请问用什么AI工具能实现?
对于您想画一个卫生间结构的 CAD 图,以下是一些可以辅助您的 AI 工具: 1. CADtools 12:这是一个 Adobe Illustrator 插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:这是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能够帮助您创建复杂的几何形状和优化设计。 3. nTopology:这是一款基于 AI 的设计软件,可以帮助您创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:这是一款基于 AI 的 CAD 软件,可以根据您输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,这些工具可以根据您输入的设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议您先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 关于 AI 生成 CAD 图的相关资料,您可以参考以下几个方面: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库进行搜索。 2. 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍。 3. 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程,在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区:加入相关的技术论坛和社区,如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与其他专业人士交流和学习。 5. 开源项目和代码库:探索 GitHub 等开源平台上的 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等 AI 模型在 CAD 设计中的应用。 6. 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 在学习和研究 AI 生成 CAD 图的过程中,了解相关的基础知识和技术细节是非常重要的。通过阅读学术论文、参加在线课程、观看教程视频和交流学习,您可以逐步掌握 AI 在 CAD 领域的应用和实现。随着 AI 技术的不断发展,AI 在 CAD 设计中的应用将会越来越广泛,为设计师和工程师提供更多的辅助和支持。
2025-02-02
我现在需要根据一系列的 yaml 和 markdown 构建一个知识库,并且需要支持 AI 问答,每次 AI 问答的结果都要保存成一个新的内容放到知识库中,请问从经济效益来看,有哪些服务可以使用?
目前从经济效益的角度来看,以下一些服务可能有助于您构建这样的知识库并支持 AI 问答以及结果保存: 1. 云服务提供商,如阿里云、腾讯云、AWS 等,它们提供可扩展的计算和存储资源,您可以根据实际需求灵活配置,避免过度投入硬件成本。 2. 开源的知识管理和问答系统框架,例如使用 Elasticsearch 结合相关插件来实现问答功能,成本相对较低,但可能需要一定的技术投入进行搭建和维护。 3. 一些专门针对知识管理和 AI 应用的 SaaS 服务,它们通常按使用量计费,初期投入较小,适合小规模应用。 需要注意的是,具体选择哪种服务取决于您的业务规模、技术能力、预算以及对性能和功能的要求。
2025-02-01
网络上有关于AI知识的授课,请问标价一般在多少范围内合适
网络上关于 AI 知识的授课,比如“野菩萨”的课程,其内容丰富多样,包括: 预习周课程:涵盖 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:包含 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 该课程标价情况如下: 冠军奖励:4980 课程一份。 亚军奖励:3980 课程一份。 季军奖励:1980 课程一份。 入围奖励:598 野神殿门票一张。 同时,如果想要免费获得这门课程,可以参与 video battle,每期的评委野菩萨老师都非常严格,需要寓意深度审美并存。您可以扫码添加菩萨老师助理,了解更多课程信息。
2025-01-31
请问还有哪些AIGC活动还未到截止日期
以下是一些尚未到截止日期的 AIGC 活动: 2024 上海国际公益广告大赛:截止 10 月 31 日。作品提交:sipsac.cn,主题为“潮起东方创益未来”,板块包括美丽世界、文化中国、科技生活,类型有平面、音视频、数字创新,金奖 3 万、银奖 1 万、铜奖 5 千,还有全场大奖 10 万。 首届“海丝之光”AI 青瓷设计大赛:截止 2024 年 11 月 10 日。报名链接:,团队参赛最多 5 人,网络投票+专家评审,一等奖 10000 元,二等奖 5000 元,三等奖 1000 元。 百万奖金池重磅赛事“2024 AIGC 营销视频生态创新大赛 '真 AI 牛奶,真 AI 创意'”:作品提交时间为 10 月 11 日 11 月 30 日,专家评审时间为 12 月 1 日 12 月 9 日,成果发布时间为 12 月 10 日。 中国神兽复兴计划 AI 创作大赛开启:9 月 1 日 9 月 24 日。利用 AI 复原《山海经》中的经典神兽,赢取 35 万元现金和实体大奖,获奖作品将获得全网流量曝光,由中央美术学院等权威高校支持。 生成式人工智能(AIGC)网络微短剧、微电影大赛征集评选活动:9 月 3 日 11 月 3 日。一等奖 2 名,奖杯、荣誉证书 10000;二等奖 2 名,奖杯、荣誉证书 8000;三等奖 6 名,奖杯、荣誉证书 3000。 ComfyUI 共学 WaytoAGI 共学计划:8 月 20 23 日每晚 8 点,会议链接:。 全球 AI 视觉创意大赛(瓦卡奖 VACAT):8 月 22 日 9 月 22 日。全球 AI 视觉创意大赛(瓦卡奖 VACAT Vision Arts Created by AI Technology),致力于构建 AI 视觉创意界的“奥斯卡”平台,推动 AI 视觉技术的应用与创新。
2025-01-30
大模型在数据分析上的应用
大模型在数据分析上有广泛的应用。 首先,了解一下大模型的基本概念。数字化便于计算机处理,为让计算机理解 Token 之间的联系,需将 Token 表示成稠密矩阵向量,即 embedding,常见算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。以 Transform 为代表的大模型采用自注意力机制来学习不同 token 之间的依赖关系,生成高质量 embedding。大模型的“大”在于用于表达 token 之间关系的参数多,如 GPT3 拥有 1750 亿参数。 大模型因其强大能力,在多个领域有热门应用场景: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:进行自然对话,提供客户服务、日常任务提醒和信息咨询等。 3. 编程和代码辅助:自动补全、修复 bug 和解释代码,提高编程效率。 4. 翻译和跨语言通信:理解和翻译多种语言,促进不同语言背景用户的沟通和信息共享。 5. 情感分析和意见挖掘:分析社交媒体等中的文本,为市场研究和产品改进提供支持。 6. 教育和学习辅助:创建个性化学习材料、回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可根据文本描述生成相应图像,未来可能扩展到视频。 8. 游戏开发和互动体验:创建游戏角色对话、生成故事情节和增强玩家沉浸式体验。 9. 医疗和健康咨询:回答医疗相关问题,提供初步健康建议和医疗信息查询服务。 10. 法律和合规咨询:解读法律文件,提供合规建议,降低法律服务门槛。 大型模型主要分为两类:大型语言模型专注于处理和生成文本信息;大型多模态模型能处理包括文本、图片、音频等多种类型信息。二者在处理信息类型、应用场景和数据需求方面有所不同。大型语言模型主要用于自然语言处理任务,依赖大量文本数据训练;大型多模态模型能处理多种信息类型,应用更广泛,需要多种类型数据训练。 相对大模型,也有所谓的“小模型”,它们通常是为完成特定任务而设计。
2025-02-05
flux1-depth-dev模型存放路径
flux1depthdev 模型的存放路径如下: 1. 下载 flux1depthdev 模型放到 ComfyUI/models/diffusion_models/文件夹中。 夸克网盘:链接:https://pan.quark.cn/s/571d174ec17f 百度网盘:见前文 2. 也可以将 depth lora 模型存放到 ComfyUI/models/loras 文件夹中。 depth lora 模型:https://huggingface.co/blackforestlabs/FLUX.1Depthdevlora 3. 百度网盘中也有相关模型: 链接:https://pan.baidu.com/s/10BmYtY3sU1VQzwUy2gpNlw?pwd=qflr 提取码:qflr
2025-02-05
你目前使用的是哪个模型
以下是一些关于模型的信息: 在 Cursor Chat、Ctrl/⌘K 和终端 Ctrl/⌘K 中,您可以在 AI 输入框下方的下拉列表中选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:、cursorsmall。您还可以在 Cursor Settings>Models>Model Names 下添加其他模型。cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。 在 Morph Studio 中,支持以下模型生成视频: TexttoVideoMorph0.1:内部文本到视频生成模型,默认具有逼真色调,可通过描述性形容词修改拍摄风格和外观。 ImagetoVideoMorph0.1:内部图像到视频生成模型,用文本提示引导效果更好,使用时可不输入文本,在角色特写和对象动画方面表现较好。 VideotoVideoMorph0.1:内部风格转换模型,支持在文本提示下进行视频到视频的渲染,可将视频风格更改为预设,同时保留原始视频的字符和布局。 ImagetoVideoSVD1.1:由 Stability.ai 提供支持的图像到视频模型,适用于构图中有清晰层次的镜头(风景镜头、B 卷等)。 文本到视频形态0.1 被设置为新创建射击卡的默认模型,型号选择会根据是否上传图像或视频而更改,每个模型有自己的一组参数可供调整,如相机运动(支持静态、放大、缩小、向左平移、向右平移、向上平移、向下平移、顺时针旋转和逆时针旋转,未来将支持一次选择多个相机移动选项)、时间(支持最多 10 秒的视频生成,默认持续时间为 3 秒)。 ComfyUI instantID 目前只支持 sdxl。主要的模型需下载后放在 ComfyUI/models/instantid 文件夹(若没有则新建),地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ipadapter.bin?download=true 。InsightFace 模型是 antelopev2(不是经典的 buffalo_l),下载解压后放在 ComfyUI/models/insightface/models/antelopev2 目录中,地址为:https://huggingface.co/MonsterMMORPG/tools/tree/main 。还需要一个 ControlNet 模型,放在 ComfyUI/models/controlnet 目录下,地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ControlNetModel/diffusion_pytorch_model.safetensors?download=true 。上述模型网络环境不好的,可在网盘 https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 下载。
2025-02-05
图生图美食模型
以下是关于图生图美食模型的相关知识: 概念与功能说明: 首页模型、帖子、排行榜:展示其他用户生成的模型、图片。不同模型有 checkpoint 和 lora 两种标签,部分还有 SDXL 标签。点击可查看模型详情,下方有返图区。 基础模型(checkpoint):生图必需,任何生图操作都要先选定。 lora:低阶自适应模型,类似 checkpoint 的小插件,可控制细节,权重可调整。 ControlNet:控制图片中特定图像,如人物姿态、特定文字等,高阶技能。 VAE:编码器,类似滤镜,调整生图饱和度,可无脑选 840000。 Prompt 提示词:描述想要 AI 生成的内容。 负向提示词(Negative Prompt):描述想要 AI 避免产生的内容。 图生图:上传图片后,SD 会根据图片、所选模型、输入的 prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 简明操作流程(文生图): 定主题:确定生成图片的主题、风格和表达信息。 选择基础模型(checkpoint):按主题找贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 控制图片效果和质量。 ControlNet:高阶技能,可控制特定图像。 局部重绘:下篇再教。 设置 VAE:选 840000。 Prompt 提示词:用英文写需求,单词、短语组合,用英文半角逗号隔开。 负向提示词(Negative Prompt):用英文写避免的内容,单词、短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++2M Karras,留意 checkpoint 详情页作者推荐的采样器。 采样次数:根据采样器特征,选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。
2025-02-04
各个ai大模型的优势
以下是一些常见的 AI 大模型的优势: OpenAI 的 GPT4: 是大型多模态模型,接受图像和文本输入,输出文本。 在各种专业和学术基准测试中表现出与人类相当的水平。 Midjourney v5: 具有极高的一致性。 擅长以更高分辨率解释自然语言 prompt。 支持像使用 tile 这样的重复图案等高级功能。 DALL·E 3: 能轻松将想法转化为极其精准的图像。 代表了生成完全符合文本的图像能力的一大飞跃。 Mistral 7B: 在所有基准测试上超越了 Llama 2 13B。 在许多基准测试上超越了 Llama 1 34B。 在代码任务上接近 CodeLlama 7B 的性能,同时在英语任务上表现良好。 OpenAI 的 o3 及 o3mini: o3 在编码、数学和科学等领域表现出色,在多个衡量基准上远超 o1。 在 ARCAGI 公共基准得分高。 在 EpochAI 的 Frontier Math 创下新纪录。 在 SWEBench Verified 上表现突出。 在 Codeforces 上得分高。 在 AIME 2024 上得分高。 在 GPQA Diamond 上表现远高于人类专家。 o3mini 具有 3 个推理级别,最低级别将比肩 o1,在许多编码任务上性能优于 o1,且成本大幅降低。 大模型的优势还包括: 像一个多功能的基础平台,能处理多种不同的任务,应用范围广泛,拥有更多的通识知识。 但大模型并非拥有无限知识,其知识来源于有限的训练数据,且知识库不会自动更新,在某些特定或专业领域的知识可能不够全面。
2025-02-04
大模型搭建知识库的逻辑是什么
大模型搭建知识库的逻辑主要包括以下几个方面: 1. 理解 RAG 技术:利用大模型搭建知识库本质上是 RAG 技术的应用。在大模型训练数据有截止日期或不包含所需数据时,通过检索增强生成(RAG)来解决。RAG 可抽象为 5 个过程: 文档加载:从多种来源加载包括非结构化、结构化和代码等不同类型的文档。 文本分割:把文档切分为指定大小的块。 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 检索:通过检索算法找到与输入问题相似的嵌入片。 输出:把问题及检索出来的嵌入片一起提交给大模型,生成更合理的答案。 2. 构建知识库各个流程: 从用户提出问题开始,经历用户问题的理解、路由、初步检索、重排序等环节,最终将重排序后的结果和用户的查询意图组合成上下文输入给大模型生成输出结果。需要注意重排序结果的使用限制,如设置阈值进行截断或筛选相关性分数等。 后置处理包括敏感内容检测和移除、格式化输出等。 3. 知识库的需求:大模型并非 100%准确,存在数据日期限制和无法感知公司内部私有数据等问题,知识库的出现就是为解决大模型的数据准确性问题。例如在客服系统中,公司将用户问题及答案记录在文档中以知识库形式投喂给大模型,使其能更准确回答用户自然语言询问的问题。
2025-02-03