以下是关于用 DeepSeek 打造个人知识库的相关信息:
上面将文本转换成向量(一串数字)能大大节省空间,它不是压缩,可简单理解为索引(Index)。接下来就有意思了。比如我有一个大文本,可以先把它拆分成若干个小文本块(也叫chunk),通过embeddings API将小文本块转换成embeddings向量,这个向量是跟文本块的语义相关。在一个地方(向量储存库)中保存这些embeddings向量和文本块,作为问答的知识库。当用户提出一个问题时,该问题先通过embeddings API转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的prompt(问题/提示词),发送给GPT API。这样一来就不用一次会话中输入所有领域知识,而是输入了关联度最高的部分知识。一图胜千言,转一张原理图。再举一个极其简单的例子,比如有一篇万字长文,拆分成Chrunks包含:文本块1:本文作者:越山。xxxx。文本块2:公众号越山集的介绍:传播效率方法,分享AI应用,陪伴彼此在成长路上,共同前行。文本块3:《反脆弱》作者塔勒布xxxx。文本块4:“科技爱好者周刊”主编阮一峰会记录每周值得分享的科技内容,周五发布。...文本块n如果提问是”此文作者是谁?“。可以直观的看出上面的文本块1跟这个问题的关联度最高,文本块3次之。通过比较embeddings向量也可以得到这结论。那最后发送给GPT API的问题会类似于”此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。“这样一来,大语言大概率能回答上这个问题。
我们返回RAGFlow中,打开右上角设置,进入模型提供商,显示如下界面接着我们就开始配置我们本地部署的DeepSeek模型选择Ollama,配置如下信息,模型是什么取决你运行的模型是什么基础URL如下配置设置完成之后,点击确定即可,然后显示如下界面那么再导入一个embedding模型,这个嵌入模型可以用于文本的向量化导入成功之后,界面如下接着我们设置系统模型设置设置好后,就可以返回知识库,进行创建知识库了进入数据集,导入文件即可,当然可以设置文件夹当作知识库,大家自行设置导入完毕之后,需要将文件进行解析之后,大模型才会懂得文件内容是什么。可以批量进行解析,文件解析速度按照你本机的GPU性能,即显卡的性能,越好的显卡,解析越快,越差则反之解析好之后,进入检索测试即可测试没有问题,那么对于文件来说,模型是可以进行检索的,下一步就可以进入聊天界面了助理设置可以自行进行设置
蓝色文字跳转到文档对应位置)(不断更新)|章节_[三.使用DeepSeek R1给老外起中文名](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-DyEMdmCPOo98S6xbPfNcsuEOnuh)|知识点_[Node.JS安装](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-PVnndBSV5oWOukx38tKcw2CPnub)|[申请DeepSeek R1 API](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-TrXednqLAoH3VLxrUiYc1Pb9nhf)|[网页接入DeepSeek API](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-UK5xdzhiaoo9RkxHR5bcs30pnV8)||-|-|-|-||[一.Trae的介绍/安装/疑难杂症](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-R4GvdgOzeoC9mOxd1hScuql6nVY)|[Python安装](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Kcojdhid9oWJPjxAvEOczRt0nkg)||||[二.图片字幕生成器](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Yev6dqzNmolizDxG2PWcKj8Pn8y)|[用多模态复刻产品](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-PHwVdl7gCoZEehxUmiUcDeO8nde)||||[四.DeepSeek R1驱动的Life Coach](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-AyjYdKtFhobv6Zxrq71cYJubnug)|[使用AI Rules](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-MBCsdTfLzoRnE9xQm3PcWgdFnEf)|[使用Git进行版本管理](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-S86bdFV1XoE66LxBqVhcqdYFnze)|[Github+Vercel进行云端部署](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-GgVmdqPMqoilxFxONuCcnbNpn2g)||[五.DeepSeek驱动的网页金句卡片生成](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-ZDQHd6QnqoH7SEx3UXwchSOEndc)|[使用Chat完善产品需求(PRD)](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Q21mdyyRIoKZfdxT7rZcwD5lnwd)|[开发浏览器插件](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Mgsvd3OnZousC0x3m3fcqRBanhd)|[Chrome插件logo自动生成](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-J4dcdT2IAoJUXhx2UKKcElR0n6g)||[六.做一个你专属的好文推荐网站(DeepSeek R1+飞书多维表格)](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-MbTBdqIKBowgXExFCLqcQ0KTn5c)|[创建带有AI能力的飞书多维表格](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-R94pdLmyio0NCpxXUGzcJIMonTe)|[用网页呈现多维表格里的内容](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-KMaCd5GQKopqChxO2KycXXG3n5c)|||[七.做一个你专属的好文推荐网站(DeepSeek R1+飞书多维表格)(下)](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-UDIsdsmulox4LcxK2CdcwjGgny6)|[浏览器插件将信息一键插入多维表格](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-O1B2djb7voeVsUxJxLHcyyo6n3c)|[将复杂产品分拆成多个简单产品](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-UOx6dg3aVoeaYpx7M6hcurwUnGc)||