Chat with Wiki - 以图片为主的PDF文件向量化的本地大模型推荐

Answer

以下是关于以图片为主的 PDF 文件向量化的本地大模型的相关信息：

RAG 技术：利用大模型的能力搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期，当需要依靠不在训练集中的数据时，可通过检索增强生成 RAG 技术实现。RAG 应用包括 5 个过程：

文档加载：从多种来源加载文档，如包括 PDF 在内的非结构化数据、SQL 在内的结构化数据以及代码等。
文本分割：把文档切分为指定大小的块。
存储：包括将切分好的文档块嵌入转换成向量形式，并将向量数据存储到向量数据库。
检索：通过检索算法找到与输入问题相似的嵌入片。
输出：把问题以及检索出来的嵌入片一起提交给 LLM，生成更合理的答案。

PDF 翻译的 AI 产品：

DeepL（网站）：www.deepl.com，点击页面「翻译文件」按钮，上传 PDF、Word 或 PowerPoint 文件。
沉浸式翻译（浏览器插件）：immersivetranslate.com，安装插件后，点击插件底部「更多」按钮，选择相关翻译选项。
Calibre（电子书管理应用）：calibre-ebook.com，下载安装并安装翻译插件「Ebook Translator」。
谷歌翻译（网页）：translate.google.com，使用工具把 PDF 转成 Word，再点击谷歌翻译「Document」按钮上传 Word 文档。
百度翻译（网页）：fanyi.baidu.com，点击导航栏「文件翻译」，上传多种格式文件，支持选择领域和导出格式。
彩云小译（App）：下载后点击「文档翻译」，可导入多种格式文档，但有免费次数限制且进阶功能需付费。
微信读书（App）：下载 App 后将 PDF 文档添加到书架，打开并点击页面上方「切换成电子书」，轻触屏幕唤出翻译按钮。

请注意，以上内容由 AI 大模型生成，请仔细甄别。

Content generated by AI large model, please carefully verify (powered by aily)

References

手把手教你本地部署大模型以及搭建个人知识库

文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理

问：推荐 pdf 翻译的 AI 产品

[title]问：推荐pdf翻译的AI产品有许多翻译PDF的方法，以下是几种适用方法：1.DeepL（网站）[www.deepl.com](https://www.deepl.com/translator)：点击页面「翻译文件」按钮，上传PDF、Word或PowerPoint文件即可。2.沉浸式翻译（浏览器插件）[immersivetranslate.com](https://immersivetranslate.com/)：安装插件后，点击插件底部「更多」按钮，选择「制作双语BPUB电子书」、「翻译本地PDF文件」、「翻译THML / TXT文件」、「翻译本地字幕文件」。3.Calibre（电子书管理应用）[calibre-ebook.com](https://calibre-ebook.com/zh_CN)：下载并安装calibre，并安装翻译插件「Ebook Translator」。4.谷歌翻译（网页）[translate.google.com](https://translate.google.com/)：使用工具把PDF转成Word，再点击谷歌翻译「Document」按钮，上传Word文档。5.百度翻译（网页）[fanyi.baidu.com](https://fanyi.baidu.com/)：点击导航栏「文件翻译」，上传PDF、Word、Excel、PPT、TXT等格式的文件，支持选择领域和导出格式（不过进阶功能基本都需要付费了）。6.彩云小译（App）：下载后点击「文档翻译」，可以直接导入PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt等格式的文档并开始翻译（不过有免费次数限制且进阶功能需要付费）。7.微信读书（App）：下载App后将PDF文档添加到书架，打开并点击页面上方「切换成电子书」，轻触屏幕唤出翻译按钮。同类问题：免费将PDF内各国文字翻译为中文的工具内容由AI大模型生成，请仔细甄别。