以下是关于 AI 技术在 PDF 中的使用的相关内容:
PDF 翻译:
从 PDF 中获取图片: 可以使用 PyMuPDF 组件,让 ChatGPT 编写相关 Python 脚本,运行该脚本即可导出 PDF 电子书中的所有图片。但需要声明的是,此方法仅供个人学习娱乐,请勿用于盗版意图。
处理 PDF 文本: Claude 2 在处理 PDF 文本方面表现出色,可以将整本书粘贴到 Claude 的前一版本中取得令人印象深刻的结果,新模型更强大。还可以给它复杂的学术文章并要求总结结果,通过询问后续问题来审问材料,但需要注意这些系统仍可能产生幻觉,若要确保准确性,需检查结果。
有许多翻译PDF的方法,以下是几种适用方法:1.DeepL(网站)[www.deepl.com](https://www.deepl.com/translator):点击页面「翻译文件」按钮,上传PDF、Word或PowerPoint文件即可。2.沉浸式翻译(浏览器插件)[immersivetranslate.com](https://immersivetranslate.com/):安装插件后,点击插件底部「更多」按钮,选择「制作双语BPUB电子书」、「翻译本地PDF文件」、「翻译THML/TXT文件」、「翻译本地字幕文件」。3.Calibre(电子书管理应用)[calibre-ebook.com](https://calibre-ebook.com/zh_CN):下载并安装calibre,并安装翻译插件「Ebook Translator」。4.谷歌翻译(网页)[translate.google.com](https://translate.google.com/):使用工具把PDF转成Word,再点击谷歌翻译「Document」按钮,上传Word文档。5.百度翻译(网页)[fanyi.baidu.com](https://fanyi.baidu.com/):点击导航栏「文件翻译」,上传PDF、Word、Excel、PPT、TXT等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。6.彩云小译(App):下载后点击「文档翻译」,可以直接导入PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。7.微信读书(App):下载App后将PDF文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。同类问题:免费将PDF内各国文字翻译为中文的工具内容由AI大模型生成,请仔细甄别。
顺便,请ChatGPT教给我写一段Python,从PDF中获取所有的图片。起初它并不能很好地理解我的意图,写了一段将PDF每页导出成图片的程序,而我需要的却是Extract。于是我自行搜索了一下,找到一个叫PyMuPDF的组件,再指名请ChatGPT编写,于是就有了下面这段,居然极其简单(而我居然还去搜索并考虑过许多收费转换软件)!只要运行这个python脚本,一本PDF电子书中的所有图片就都被导出了。由于还需要一些拼接和修改,这里先放一放。需要声明的是,本文讲述的方法仅供个人学习娱乐,请勿用于盗版意图。经过最终的修改,现在的页面是这个样子的:至于最终网页,由于我还没有把所有图片填完,另外还需要做一些调整,就先不上传放出了,稍后会放在本站的姊妹站[CATxPAPA](https://catxpapa.com/)上。要完全学习本文的应用,你可能要了解一些基础的网页和编程知识,但真的只是最基础的知识就够了,从小白开始估计一天甚至几个小时之内就能学会。绝大多数的工作还是由AI完成的。这里只是简单地记录一下,仅供启发。
对于处理文本,特别是PDF,到目前为止,Claude 2非常出色。我在整本书中粘贴到Claude的前一版本中,取得了令人印象深刻的结果,新模型要强大得多。你可以[在这里](https://www.oneusefulthing.org/p/what-happens-when-ai-reads-a-book)看到我之前的经验,以及一些可能有趣的提示。我还给了它许多复杂的学术文章,并要求它总结结果,它做得很好!更好的是,你可以通过询问后续问题来审问材料:这种方法的证据是什么?作者得出了什么结论?等等......有些事情需要担心:这些系统仍然产生幻觉,尽管方式更有限。如果您想确保准确性,你需要检查它们的结果。