以下是让 AI 总结超长文本的一些方法和策略:
由于GPT有固定的上下文长度,用户和助手之间的对话中,如果整个对话都包含在上下文窗口中,不能无限制地继续下去。有各种解决这个问题的方法,其中之一是总结对话中的前几轮。一旦输入的大小达到预定的阈值长度,这可能会触发一个总结部分对话的查询,而先前对话的总结可能会作为系统消息的一部分包含在内。或者,先前的对话可以在整个对话过程中在后台异步总结。另一种解决方案是动态选择与当前查询最相关的对话的前面部分。请参阅战术[“使用基于嵌入的搜索来实现高效的知识检索”](https://ywh1bkansf.feishu.cn/wiki/EGU4wV4q6i6vprk5A7dckaGTne0?continueFlag=beb34e75b9f54fa714cc212147b7fd74#K8b3dio4ZoRLjxxmVxncPzYCn3c)。[heading3]战术:分段总结长文档,并递归构建完整摘要[content]由于GPT具有固定的上下文长度,因此不能在单个查询中总结太长的文本,具体来说是长度超过上下文长度减去生成的总结长度的文本。要总结一篇非常长的文档,如一本书,我们可以使用一系列查询来总结文档的每一部分。部分总结可以被连接并总结,产生总结的总结。这个过程可以递归进行,直到整个文档被总结。如果需要使用关于早期章节的信息来理解后期章节,那么另一个可以使用的技巧是在总结某一点的内容时,包括一个前文的运行总结。OpenAI在使用GPT-3的变体进行的之前的研究中,已经研究了这个程序对总结书籍的有效性。
除了聊天内容之外,我们还能让AI总结整理各种文章(文章不超过2w字,否则就超出token了)例如,我复制了我的一篇文章给它总结:打开后直接全选复制全文,然后粘贴发送给GPTs,它就开始总结了,很方便,GPT4它能识别出哪些部分属于重点内容。[heading3]2、B站视频[content]你可能会疑惑,GPT不是无法处理视频内容吗,这是怎么做到的?答案是视频字幕。我用这个视频举例:https://www.bilibili.com/video/BV1VL411U7MU/?spm_id_from=333.337.search-card.all.click&vd_source=e05ea46c768d112737bc19e721da8967打开这个视频,如果你能在视频栏下面有一个字幕按钮,说明这个视频作者已经上传了字幕或者后台适配了AI字幕。那我们把这些字幕弄下来,再发给AI执行内容总结任务,是不是就达到了总结视频的效果?是的,目前大部分用AI总结视频的工具/插件/应用都是这么干的。那接下来的卡点就是,怎么把字幕文字内容给提取出来,用语音转文字?不,效率太低了。像这种有字幕的视频,我们可以装一个油猴脚本:[Bilibili CC字幕工具](https://greasyfork.org/zh-CN/scripts/378513-bilibili-cc%E5%AD%97%E5%B9%95%E5%B7%A5%E5%85%B7)安装之后,刷新浏览器,点击字幕,你会看到多出一个“下载”按钮点击下载按钮,会弹出下面这个窗口,你可以选择多种字幕格式,带时间的或者不带时间的:接下来,还是老办法,将字文字内容全选复制发送给GPTs即可。当然,总结完视频内容之后你继续向AI提问更多细节内容或者与它探讨视频内容。
在当今的世界中,有如此多的文本存在,几乎没有人有足够的时间阅读我们希望有时间阅读的所有文本。因此,我看到大型语言模型最令人兴奋的应用之一是使用它来概括文本。这是我看到多个团队正在将其内置到多个软件应用程序中的事情。你可以在Chat GPT网络界面中完成这项工作。我经常会这样做来总结文章,这样我就可以阅读更多文章的内容,而不仅仅是以前能读的那么少。如果你想以更加机械化的方式实现这一点,你可以在这节课中看到如何做到这一点。所以,让我们深入了解代码,看看你如何使用它来总结文本。因此,让我们从与之前相同的入门代码开始,导入OpenAI,加载API密钥,以及这个getCompletion助手函数。我将使用一个运行示例,即对该产品评论进行摘要的任务。我得到了这个熊猫毛绒玩具作为女儿生日礼物,她非常喜欢并且带它到处走等等。如果你正在构建一个电子商务网站并且有大量的评论,那么一个可以总结冗长评论的工具可以让你很快地浏览更多的评论,以更好地了解所有客户的想法。因此,这是一个产生摘要的提示。你的任务是从电子商务网站的产品评论中生成一个简短的摘要,并在30个单词以内对评论进行总结等等。[heading2]4.1文字总结[heading2]4.2针对某种信息总结[heading2]4.3尝试“提取”而不是“总结”[heading2]4.4针对多项信息总结