以下是新手使用 ChatGPT 的操作步骤:
OpenAI API,YYDS[heading3]完成一个AI应用[content]在许多的微信群里,都有这样一类bot:你把公众号文章丢给他,他就会自动总结这篇文章。怎么做的呢?答:通过OpenAI API(或者其他家的API)。我们尝试完成的画,做法将包含以下几步:获得API Key(扣费凭证)获得API的示例代码(通常在Playground里面)将必要的信息丢给ChatGPT,让它帮你整合一下复制,站台,运行,然后看看效果[heading3]获得API Key[content]以OpenAI API为例,你可以在这个页面找到API Key:https://platform.openai.com/api-keys打开后,点击「Create new secret key」即可获取请注意:通常,你需要绑定支付方式,才可以获取有效Key[heading3]获得API使用的示例代码[content]以OpenAI API为例,你可以在Playground这个页面获取API调用的示例代码:https://platform.openai.com/playground并且可以将你和GPT的对话,转换成代码注意,这里有两个值可以定义,一个是:SYSTEM:对应ChatGPT里的Instructions,用来定义这个Bot的功能/特点USER:对应ChatGPT里,用户发出的信息这里,我将SYSTEM定义成了缩略信息助手,而在USER中输入了文章内容运行后,结果很令人满意点击右上方View Code,获取生成这一内容的示例代码[heading3]再问ChatGPT[content]顺着之前的对话,让ChatGPT帮我们继续写代码吧!...继续前文的对话...
GPT(Generative Pre-trained Transformer,生成型预训练变换器)是由OpenAI研发的大型文本生成类深度学习模型,可以用于对话AI、机器翻译、摘要生成、代码生成等复杂的自然语言处理任务。GPT系列模型使用了不断堆叠Transformer的思想,通过不断提升训练语料的规模与质量,以及不断增加网络参数来实现GPT的升级迭代|模型|发布时间|参数量|预训练数据量||-|-|-|-||GPT-1|43252|1.17亿|约5GB||GPT-2|43497|15亿|40GB||GPT-3|43952|1750亿|45TB||GPT-3.5|44895|1750亿|?||GPT-4|2023年3月14|估计1.8万亿|60 TB||GPT-4o|2024年5月14|未公开|60 TB|ChatGPT的训练步骤:(详细理解,参考ChatGPT三个阶段)1.收集示范数据并训练一个监督学习的策略;2.收集对比数据并训练一个奖励模型;3.使用强化学习算法优化针对奖励模型的策略。目前的局限性:
大聪明我使用colab,请给我写一段代码,用于抓取https://mp.weixin.qq.com/s/KUnXlDlg-Rs_6D5RFpQbnQ的正文内容ChatGPT在Colab中抓取网页的正文内容,你可以使用Python的requests库来获取网页的HTML源代码,然后使用BeautifulSoup库来解析HTML并提取所需的正文部分。下面是一个简单的示例代码,演示了如何实现这一过程。请注意,由于微信公众号文章可能有一些特殊的反爬措施,这段代码可能需要根据实际情况进行调整。首先,确保你已经在你的Colab环境中安装了beautifulsoup4和requests库。如果没有安装,你可以使用以下命令安装:然后,使用以下代码抓取并解析指定的网页内容:这段代码会打印出你提供的微信公众号文章的正文内容。请注意,由于网页的结构随时可能发生变化,所以提取正文内容的部分(即soup.find那一行)可能需要根据实际的HTML结构进行调整。如果文章有反爬虫机制,可能还需要进一步的处理,比如设置请求头模拟浏览器访问等。[heading3]运行你的代码[content]然后,把这两段代码分别复制进去,并运行。先复制第一段:!pip install beautifulsoup4 requests运行后得到下图到这里的pip,就是之前提到的「给未来商店打电话」,用来获取工具接下来,点击左上方「+代码」按钮,新建一个新的代码块最后,复制后面的代码,并运行,获得下面的结果:🎉恭喜你,爬虫写好了🎉[heading3]Tips[content]在和AI配合写代码的过程中,如果你遇到了Bug,类似: