API 就像是一个信差,它接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。
以“奥本海默”的搜索为例,比如像 themoviedb.org 这样的网站,其网址包含域名(www.themoviedb.org)用于定位网站,路径(/search)指定特定页面位置,查询参数(如 query=奥本海默)则明确具体的搜索内容。
对于 GPT 来说,使用 API 时首先要明确想要做什么样的 GPT 以及是否需要外部数据,然后去寻找所需的外部数据的 API 文档,或者自己开发 API 以及寻找市面上可用的 Action。对于一些不熟悉的 API,需要在 Prompt 里告知如何使用。
如果您对 Action 很感兴趣,可以从系统学习 API 相关知识、在网上寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续前进。
总结一下:今天我们的讨论起始于人工智能中的“Agent&Action”,然后转向OpenAI对智能体(Agent)能力模型的定义。接着,我们深入探讨了ChatGPT中的Action(搜索、画图、代码解释器),以及GPT系列中的不同Action。使用了一个容易上手的Action Webpilot,用于访问网页获取实时的文本内容。最后,我们初步了解了API的概念,以及GPT如何通过Action与外部数据进行交互和使用。如果对Action很感兴趣,你可以从以下方向开始继续前进:系统的了解和学习API相关的知识去网上寻找可以用的API来练习发掘GPT Action更多的潜力以上是我认为相对容易入门的知识框架,但是我们都知道:你不可能只在一次分享/一篇文章中就获得完整的Action相关知识学习虽然没有终点,但有阶段性目标。大家可以通过后续看到的不同的教程和资料,识别这些知识之间的共性和逻辑关系,然后继续深化对这个主题的理解,构建你自己的知识体系。如果你对GPT开发有兴趣,想要认识更多玩GPT的朋友,欢迎加入GPTGeeker的星球:
这是第一个结果的数据,对应了搜索结果页的内容,你会发现展现的内容远比数据维度要少——这是因为有些数据虽然不展现,但为了支持筛选所保留的。注意看,这里出现了‘backdrop_path’,记得原先Prompt是怎么写的吗:取出backdrop_path这个数据作为主视觉图——所以这里是一个图片地址(),但它是不完整的,只有后半部分。就像是一个分成两块的藏宝图,两部分拼起来才是完整的图片地址。TMDb的官方API文档(https://developer.themoviedb.org/docs/image-basics)里就写了如何构造完整的图片URL:但是因为我们的Baby GPT已经是一个成熟的GPT了。实际上,它已经有TMDb的训练数据了(相当于裤兜里已经有半拉地图了)——所以即使你不说,它也会自己完成构建完整的图片地址。对于一些它不熟悉的API,还是需要在Prompt里告诉他要怎样使用。比如剩下的数据也可以用类似的方式让ChatGPT来处理,比如让他列出:上映时间'release_date'、评分'vote_average'、评分人数'vote_count':它就能很+我们最后提炼一下Action的工作流:首先,想一下你想要做一个什么样的GPT,以及是否需要外部数据——这两个谁先谁后不重要;然后,去你需要的外部数据寻找API文档,或者基于你的需求,自己开发一个API,寻找市面上可以直接用的Action;最后,基于API文档,编写Action里的Schema,和Prompt(如何处理取回来的信息)写在最后
这个页面大家应该一眼就能看明白,这是一个搜索结果页,搜索的关键词是“奥本海默”,返回了两个结果,每个结果的信息都有海报、名称、上映时间、描述。这个页面的网址是这样的:https://www.themoviedb.org/search?query=奥本海默域名(www.themoviedb.org):域名指定了网站的位置,类似地图上的地址。在这个URL中,www.themoviedb.org是themoviedb.org网站的域名,用于定位和访问网站。为了方便理解,我把URL和Schema里的红框部分做一个对应关系,你会发现他们不一样,这是因为一个是面向普通用户,一个是面向开发者的。就和ChatGPT网页版和ChatGPT API的关系差不多。路径(/search):路径指定了在网站上特定页面的位置。在这个例子中,路径是/search,通常表示网站的搜索页面或功能。query,就是一个“查询参数”,其中query是参数的名称,奥本海默是分配给该参数的值。这个网址完整的意思是:访问themoviedb.org网站上的搜索功能,执行一个搜索“奥本海默”关键词的操作——我要找一个名叫“奥本海默”的电影。有些同学在写提示词的时候会用这种等号或者冒号的方式,其实都是一种变量的形式,请记住这个感觉,后面我们会继续用到这个概念。也就是说:刚刚TMDB的Action实际上就是访问了下面的网址,提供了query和language参数,然后发起了请求,获取数据,如下:但虽然我们大致理解了GPT发送请求是怎么回事,你可能有个问题一直在想:我要如何才能知道去哪请求,查询参数怎么写呢?寻找API文档