API 就像是一个信差,它接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。
以搜索“奥本海默”电影为例,在这个过程中,通过特定的网址(如 https://www.themoviedb.org/search?query=奥本海默 ),其中域名(www.themoviedb.org)指定了网站的位置,路径(/search)指定了特定页面的位置,而 query(奥本海默)则是查询参数。
在 GPT 中,它可以通过预先配置的 Action 里的 TMDB API 获取电影相关的专有信息。当您询问“奥本海默”这部电影讲了什么时,GPT 会识别您的意图,使用 Action 去 The Movie DB 寻找相关数据,处理并返回最终结果。
配置一个 Action 通常需要:Schema(相当于操作手册,告诉它可以去哪、干什么、需要准备什么)、Available actions(可用行动)、Authentication(认证)、Privacy policy(隐私政策)。但 Schema 的结构可能涉及前端工程师相关领域的知识。
如果您对 Action 很感兴趣,可以从系统学习 API 相关知识、寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续深入。
这个页面大家应该一眼就能看明白,这是一个搜索结果页,搜索的关键词是“奥本海默”,返回了两个结果,每个结果的信息都有海报、名称、上映时间、描述。这个页面的网址是这样的:https://www.themoviedb.org/search?query=奥本海默域名(www.themoviedb.org):域名指定了网站的位置,类似地图上的地址。在这个URL中,www.themoviedb.org是themoviedb.org网站的域名,用于定位和访问网站。为了方便理解,我把URL和Schema里的红框部分做一个对应关系,你会发现他们不一样,这是因为一个是面向普通用户,一个是面向开发者的。就和ChatGPT网页版和ChatGPT API的关系差不多。路径(/search):路径指定了在网站上特定页面的位置。在这个例子中,路径是/search,通常表示网站的搜索页面或功能。query,就是一个“查询参数”,其中query是参数的名称,奥本海默是分配给该参数的值。这个网址完整的意思是:访问themoviedb.org网站上的搜索功能,执行一个搜索“奥本海默”关键词的操作——我要找一个名叫“奥本海默”的电影。有些同学在写提示词的时候会用这种等号或者冒号的方式,其实都是一种变量的形式,请记住这个感觉,后面我们会继续用到这个概念。也就是说:刚刚TMDB的Action实际上就是访问了下面的网址,提供了query和language参数,然后发起了请求,获取数据,如下:但虽然我们大致理解了GPT发送请求是怎么回事,你可能有个问题一直在想:我要如何才能知道去哪请求,查询参数怎么写呢?寻找API文档
总结一下:今天我们的讨论起始于人工智能中的“Agent&Action”,然后转向OpenAI对智能体(Agent)能力模型的定义。接着,我们深入探讨了ChatGPT中的Action(搜索、画图、代码解释器),以及GPT系列中的不同Action。使用了一个容易上手的Action Webpilot,用于访问网页获取实时的文本内容。最后,我们初步了解了API的概念,以及GPT如何通过Action与外部数据进行交互和使用。如果对Action很感兴趣,你可以从以下方向开始继续前进:系统的了解和学习API相关的知识去网上寻找可以用的API来练习发掘GPT Action更多的潜力以上是我认为相对容易入门的知识框架,但是我们都知道:你不可能只在一次分享/一篇文章中就获得完整的Action相关知识学习虽然没有终点,但有阶段性目标。大家可以通过后续看到的不同的教程和资料,识别这些知识之间的共性和逻辑关系,然后继续深化对这个主题的理解,构建你自己的知识体系。如果你对GPT开发有兴趣,想要认识更多玩GPT的朋友,欢迎加入GPTGeeker的星球:
在这个例子里,GPT就通过预先配置的Action里的TMDB API,获取了电影相关的专有信息。当我问“奥本海默”这部电影讲了什么之后:GPT识别到了我的意图,按照Prompt进行第一个任务。使用Action去The Movie DB寻找相关数据,从数据中取出backdrop_path这个数据作为主视觉图,然后处理剧情数据、生成背景知识。最后使用webpilot搜索评价,返回整理后的数据,也就是最终你看到的结果:接下来,我们继续深入GPT Action的配置项:配置一个Action,你需要:Schema:(下图)通过导入或者直接填写,相当于给Baby GPT的一个📓操作手册,告诉它可以去哪,干什么,需要准备什么。这个示例的版本很简单,真正的会更复杂一些。Available actions:(上图)可用行动,在你输入Schema后会自动生成,展示大纲中可以使用的行动,对应operationId,get,path——加入操作手册是本魔法书,Available actions就是可以用的魔法Authentication:(上图)认证,可以理解成身份证,没带证件不能请求数据Privacy policy:(上图)隐私政策,因为Baby GPT会携带用户的需求访问别的服务器,所以需要一个隐私声明,这个一般在网站底部都可以找到,把网址填进去就行。然后来看Schema的结构:是不是有点懵?懵就对了,这已经是前端工程师相关领域的知识了,我们的知识体系里还没有建立这些信息的映射关系。