直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

API是什么意思

回答

API 就像是一个信差,它接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。

以搜索“奥本海默”为例,在网址 https://www.themoviedb.org/search?query=奥本海默 中,域名 www.themoviedb.org 用于定位网站,路径 /search 表示搜索页面,query 是查询参数,其值为“奥本海默”。

对于获取数据的操作,如在 TMDb 中,有些数据虽然不展现,但为了支持筛选会保留。像“backdrop_path”是不完整的图片地址,TMDb 的官方 API 文档里有如何构造完整图片 URL 的说明。对于一些不熟悉的 API,需要在 Prompt 里告知如何使用。

Action 的工作流大致为:先思考要做什么样的 GPT 以及是否需要外部数据;然后寻找所需外部数据的 API 文档,或自己开发 API,寻找可用的 Action;最后基于 API 文档编写 Action 里的 Schema 和 Prompt 来处理取回的信息。

如果对 Action 感兴趣,可以系统学习 API 相关知识、寻找可用的 API 练习、发掘 GPT Action 更多潜力。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

像高手一样编写 GPT:从基础到实践,学习使用 GPT 的 Action

[title]像高手一样编写GPT:从基础到实践,学习使用GPT的Action[heading1]API就像是一个信差,它接受一端的请求,告诉那边的系统你想要做的事情,然后把返回的信息发回给你。这个页面大家应该一眼就能看明白,这是一个搜索结果页,搜索的关键词是“奥本海默”,返回了两个结果,每个结果的信息都有海报、名称、上映时间、描述。这个页面的网址是这样的:https://www.themoviedb.org/search?query=奥本海默域名(www.themoviedb.org):域名指定了网站的位置,类似地图上的地址。在这个URL中,www.themoviedb.org是themoviedb.org网站的域名,用于定位和访问网站。为了方便理解,我把URL和Schema里的红框部分做一个对应关系,你会发现他们不一样,这是因为一个是面向普通用户,一个是面向开发者的。就和ChatGPT网页版和ChatGPT API的关系差不多。路径(/search):路径指定了在网站上特定页面的位置。在这个例子中,路径是/search,通常表示网站的搜索页面或功能。query,就是一个“查询参数”,其中query是参数的名称,奥本海默是分配给该参数的值。这个网址完整的意思是:访问themoviedb.org网站上的搜索功能,执行一个搜索“奥本海默”关键词的操作——我要找一个名叫“奥本海默”的电影。有些同学在写提示词的时候会用这种等号或者冒号的方式,其实都是一种变量的形式,请记住这个感觉,后面我们会继续用到这个概念。也就是说:刚刚TMDB的Action实际上就是访问了下面的网址,提供了query和language参数,然后发起了请求,获取数据,如下:但虽然我们大致理解了GPT发送请求是怎么回事,你可能有个问题一直在想:我要如何才能知道去哪请求,查询参数怎么写呢?寻找API文档

像高手一样编写 GPT:从基础到实践,学习使用 GPT 的 Action

[title]像高手一样编写GPT:从基础到实践,学习使用GPT的Action[heading1]API就像是一个信差,它接受一端的请求,告诉那边的系统你想要做的事情,然后把返回的信息发回给你。总结一下:今天我们的讨论起始于人工智能中的“Agent & Action”,然后转向OpenAI对智能体(Agent)能力模型的定义。接着,我们深入探讨了ChatGPT中的Action(搜索、画图、代码解释器),以及GPT系列中的不同Action。使用了一个容易上手的Action Webpilot,用于访问网页获取实时的文本内容。最后,我们初步了解了API的概念,以及GPT如何通过Action与外部数据进行交互和使用。如果对Action很感兴趣,你可以从以下方向开始继续前进:系统的了解和学习API相关的知识去网上寻找可以用的API来练习发掘GPT Action更多的潜力以上是我认为相对容易入门的知识框架,但是我们都知道:你不可能只在一次分享/一篇文章中就获得完整的Action相关知识学习虽然没有终点,但有阶段性目标。大家可以通过后续看到的不同的教程和资料,识别这些知识之间的共性和逻辑关系,然后继续深化对这个主题的理解,构建你自己的知识体系。如果你对GPT开发有兴趣,想要认识更多玩GPT的朋友,欢迎加入GPTGeeker的星球:

像高手一样编写 GPT:从基础到实践,学习使用 GPT 的 Action

[title]像高手一样编写GPT:从基础到实践,学习使用GPT的Action[heading1]API就像是一个信差,它接受一端的请求,告诉那边的系统你想要做的事情,然后把返回的信息发回给你。这是第一个结果的数据,对应了搜索结果页的内容,你会发现展现的内容远比数据维度要少——这是因为有些数据虽然不展现,但为了支持筛选所保留的。注意看,这里出现了‘backdrop_path’,记得原先Prompt是怎么写的吗:取出backdrop_path这个数据作为主视觉图——所以这里是一个图片地址(),但它是不完整的,只有后半部分。就像是一个分成两块的藏宝图,两部分拼起来才是完整的图片地址。TMDb的官方API文档(https://developer.themoviedb.org/docs/image-basics)里就写了如何构造完整的图片URL:但是因为我们的Baby GPT已经是一个成熟的GPT了。实际上,它已经有TMDb的训练数据了(相当于裤兜里已经有半拉地图了)——所以即使你不说,它也会自己完成构建完整的图片地址。对于一些它不熟悉的API,还是需要在Prompt里告诉他要怎样使用。比如剩下的数据也可以用类似的方式让ChatGPT来处理,比如让他列出:上映时间'release_date'、评分'vote_average'、评分人数'vote_count':它就能很+我们最后提炼一下Action的工作流:首先,想一下你想要做一个什么样的GPT,以及是否需要外部数据——这两个谁先谁后不重要;然后,去你需要的外部数据寻找API文档,或者基于你的需求,自己开发一个API,寻找市面上可以直接用的Action ;最后,基于API文档,编写Action里的Schema,和Prompt(如何处理取回来的信息)写在最后

其他人在问
cozeAPI身份验证无效的解决方案
很抱歉,目前知识库中没有关于“cozeAPI 身份验证无效”的解决方案。但一般来说,遇到身份验证无效的问题,您可以尝试以下几种常见的解决方法: 1. 检查您输入的认证信息是否准确,包括用户名、密码、密钥等。 2. 确认您的账号是否已被激活或处于正常状态。 3. 检查网络连接是否稳定,有时网络问题可能导致验证失败。 4. 查看相关的 API 文档,了解身份验证的具体要求和可能的错误情况。 5. 尝试重新生成或更新认证凭证。 如果问题仍然存在,建议您进一步查阅相关技术资料或联系 API 提供方的技术支持获取更准确的帮助。
2024-10-14
opeai api接口在哪里
OpenAI 通过两种方式提供服务: 1. 通过 ChatGPT,提供开箱即用的服务,直接对话即可,简单直观。 2. 通过 OpenAI API,提供更加灵活的服务,通过代码调用,来完成更多自动化任务,比如全自动将本地的 1 万本小说从中文翻译成英文。 如果您想获取 OpenAI API 接口,可以按照以下步骤进行: 1. 搭建 ,这东西是为了汇聚整合多种大模型接口,方便您后面更换使用各种大模型。下面会告诉您怎么去白嫖大模型接口。 2. 搭建 ,这东西就是个知识库问答系统,您把知识文件放进去,再把上面的大模型接进来,作为分析知识库的大脑,最后回答您的问题。如果您不想接到微信去,自己用用,其实到这里搭建完就 OK 了,它也有问答界面。 3. 搭建 ,里面的 cow 插件能进行文件总结、MJ 绘画的能力。 完成上面 3 步就算 OK 了。
2024-10-05
coze 中插件的API怎么查看
在 Coze 中查看插件的 API 可以按照以下步骤进行: 1. 点击个人空间,选择插件,然后点击创建插件。 2. 创建插件时,需要注意以下几点: 插件名称:使用中文,根据插件需求起名。 插件描述:向观众说明插件的用途和使用方法等。 插件工具创建方式: 云侧插件 基于已有服务创建:使用现成的 API 来创建插件,选择此方式后,会有一个必填项,即要填入所使用 API 的 URL。 云侧插件 在 Coze IDE 中创建:使用 Coze 的服务器写代码来直接搭建 API(支持 Python 和 Node.JS)。
2024-09-12
有没有语音转文字的API或者是应用呢?
以下是一些语音转文字的 API 或应用: 基于开源大型v2 Whisper 模型的语音转文本 API,提供转录和翻译两个端点,可用于将音频转录为任何语言或翻译并转录成英语。目前文件上传限制为 25MB,支持的输入文件类型包括 mp3、mp4、mpeg、mpga、m4a、wav 和 webm。 OpenAI 的 wishper:https://huggingface.co/openai/whisperlargev2 ,还有相关项目:https://huggingface.co/spaces/sanchitgandhi/whisperjax ,该项目在 JAX 上运行,后端支持 TPU v48,与 A100 GPU 上的 PyTorch 相比,速度快 70 多倍,是目前最快的 Whisper API。 出门问问的语音合成(TTS)API: 接口请求域名:https://open.mobvoi.com/api/tts/v1 接口请求频率限制:5 次/秒 可以将任意文本转化为语音,应用场景广泛,如视频 APP 配音解说、小说 App 有声阅读、移动 App 语音播报新闻、智能设备语音提醒、车载导航语音合成的个性化语音播报等。提供普通话、台湾腔、粤语、四川话、东北话等多种方言,数百个发音人,上千种风格,实时合成支持 SSML,语法详见 SSML 标记语言。请求参数方面,HTTP Method 支持 POST 请求。
2024-09-12
基于Python调用目前最新的open ai的api
以下是基于 Python 调用目前最新的 OpenAI 的 API 的方法: 首先,我们提供了一个 Python 库,您可以按如下方式安装: ``` $ pip install openai ``` 安装后,可以使用绑定和 API Key 运行以下命令: ```python import os import openai Load your API key from an environment variable or secret management service openai.api_key = os.getenv response = openai.Completion.create ``` 绑定还将安装一个命令行实用程序,您可以按如下方式使用: ``` $ openai api completions.create m textdavinci003 p"Say this is a test"t 0 M 7 stream ``` ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,您可以使用 gpt3.5turbo 构建您自己的应用来做以下事情: 起草一份邮件或者其他文字内容 写 Python 代码 回答关于一组文档的问题 创建会话代理 给您的软件提供一个自然语言的接口 辅导各种学科 语言翻译 假扮成游戏中或其他内容的角色 这个指引说明了如何。 另外,在当地时间 6 月 13 日,OpenAI 发布函数调用及其他 API 更新。现在开发人员可以向 gpt40613 和 gpt3.5turbo0613 描述函数,并让模型智能地选择输出一个包含调用这些函数所需参数的 JSON 对象。这是一种更可靠地将 GPT 的能力与外部工具和 API 连接起来的新方法。传送门: 官网有很详细的例子。
2024-09-10
API
API 就像是一个信差,它接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。 对于一些它不熟悉的 API,还是需要在 Prompt 里告诉它如何使用。比如剩下的数据也可以用类似的方式让 ChatGPT 来处理,比如让它列出:上映时间“release_date”、评分“vote_average”、评分人数“vote_count”。 在例子中,GPT 可以通过预先配置的 Action 里的 TMDB API 获取电影相关的专有信息。当询问“奥本海默”这部电影讲了什么之后,GPT 会识别意图,按照 Prompt 进行任务,使用 Action 去 The Movie DB 寻找相关数据,取出 backdorp_path 作为主视觉图,处理剧情数据、生成背景知识,使用 webpilot 搜索评价,返回整理后的数据。 配置一个 Action 需要: 1. Schema:相当于给 Baby GPT 的操作手册,告诉它可以去哪,干什么,需要准备什么。 2. Available actions:可用行动,在输入 Schema 后会自动生成,展示大纲中可以使用的行动,对应 operationId,get,path 。 3. Authentication:认证,可以理解成身份证,没带证件不能请求数据。 路径:指定了在网站上特定页面的位置。query 是“查询参数”,其中 query 是参数的名称,奥本海默是分配给该参数的值。完整的网址意思是访问 themoviedb.org 网站上的搜索功能,执行一个搜索“奥本海默”关键词的操作。 要知道去哪请求和查询参数怎么写,去官网找,API 的规则一般都会写在网站的开发者相关的页面里或者 API 文档里,比如可以从 TMDB 首页的“更多”进入,其它网站也大同小异。
2024-09-02
国内有适合做新媒体平台创意思路的ai软件,例如抖音、小红书等,
目前对于适合国内新媒体平台(如抖音、小红书等)创意思路的 AI 软件,还没有明确的定论。但我们可以先从内容创作的角度来思考。之前汉青老师分享时提到,生成式 AI 的内容与传统社交媒体内容共存,如小红书、抖音、微信等。短期内,大家可能因新鲜感获得流量红利,但最终人们在意的仍是高质量的内容。 我们虽掌握了各种先进工具,如在 MJ 里用关键词出图、用 SD 做复杂工作流、制作炫酷宣传片等,但在此我们先不讨论工具,而是专注于内容。让节奏慢下来,认真感受真实世界,关注身边通常被一扫而过的普通人。 比如偶然在朋友朋友圈刷到的题材:“这两张照片其实是在同一条街道上拍下的,只不过年轻的女孩在街上,孤独的老人在围墙里。”“这张照片传递两种关系、一种爱意,年轻人手牵着怀孕的爱人,老母亲扶着女儿坐上电动车,这应该是这个世界最稳固的两种关系,而现在他们相遇在一张照片当中。”“很多人把生活当中的便利,比如电商快递外卖速度快便宜看着是我们的移动互联网优势,其实唯一的优势是我们的劳动力,无数个在深夜独自啃着馒头的年轻人支撑着美团阿里的市值...放大镜头看你会发现这其实是一个非常年轻的女孩子,她瘦小,即使戴了头盔也比后面的箱子高不了多少,她进食的时候甚至都没玩手机——我骑车路上看到过很多快递小哥都是边骑车边刷短视频,这至少说明他们对生活中的乐子还充满期待,而图中的女孩看着让人垂头丧气,不仅是她,也包括我。” 关于如何与 AI 结合来为新媒体平台创作优质内容,目前还没想好,也没完全想明白,需要慢慢思考和探索。
2024-10-18
agent什么意思
“智能体”(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 从以下几个方面详细介绍: 1. 定义:智能体是一种自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。 2. 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分: 规划:将大型任务分解为更小、可管理的子目标,有效处理复杂任务。 反思和完善:对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 记忆:包括短期记忆(所有的上下文学习利用模型的短期记忆来学习)和长期记忆(为 Agents 提供长时间保留和回忆无限信息的能力,通常通过利用外部向量存储和快速检索实现)。 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 从产品角度思考 Agent 设计: Who:Agent 可以是一个历史新闻探索向导,具有知识渊博、温暖亲切、富有同情心的性格,主导新闻解析和历史背景分析。为使角色生动,可为其设计背景故事,明确起源、经历和动机,定义性格特点、说话方式和风格,设计对话风格,明确核心功能及附加功能。 在 AI 大模型中,agent 是比较火的概念,被认为是大模型未来的主要发展方向。中间的“智能体”其实就是 LLM 或大模型,四个箭头分别是为 LLM 增加的工具、记忆、行动、规划四个能力。目前行业里主要用到的是一个叫 langchain 的框架,它把 LLM 和 LLM 之间以及 LLM 和工具之间通过代码或 prompt 的形式进行串接,在 prompt 层和工具层完成主要的设计逻辑。
2024-10-08
RAG什么意思
RAG 是检索增强生成(RetrievalAugmented Generation)的缩写,是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给 AI 大模型,让大模型“知道”我们的私有知识,变得越来越“懂”我们。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。 RAG 的最常见应用场景包括知识问答系统,用户提出问题,RAG 模型从大规模的文档集合中检索相关的文档,然后生成回答。 大模型存在一些缺点,如无法记住所有知识尤其是长尾知识、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高,而 RAG 具有一些优点,如数据库对数据的存储和更新稳定、数据更新敏捷且可解释、能降低大模型输出出错的可能、便于管控用户隐私数据、可降低大模型的训练成本。 一个 RAG 的应用可以抽象为 5 个过程:文档加载(从多种不同来源加载文档)、文本分割(把文档切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量形式并存储到向量数据库)、检索(通过检索算法找到与输入问题相似的嵌入片)、输出(把问题以及检索出来的嵌入片一起提交给 LLM 生成答案)。
2024-10-08
open ai 与 GPT 与 chat GPT 的关系,分别什么意思
OpenAI 是致力于推动人工智能发展的研究公司。 ChatGPT 是由 OpenAI 研发的一款 AI 技术驱动的自然语言处理(NLP)聊天工具,于 2022 年 11 月 30 日发布。从 OpenAI 的官网信息来看,ChatGPT 最初被称为一种模型,目前逐渐演变成一种可以兼容多种 GPT 模型的聊天应用(服务)。目前 ChatGPT 依赖 GPT 系列模型来运转,使用的是 GPT4 的大型语言模型(LLM)。 GPT 是生成式预训练变换器,ChatGPT 是基于 GPT 架构的人工智能模型。目前 ChatGPT 官网有 GPT3.5 和 GPT4 两个版本,GPT3.5 是免费版本,GPT4 则需要升级到 PLUS 套餐(20 美金一个月)才能使用更多功能,还有团队版和企业版,功能更多但费用更贵。
2024-09-26
agent是什么意思
“Agent”(智能体)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体的类型包括: 1. 简单反应型智能体(Reactive Agents):根据当前感知输入直接采取行动,不维护内部状态,不考虑历史信息。例如温控器,根据温度传感器输入直接打开或关闭加热器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入建模,能推理未来状态变化并据此采取行动。比如自动驾驶汽车,不仅感知当前环境,还维护和更新周围环境模型。 3. 目标导向型智能体(Goalbased Agents):除感知和行动外,具有明确目标,能根据目标评估不同行动方案并选择最优行动。像机器人导航系统,有明确目的地并计划路线以避开障碍。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动优劣并权衡利弊。例如金融交易智能体,根据不同市场条件选择最优交易策略。 5. 学习型智能体(Learning Agents):能够通过与环境交互不断改进性能,学习模型、行为策略以及目标函数。比如强化学习智能体,通过与环境互动不断学习最优策略。 在产品角度,我们的 Agent 可以是一个历史新闻探索向导,其身份为历史新闻探索向导,性格知识渊博、温暖亲切、富有同情心,角色是主导新闻解析和历史背景分析。为使角色更生动,可为其设计简短背景故事,比如曾是一位对世界重大历史事件了如指掌、充满热情且愿意分享知识的历史学家。写好角色个性需考虑角色背景和身份(编写背景故事,明确起源、经历和动机)、性格和语气(定义性格特点,如友好、幽默、严肃或神秘,确定说话方式和风格)、角色互动方式(设计对话风格,从基本问答到深入讨论)、角色技能(明确核心功能,如提供新闻解析、历史背景分析或心理分析,增加附加功能以提高吸引力和实用性)。正如《》所写,个性化定制的“虚拟伴侣”能得到用户认可,是因为精准击中许多年轻人无处可藏的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”“承诺”三个要素。
2024-09-25
AI 指令精调版本是什么意思
AI 指令精调版本指的是:对于在通用数据集上预训练的模型,进行复制后,以这些学习到的权重为起点,在新的特定领域数据集上重新训练模型。这种技术在很多不同的用例中都非常有效。 指令调整可以使模型更好地遵循指令。例如在生成式人工智能项目中,对于一个预训练过的模型,可以通过微调来获得更好的回答。在大型语言模型中,通过在格式化为指令的任务混合物上对模型进行微调,可以获得并增强遵循提示的能力。经过指令调整的模型能够更准确地遵循指令,在未见任务上的表现显著优于未调整的模型,将大型语言模型转变为通用任务解决器,是 AI 发展历史上的一个范式转变。 但当对大型语言模型(LLM)进行微调时,会遇到一些挑战。因为 LLM 规模较大,更新每个权重可能需要很长时间的训练工作,同时还涉及到为这个巨大模型提供服务的麻烦和成本等问题,所以微调大型语言模型可能不是最佳选择。
2024-09-19