Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Claude3/grok3/Gemini使用API调用时消耗token的价格是?

Answer

Claude 3 的 API 调用价格为:每百万输入 token 0.25 美元,每百万输出 token 1.25 美元。可以处理和分析 400 起最高法院案件或 2500 张图片只需 1 美元。相关链接:https://x.com/imxiaohu/status/1768284259792691366?s=20

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

🔔Xiaohu.AI日报「3月14日」✨✨✨✨✨✨✨✨1⃣️🤖Claude 3 Haiku API发布:最快、性价比最高的型号。每百万输入token 0.25美元,每百万输出token 1.25美元。可以处理和分析400起最高法院案件或2500张图片只需1美元。🔗https://x.com/imxiaohu/status/1768284259792691366?s=202⃣️🚀Starship第三次飞行测试:SpaceX星际飞船成功发射进入预定轨道。重达5000吨,成为有史以来最大的飞行器。🔗https://x.com/imxiaohu/status/1768273741262520394?s=203⃣️🚫Midjourney禁止生成拜登和特朗普的图片:以应对美国总统选举,禁止生成拜登和特朗普的虚假图片。测试发现尝试生成特定图片时会收到警告。CEO David Holz强调不想在政治言论上花费太多时间。🔗https://x.com/imxiaohu/status/1768258401518362625?s=204⃣️💻零一万物大模型开放API接口:1000,000 tokens最低6元。🔗https://x.com/imxiaohu/status/1768253143098540518?s=205⃣️🎨Muse Pro:一款专为iPad设计的AI实时画图应用:实现实时绘画,每一笔触即时转化为数字画面。支持图像快速增强和放大,适合直接打印。主要特色包括实时绘画、图像增强、直观设计与高级图层、自定义画笔。

XiaoHu.AI日报

🔔Xiaohu.AI日报「3月14日」✨✨✨✨✨✨✨✨1⃣️🤖Claude 3 Haiku API发布:最快、性价比最高的型号。每百万输入token 0.25美元,每百万输出token 1.25美元。可以处理和分析400起最高法院案件或2500张图片只需1美元。🔗https://x.com/imxiaohu/status/1768284259792691366?s=202⃣️🚀Starship第三次飞行测试:SpaceX星际飞船成功发射进入预定轨道。重达5000吨,成为有史以来最大的飞行器。🔗https://x.com/imxiaohu/status/1768273741262520394?s=203⃣️🚫Midjourney禁止生成拜登和特朗普的图片:以应对美国总统选举,禁止生成拜登和特朗普的虚假图片。测试发现尝试生成特定图片时会收到警告。CEO David Holz强调不想在政治言论上花费太多时间。🔗https://x.com/imxiaohu/status/1768258401518362625?s=204⃣️💻零一万物大模型开放API接口:1000,000 tokens最低6元。🔗https://x.com/imxiaohu/status/1768253143098540518?s=205⃣️🎨Muse Pro:一款专为iPad设计的AI实时画图应用:实现实时绘画,每一笔触即时转化为数字画面。支持图像快速增强和放大,适合直接打印。主要特色包括实时绘画、图像增强、直观设计与高级图层、自定义画笔。

不懂代码,也能 3 小时打造并上架一款 AI 插件

纯靠词生卡Prompt完成卡片样式输出,固然是非常灵活的AI智能体方案。但倘若在最终落地产品中,还是每次都依赖大模型重新生成卡片的样式代码,反而会消耗大量的输出token,耗时且不经济。此外,在实际使用中,用户通常只固定使用一到两个常用模板,对自定义样式的需求并不频繁。所以在开发AI Share Card插件的过程中,我选择将模板生成功能设计为固定的代码组件,而让大模型专注于内容总结的功能。如果用户需要选择其他模板,则通过增加更多模板选项or自定义模板代码功能实现。如此一来,对AI大模型的要求就不会动辄需要像Claude 3.5 sonnet那样高不可攀的顶级模型。处理纯文本总结任务,仅需13B或更小参数的模型,加上精调的提示词,就能产生很好的结果。一旦明确模型的任务,AI API服务的选型要求就清晰了:1.较长的上下文窗口:内容总结类任务需要较大的上下文长度;2.响应速度要快、并发支持要高:以便在多人使用插件时,保持良好的性能表现;3.免费或尽量低价:减少模型token费用。经过简单调研后,AI Share Card选用的是GLM-4-flash(没恰饭。截至2024-12,长达128k的上下文窗口,完全免费的调用价格,200 RPM高并发支持,还要什么自行车🚲~)

Others are asking
Claude3.5免费的模型和付费的模型有什么区别
Claude 3.5 的免费模型和付费模型主要有以下区别: 1. 功能与性能:付费的 Opus 模型在某些方面可能具有更强大的功能和更出色的性能。 2. 访问权限:所有新用户有 14 天的 Pro 试用期,可访问所有 Pro 功能。14 天后未升级的用户将恢复为 Hobby 计划。 3. 快速请求:默认情况下,服务器会尝试给所有用户快速的高级模型请求,但高峰期时,用完快速高级积分的用户可能会被移到慢速池等待。若不想等待,可在设置页面添加更多请求。 4. 对话轮次:免费版本每小时的对话轮次有限制。 5. 费用:Pro 版本每月 20 美刀。 6. 注册要求:注册需要海外手机号。 7. 模型种类:免费用户可用 Claude 3 Sonnet 模型,订阅后可用 Opus 模型。
2024-10-26
Claude3 入口
Claude 3 是由 Anthropic 公司发布的 AI 模型系列,域名是 http://claude.ai ,包括 Haiku、Opus、Sonnet 三款模型。其具有高性能、多语言能力、突破性速度、视觉识别、减少错误率等特点。Opus 和 Sonnet 模型已上线,向全球 159 国开放,Haiku 模型即将推出。该系列模型提供实时反应,出色的多语言处理能力,减少错误拒绝并提升准确率,具有长期记忆能力。模型根据功能分别注重智能(Opus)、平衡(Sonnet)和速度(Haiku),并有明确的成本和适用场景。Claude 3 模型设计注重安全可靠,努力减少偏见,提高公正性和中立性,并已被评定为 AI 安全等级 2。在多个基准测试中取得了最先进的结果,在非英语语言的流畅度上有所提高,更适合全球受众。Claude 3 Opus 在推理、数学和编码方面设定了新的标准,Haiku 则是市场上最快速且成本最低的模型,同时具备视觉能力。通过多模态输入能力(文本输出)和工具使用(功能调用)提供了丰富的上下文和扩展用例。相关文档有简体中文版,且可编辑,但不要随便改动他人内容。Anthropic 公司宣称 Claude 3 全面超越 GPT4,具有多模态能力,推理能力和人类相当,速度更快更准确。其元数据包括标题、作者、链接、标签等。其核心观点与亮点在于介绍了模型家族在多方面的出色表现,并在安全性和社会影响方面进行了深入分析,致力于开发安全、负责任的 AI 系统,以支持多种应用场景。 您可以通过以下链接获取更多详细信息:https://wwwcdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Claude_3.pdf
2024-09-28
grok3 有什么特点
Grok 3 具有以下特点: 1. 包含两个模型版本:Grok 3 和 Grok 3mini。 2. 在 AIME 和 GPQA 在内的基准测试中显著优于其他模型,在数学推理、代码处理、科学问题方面表现优秀。 3. 具备推理能力,在提供更多测试计算时间的情况下,优于 o1 和 R1。 4. 新增“Deep Search”能力,能深入了解用户目的,访问并交叉验证多个信息源,确保研究内容更准确,并公开执行搜索所采取的步骤。 5. 可以调用 Big Brain 功能,加强计算来解决问题。 6. 现场演示中能生成游戏设计方案。 7. 语音模式在大约一周内推出。 8. API 几周后推出。 9. 今天向所有 Premium+订阅者推出(IOS、网页版都有),完整版在网页版,APP 上的 Grok 3 有一定削弱。(还有单独会员叫:SuperGrok)今天所有该类用户都能用上。 10. Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3 。 在评测方面,Grok 3 在基准测试中领先,但与竞争模型差距不大,整体表现比其他模型高出约 1 2%。Andrej Karpathy 认为 Grok 3 + Thinking 比 DeepSeek R1 强一些,接近 OpenAI 顶级模型,在测试中成功解决了多个复杂问题,但“DeepSearch”能进行高质量的检索类问题回答,尚需改进。 地址:https://huggingface.co/smirki/UIGENT1Qwen7b
2025-02-26
grok3 ai什么时候可用
Grok 3 已于今天向所有 Premium+ 订阅者推出(包括 IOS 和网页版),完整版在网页版,APP 上的 Grok 3 有一定削弱。(还有单独会员叫:SuperGrok)今天所有该类用户都能用上。Grok 3 语音模式在大约一周内推出,Grok 3 API 几周后推出,Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3 。
2025-02-19
grok3 发布会亮点内容
Grok 3 发布会的亮点内容包括: 1. 包含两个模型版本:Grok 3 和 Grok 3mini。 2. 在 AIME 和 GPQA 在内的基准测试中显著优于其他模型,在数学推理、代码处理、科学问题方面表现优秀。 3. 具备推理能力,在提供更多测试计算时间的情况下,优于 o1 和 R1。 4. 今天向所有 Premium+订阅者推出(IOS、网页版都有),完整版在网页版,APP 上的 Grok 3 有一定削弱。 5. 新增“Deep Search”能力,能深入了解用户目的,访问并交叉验证多个信息源,确保研究内容准确,并公开执行搜索步骤。 6. 可以调用 Big Brain 功能加强计算来解决问题。 7. 现场演示中,Grok 3 可以生成游戏设计方案。 8. Grok 3 语音模式在大约一周内推出。 9. Grok 3 API 几周后推出。 10. Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3。
2025-02-19
基础搭建的知识库效果很差,模型答案的幻觉很严重,我应该怎么改进?(Deepseek调用api接入本地faiss的rag库)
以下是一些改进基础搭建的知识库效果、减轻模型答案幻觉问题的建议: 1. 更换大模型:例如从 ChatGLM26B 替换成 baichuan213b,针对您的场景,后者的性能可能提升一倍左右。 2. 更换 embedding 模型:将 embedding 模型从 LangChain Chatchat 默认的 m3ebase 替换为 bgelargezh,后者可能更优。 3. 测试不同 Top k 的值:比较 Top 5、Top 10、Top 15 的结果,发现 Top 10 时效果可能最优。 4. 对文档名称进行处理:人工对文件进行重命名,上传相同文件构建知识库,同时在构建知识库时勾选【开启中文标题加强】选项,虽然重命名文件对结果的提升效果不明显,但勾选该选项后,回答的无关信息可能减少,效果有所提升。 RAG(RetrievalAugmented Generation)即检索增强生成,由检索器和生成器两部分组成。检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务。 在大模型中,向量可想象成空间中的点位,每个词或短语对应一个点。系统通过查看词在虚拟空间中点的位置,寻找直线距离最近的点来检索语义上接近的词语或信息。理解向量后,当收到一个对话时,RAG 的完整工作流程为:检索器从外部知识中检索相关信息,生成器利用这些信息生成答案。 要优化幻觉问题和提高准确性,需要了解从“问题输入”到“得到回复”的过程,针对每个环节逐个调优,以达到最佳效果。
2025-02-27
请介绍Coze开发平台中,扣子API有什么功能?怎么用它?
在 Coze 开发平台中,扣子 API 具有以下功能和使用方法: 获取 accessToken: 在 coze 界面右侧的扣子 API 授权,或者打开链接 https://www.coze.cn/open/oauth/pats 。 添加令牌,设置 token 的名称和过期时间(为安全起见,最多 1 个月)。 设置权限,可选择会话管理和对话,拿不准可全部选择,完成后点击“确定”按钮。 最后一定要点击按钮复制下拉获取令牌,此令牌只会出现一次。 获取 botid: 从“工作空间”打开一个 bot,点击商店按钮,查看地址栏中“bot/”之后的数字。 发布为 bot api: 注意在前端使用 bot 必须发布成为 API,点击发布,选择 API,等待审核通过。 此外,智能体沟通页面在 Zion 中采用 OAuth 鉴权机制,准备工作包括: 获取 Coze bot 应用鉴权密钥:在 Coze 主页点击左下方扣子 API,选择 Oauth 授权模式,添加新令牌并配置基本信息,创建 Key 过程中会生成公钥和私钥(私钥需单独下载保存),最后勾选全部权限。 获取 Bot ID:进入自己的智能体在地址栏内复制“bot/”之后的数字,且 bot 发布时要选择 Agent as API。 在 Coze 上发布 bot:发布时记得勾选 API 及 WEB SDK,Coze bot 发布有审核周期(1 30 分钟),需确认发布成功。 在扣子中手搓插件方面: Body:用于传递请求主体部分,GET 方法中通常不使用来传递参数。 Path:定义请求路径部分,GET 方法中可编码为 URL 一部分传递参数。 Query:定义请求查询部分,是 GET 方法中常用的参数传递方式。 Header:定义 HTTP 请求头信息部分,GET 方法中通常不用于传递参数。 配置输出参数:填对信息后可点击自动解析,若成功会显示并填好输出参数,然后保存并继续,建议填写参数描述。 调试与校验:测试工具能否正常运行,运行后查看输出结果,点击 Response 可看到解析后的参数。
2025-02-27
配置“DeepSeek-R1”模型的 API key:基础 URL:https://ark.cn-beijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。添加“DeepSeek-R1”模型。这个行为在Macbook中怎么操作,请进行指导,通过图片、文字、数据、网址等形式
在 Macbook 中配置“DeepSeekR1”模型的 API key 及添加模型的操作步骤如下: 1. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ 。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。若提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通(免费)。 确认无误后,点击“确认接入”按钮。 自动返回创建页面,复制多出的接入点名称“DeepSeekR1”。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有则点击【创建 API key】,复制并保存。 2. 配置“DeepSeekR1”模型的 API key: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 环境配置指南: 首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。若没有赠送余额,可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式,并创建一个 API key(注意及时保存,只会出现一次)。 以 cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline 。安装完后,打开三角箭头,选中 RooCline 并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek 。 API Key:填入已创建的 key 。 模型:选择 DeepSeekreasoner 。 语言偏好设置。 记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-26
有哪些AI工具具备文案写作、代码生成、API接口功能
以下是一些具备文案写作、代码生成、API 接口功能的 AI 工具: 1. OpenAI API:可以应用于几乎所有涉及生成自然语言、代码或图像的任务,提供了一系列不同能力级别的模型,适用于不同任务,并且能够微调您自己的自定义模型。 2. Ideogram 2.0:是目前 AI 设计能力较强的工具,文字生成效果好且准确(仅限英文),图像生成效果优于 Flux&Dalle·3,提供 API 接口,方便企业集成高级图像生成功能。 3. Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台,适用于多种语言。 4. Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,适用于改善写作风格和简洁性。 5. ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议,功能强大,支持多种平台和集成,特别适合专业写作者。 6. Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等,生成速度快,适合需要快速创作和灵感的用户。 7. Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。
2025-02-25
API是什么意思
API(Application Programming Interface,应用程序编程接口)就像是一个信差。它接受一端的请求,将您想要做的事情告知对应的系统,然后把返回的信息传递回给您。 例如在 GPT 中,通过预先配置的 Action 里的 TMDB API 可以获取电影相关的专有信息。当您询问某部电影的相关内容时,GPT 会识别您的意图,按照 Prompt 进行任务,使用 Action 去相应的数据库寻找相关数据,如取出 backdrop_path 作为主视觉图,然后处理剧情数据、生成背景知识,最后使用 webpilot 搜索评价并返回整理后的数据。 配置一个 Action 时,需要考虑 Schema(相当于操作手册,告诉 GPT 可以去哪、干什么、需要准备什么)、Available actions(可用行动,对应 operationId、get、path)、Authentication(认证,类似于身份证)、Privacy policy(隐私政策)。 Action 的工作流大致为:首先思考想要做什么样的 GPT 以及是否需要外部数据;然后去寻找所需的外部数据的 API 文档,或者自行开发 API,寻找可用的 Action;最后基于 API 文档编写 Action 里的 Schema 和 Prompt(处理取回信息的方式)。 如果对 Action 感兴趣,可以从系统学习 API 知识、在网上寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续深入。
2025-02-20
配置“DeepSeek-R1”模型的 API key:基础 URL 为 https://ark.cn-beijing.volces.com/api/v3,填好之后点击保存,关掉提醒弹窗。请对于这一步进行细节说明
以下是配置“DeepSeekR1”模型的 API key 的详细步骤: 1. 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ (火山引擎是字节跳动旗下的云服务平台)。 2. 创建一个接入点:点击在线推理创建推理接入点。 3. 为接入点命名为“DeepSeekR1”。如果出现“该模型未开通,开通后可创建推理接入点”的提示,点击“立即开通”,勾选全部模型和协议,一路点击开通(免费)。如果无提示则直接到第 5 步,点击确认接入。 4. 确认以下无误后,点击“确认接入”按钮。 5. 自动返回创建页面。发现多出一行接入点名是“DeepSeekR1”,复制这个推理点的 ID 放到微信里保存。 6. 保存后再点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。如果已经有 API key 了,就直接查看并复制。如果没有,则点击【创建 API key】,复制好之后,放到微信里保存。 7. 也可以使用其他插件,下面为举例示意使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 8. 打开聊天页面,点击右上角的插件列表,找到 Page Assist 插件,点击打开。 9. 基础 URL 填写:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 10. 配置完成。
2025-02-15
gemini
Google 的多模态大模型叫 Gemini。Gemini 是由 Google DeepMind 团队开发的,它不仅支持文本、图片等提示,还支持视频、音频和代码提示。能够理解和处理几乎任何输入,结合不同类型的信息,并生成几乎任何输出。被称为 Google 迄今为止最强大、最全面的模型,是一种“原生多模态大模型”,从设计之初就支持多模态,能够处理语言、视觉、听觉等不同形式的数据。 Gemini report 有中文翻译,源文档为:https://storage.googleapis.com/deepmindmedia/gemini/gemini_1_report.pdf 。该翻译大部分经过人工校验,少部分根据个人对 MLLM 的理解进行翻译。本报告介绍了新的多模态模型 Gemini,它在图像、音频、视频和文本理解方面具有卓越能力。Gemini 系列包括 Ultra、Pro 和 Nano 三种尺寸,适用于不同应用场景。对广泛的基准测试的评估表明,最有能力的 Gemini Ultra 模型在 32 个基准测试中的 30 个中提高了最先进的水平,特别是第一个在经过充分研究的考试基准测试 MMLU 上实现人类专家性能的模型,并在 20 个多模态基准测试中的每一个中提升了现有 SOTA。 可以使用 Gemini 拆解视频,例如使用 Gemini 1.5 Pro 做视频分析和拆解。有测试者表示拆解准确度很高,如阿强将用 AI 做的功夫熊猫相关视频丢进去分析,效果很好。
2025-02-24
Gemini网址
Google 的多模态大模型叫 Gemini。Gemini 是由 Google DeepMind 团队开发的,具有以下特点: 不仅支持文本、图片等提示,还支持视频、音频和代码提示。 能够理解和处理几乎任何输入,结合不同类型的信息,并生成几乎任何输出。 被称为 Google 迄今为止最强大、最全面的模型。 被描述为一种“原生多模态大模型”,从设计之初就支持多模态,能够处理语言、视觉、听觉等不同形式的数据。 谷歌还开源了基于创建 Gemini 模型的相同研究和技术构建的 LLM 大模型 Gemma,重点如下: 共两个尺寸的模型权重:Gemma 2B 和 Gemma 7B。每种尺寸都提供了预训练和指令调优的版本。 模型地址: 关于 Gemini 的相关内容: 官方介绍:https://blog.google/technology/ai/googlegeminiai/sundarnote 林夕同学的翻译: 自媒体翻译: 歸藏的 AI 工具箱 20231206 23:48:https://mp.weixin.qq.com/s/J4n4gEEc2Q3jNzah12lWQ 多模态视频展示:https://x.com/xiaohuggg/status/1732438592096727043?s=20 Google Gemini 分 Ultra,pro,nano 三个版本: Ultra 是最强版本,所有的演示和跑分的都是这个版本!目前没有体验的地方! Pro 版本已经部署到了 Bard 上了,可以使用了,能力和 GPT3.5 差不多,不支持中文,体验需要切换到美国地区! Nano 是能够在手机等移动设备上运行的版本,目前已经在 Google Pixel 8 Pro 上推出!
2025-01-19
Gemini和GPT哪个OCR比较好?
Gemini 和 GPT 都是当前自然语言处理(NLP)领域中非常受欢迎的模型,它们在不同的应用场景中都有出色的表现。但是,在 OCR(光学字符识别)方面,哪个模型更好需要根据具体的任务和数据集来评估。 总的来说,GPT4 在多模态复杂数据问题和汉字的 OCR 方面表现较好,而 Gemini 在原生多模态能力和与搜索生态结合方面有一定的优势。但是,对于中文的理解能力,GPT4 可能更胜一筹。 需要注意的是,以上结论是基于已有数据和相关文章得出的,具体表现还需要根据实际应用场景进行评估。
2024-05-11