Chat with Wiki - 模型成本

Answer

以下是关于模型成本的相关信息：

GPT-3.5 系列：

gpt-3.5-turbo：功能强大，针对聊天优化，成本仅为 text-davinci-003 的 1/10，最大 Token 数 4096，训练数据截至 2021 年 9 月。
gpt-3.5-turbo-0301：gpt-3.5-turbo 2023 年 3 月 1 日的快照，不会更新，仅在 2023 年 6 月 1 日结束的三个月内提供支持，最大 Token 数 4096，训练数据截至 2021 年 9 月。
text-davinci-003：能完成任何语言任务，支持在文本中插入补全，最大 Token 数 4097，训练数据截至 2021 年 6 月。
text-davinci-002：与 text-davinci-003 类似，使用监督微调训练，最大 Token 数 4097，训练数据截至 2021 年 6 月。
code-davinci-002：针对代码完成任务优化，最大 Token 数 8001，训练数据截至 2021 年 6 月。

其他模型供应商：

智谱 GLM-4V：通用视觉类大模型，拍立得最早使用，接口响应速度快，指令灵活性差些，一个接口支持图片/视频/文本，视频和图片类型不能同时输入，调用成本 0.05 元/千 tokens。
阿里云百炼 qwen-vl-plus：通用视觉类大模型，拍立得目前使用，指令灵活性丰富，接口调用入门流程长，密钥安全性高，调用成本 0.008 元/千 tokens，训练成本 0.03 元/千 tokens。
阶跃星辰：通用视觉类大模型，响应速度快，支持视频理解，输入成本 0.005 - 0.015 元/千 tokens，输出成本 0.02 - 0.07 元/千 tokens。
百度 PaddlePaddle：OCR，垂直小模型，文本识别能力补齐增强，私有化部署服务费，API 调用在 0.05 - 0.1 元/次。

Claude 3 系列：

Opus：最智能，擅长处理复杂任务，输入成本 15 美元/百万 token，输出成本 75 美元/百万 token，上下文窗口 200K token（特定用途 1M token 可用，详情咨询），应用场景包括任务自动化、研发、策略分析等。
Sonnet：平衡，应用场景包括客户服务、内容审核、优化物流等，优势在于速度和成本效益。

此外，Claude 3 系列在设计上注重安全和可靠，持续改进减少模型偏见，提高公正性和中立性，被评定为 AI 安全等级 2（ASL-2）。

Content generated by AI large model, please carefully verify (powered by aily)

References

模型（Models）

GPT-3.5模型可以理解和生成自然语言或代码。我们在GPT-3.5系列中功能最强大、最具成本效益的型号是gpt-3.5-turbo，它已针对聊天进行了优化，但也适用于传统的补全（Completion）任务。|MODEL|描述|最大Token数|训练数据||-|-|-|-||gpt-3.5-turbo|功能最强大的GPT-3.5型号，针对聊天进行了优化，成本仅为text-davinci-003的1/10。将使用我们最新的模型迭代进行更新。|4096 Token|截至2021年9月||gpt-3.5-turbo-0301|gpt-3.5-turbo 2023年3月1日的快照。与gpt-3.5-turbo不同，此模型不会更新，并且仅在2023年6月1日结束的三个月内提供支持。|4096 Token|截至2021年9月||text-davinci-003|可以以比curie、babbage、ada模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。还支持在文本中[插入](https://platform.openai.com/docs/guides/completion/inserting-text)补全。|4097 Token|截至2021年6月||text-davinci-002|与text-davinci-003类似的功能，但使用监督微调而不是强化学习进行训练|4097 Token|截至2021年6月||code-davinci-002|针对代码完成任务进行了优化|8001 Token|截至2021年6月|我们建议使用gpt-3.5-turbo而不是其他GPT-3.5模型，因为它的成本更低。

0基础手搓AI拍立得

用成本相对较高，大家可以选择以下供应商中|模型厂商|类型|特点|成本|网址/文档||-|-|-|-|-||智谱 GLM-4V|通用视觉类大模型|拍立得最早使用的模型 接口响应速度快 指令灵活性差一些 一个接口支持图片/视频/文本，视频和图片类型不能同时输入|调用：0.05元/千tokens|[智谱接口调用示例](https://bigmodel.cn/dev/api/normal-model/glm-4v)||阿里云百炼 qwen-vl-plus|通用视觉类大模型|拍立得目前使用的模型 指令灵活性比较丰富 接口调用入门流程长一些，密钥安全性更高|调用：¥0.008/千tokens 训练：¥0.03/千tokens|[通义千问接口调用示例](https://bailian.console.aliyun.com/?spm=5176.21213303.J_qCOwPWspKEuWcmp8qiZNQ.33.14162f3drQWnj1&scm=20140722.S_card@@%E4%BA%A7%E5%93%81@@2983180._.ID_card@@%E4%BA%A7%E5%93%81@@2983180-RL_%E7%99%BE%E7%82%BC%E5%A4%A7%E6%A8%A1%E5%9E%8B-LOC_search~UND~card~UND~item-OR_ser-V_3-RE_cardNew-P0_0#/model-market/detail/qwen-vl-plus?tabKey=sdk)||阶跃星辰|通用视觉类大模型|响应速度快 支持视频理解|输入：¥0.005～0.015/千tokens 输出：¥0.02～0.07/千tokens|[阶跃星辰接口调用示例](https://platform.stepfun.com/docs/guide/image_chat)||百度PaddlePaddle|OCR，垂直小模型|文本识别能力补齐增强|私有化部署服务费 API调用在¥0.05～0.1/次|[Paddle OCR开源地址](https://github.com/PaddlePaddle/PaddleOCR)|

3 月动态｜Claude3 发布等

以下是对Claude三款模型性能与成本的直观介绍，旨在为不同需求的用户提供清晰的选择指南。[heading4]Opus：智能[content]特点：Opus模型是目前市场上最智能的模型，擅长处理极其复杂的任务。它能够流畅应对开放式问题和全新场景，显示出类似人类的高度理解能力。成本：输入$15/百万token，输出$75/百万token。上下文窗口：200K token（对于特定用途，1M token可用，详情请咨询）。应用场景：包括任务自动化、研发、策略分析等。优势：在智能层面，超越其他所有模型。[heading4]Sonnet：平衡[content]特点：应用场景：客户服务、内容审核、优化物流等。优势：在速度和成本效益上领先，为用户提供高效的AI体验。[heading4]设计理念其及他[content]负责任的AI：Claude 3系列在设计上注重安全和可靠，通过持续跟踪和缓解风险，确保了模型的稳定运行。持续改进：Claude公司致力于减少模型偏见，提高模型的公正性和中立性。安全等级：根据负责任扩展政策，Claude 3被评定为AI安全等级2（ASL-2），展现了其在安全方面的可靠性。[heading2]文档还有简体中文版[heading2]拓展阅读[content][《GPT-4时代结束！全球最强大模型一夜易主，体验完Claude 3我更期待GPT-5了》](https://mp.weixin.qq.com/s/eR9DLV19IK5WonyNtQgr2A)