部署 DeepSeek-R1 模型使用云服务器的价格因云计算厂商而异:
需要注意的是,价格可能会有所变动,具体以各云计算厂商的最新公布为准。
com/#/model/overview|云计算商|提供的deepseek版本|价格|特点||-|-|-|-|||DeepSeek-V3|即日起至北京时间2025-02-08 24:00享受折扣价,2025-02-09 00:00恢复原价<br>输入:¥2¥1/M Tokens<br>输出:¥8¥2/M Tokens|当前有优惠活动<br>1.邀请好友赚2000万Tokens<br>2.注册即送2000万Tokens<br>平台2000万Tokens特指Qwen2.5-14B-Instruct模型单价下的数量||华为昇腾社区|全版本|部署DeepSeek-R1模型用BF16权重进行推理至少需要4台Atlas 800I A2(8*64G)服务器,用W8A8量化权重进行推理则至少需要2台Atlas 800I A2(8*64G)|服务器调用Docker下载部署权重资源,非API调用模式||阿里云<br>(人工智能平台PAI)|全版本|以R1为例,所需计算资源价格316.25/小时|模型部署成在线服务,在人工智能平台PAI下的模型部署下的模型在线服务EAS||阿里云<br>(阿里云百炼)|全版本|免费额度:10000000/10000000|通过API调用|
com/#/model/overview|云计算商|提供的deepseek版本|价格|特点||-|-|-|-||腾讯云<br>(自建服务器)|全版本|多机分布式部署,节点数量:2个,单节点配置:HCCPNV6机型|可在线体验(需开通T1平台服务)||腾讯云<br>(调用API)|DeepSeek-R1<br>DeepSeek-V3|API调用DeepSeek系列模型限时免费|本接口。即日至北京时间2025年2月25日23:59:59,所有腾讯云用户均可享受DeepSeek-V3、DeepSeek-R1模型限时免费服务,单账号限制接口并发上限为5。在此之后,模型价格将恢复至原价。||京东云|“deepseek-r1:1.5b、“deepseek-r1:7b”、“deepseek-r1:32b”|1.89/小时起;服务器部署的方式|||gitee ai|全版本|R1价格0.1元/次|基于沐曦曦云GPU及曦源一号国产替代算力集群<br>有在线体验|
AI模型的云端部署与试用PaaS平台特性:PaaS平台支持多机分布式部署,满足推理性能要求,使用独占资源和专有网络,能一站式完成模型蒸馏。模型价格差异:简单应用开发平台交付产品价格在千元、万元或几十万元级别,为公司打造专有模型价格更高。云端部署操作:登录Pad控制台,通过model gallery进行部署,如Deepseek R1模型,可选择SG浪或Vim推理框架,根据资源出价,部署后可在模型在线服务EAS查看状态。模型试用方法:使用postman,通过修改接口和复制文档中的内容进行在线调试,发送请求查看状态码,根据模型名称和相关要求输入内容进行试用。作业布置:部署成功一个大语言模型,通过调试证明成功,在调试内容中带上钉钉昵称向模型对话,将成功结果提交问卷可获得阿里云小礼包。模型蒸馏及相关部署操作API调用与服务关停:介绍了模型API的调用方法,包括查找位置、获取token等,强调使用后要及时停止或删除服务以避免持续付费。模型蒸馏概念:教师模型将知识蒸馏给学生模型,有多种蒸馏方式,如R1通过蒸馏数据集并用于学生模型微调。蒸馏应用场景:包括车机等算力有限场景,能让小模型在特定领域有良好效果,还能实现低成本高速推理和修复模型幻觉。模型部署实操:在model gallery中选择模型,如1000问7B指令模型,进行部署,选择VIM加速和竞价模式,查看部署状态和日志。