进行 DeepSeek 本地化部署的方法如下:
关于AI模型部署与相关知识的讲解本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。免费额度说明:指出在freely.aliyun.com可领取500元免费额度,但有使用限制,不能部署满血版和较大的增流模型。平台服务差异:介绍了DLC、DSW和EAS等模型部署平台服务的差别。模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。Deepseek R1模型的制作及相关模型比较R1模型的强化学习:通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。R1模型的蒸馏与微调:用Deepseek RE Zero蒸馏出带思考的数据,基于Deepseek V3微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成R1。R1与其他模型的差别:R1是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。模型的相互帮助:Deepseek R1反过来蒸馏数据微调V3,形成互相帮助的局面,使两个模型都更强。
[01:57:41](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=7061000)大模型及知识库使用讲解与问题解答本章节许键介绍模型API调用方法与知识库创建。告知获取API key位置及调用设置,详细讲解创建Rag应用(知识库)流程,包括上传非结构化文件、数据解析、切分段落等操作,还回答诸多问题,如知识库访问权限、智能体接收文档等,并提及作业是构建常用应用。[02:15:10](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=8110000)工作流创建、模型能力及相关问题探讨本章节主要讨论工作流相关问题。涉及历史版本功能,如对话流不支持上传文档,可向百练提需求;探讨了根据小说写序章、英文翻译、文字校对等工作流搭建;解释了模型能力、query概念;还提到工作流发布渠道、联网搜索网站设置及根据用户语言回复等内容。[02:22:50](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=8570000)通义千问相关应用及明天课程安排交流本章节主要讨论智能体相关内容,包括图片识别后让大语言模型回答防治方法,智能体应用及工作流概念、工具添加等。还提及明天将教Deepseek本地部署、蒸馏模型部署及微调,分享了发布智能体消耗token等情况,最后回答了一些问题并预告通义千问推理模型进展。
[00:00](https://waytoagi.feishu.cn/minutes/obcnyb5s158h8yi8alo4ibvl?t=0)Deepseek R1本地部署、蒸馏及训练原理讲解本章节许键介绍今日课程重点是云服务器上如何使用Deepseek R1及本地部署相关内容,提及派平台免费额度及适用模型。还介绍了自己和社区情况。接着讲解Deepseek R1制作过程,包括强化学习概念及示例,阐述其从Deepseek r e Zero到M2等模型的演变及原理。[18:08](https://waytoagi.feishu.cn/minutes/obcnyb5s158h8yi8alo4ibvl?t=1088000)Deepseek R1模型的技术原理、部署与性能分析本章节主要介绍了Deepseek R1模型的构建过程,包括多轮强化学习和微调,还提及蒸馏模型的情况。探讨了不同模型部署所需的显存、内存及成本,对比了各模型在专业领域的能力表现。最后提到大家期望用Deepseek抢跑企业应用,阿里云派平台可助力其战略落地,并展示了派平台全景图。[37:57](https://waytoagi.feishu.cn/minutes/obcnyb5s158h8yi8alo4ibvl?t=2277000)阿里云派平台:面向企业的AI计算资源与模型部署服务介绍本章节介绍了以云基础设施和GPU算力资源为底层的派平台。该平台搭建AI框架并做优化,提供一键式快捷部署工具等。与百炼不同,它开放更多自由度,租户数据隔离。很多大模型在此训练,支持多机分布式部署等,既面向企业,也适合个人创业者,不同应用定价有差异。