Chat with Wiki - 如何使用阿里PAI部署大模型

Answer

以下是使用阿里 PAI 部署大模型的步骤：

模型部署：
- 选中模型卡片，出现部署按钮。
- 选择 vLLM 部署。
- 小插曲：竞价系统（用更便宜的价格部署模型）。
- 部署完成后在 EAS 服务中可以找到 API 的 endpoint 和 key 信息。
- 同样在 EAS 服务中可以查看部署情况和日志，如果竞价获得不了资源，可以适当调整价格。
- 在 EAS 服务中可以直接尝试试用模型。
- 调试方法：Get models 方法需要用 vllm 框架部署才能支持；chat 方法，比如 7b 的蒸馏模型就换成相应的设置。
- 尝试部署一个 qwen2.5 - 7b - instruct 的原生模型，并测试问题“9.11 和 9.9 的大小?”
蒸馏->数据：
- 在本地的 python 环境中或 notebook gallery 里建立一个实例来执行 python。
- 执行相关代码，最终会获得一个 json 文件，即蒸馏出来的数据集。通常需要检查数据的正确性，再进行下一步的训练微调过程。
作业：
- 在阿里云 PAI 平台上部署一个模型，并调试验证确认自己的部署成功。
- 调试信息中修改 content 的内容，必须在 content 内容中带上自己的钉钉“昵称”来向大模型对话。
- 在截止时间 2025/03/05 之前，将自己调试成功的效果截图（截图中的“content”内必须带着自己的钉钉），提交到「问卷地址」。
模型蒸馏微调：
- 由于上一步中蒸馏的数据集很小，不足以改变模型权重，因此使用一个别人做好的数据集。在使用前可以打开看下里面的结构，和蒸馏出来的数据结构一致。
- 建立用于训练的数据集：下载并解压数据集，然后在 PAI 平台的数据集中找到 OSS 存储，建立数据集，然后上传数据集。
- 开始部署模型进行训练：选择 7b - instruct 的原生模型，选择训练。选择全参微调，并选择自定义数据集。注意超参配置。
- 训练要求需要使用灵骏的资源，比如 8 卡 H100，需要的显存比较大。点击训练，在 DLC 里看到相应状态就是训练成功。
- 训练完成就可以测试模型效果：在 model gallery 里面找到训练好的模型，点击右上角的部署，使用 vllm 部署。部署完成后，使用相应命令调试。

Content generated by AI large model, please carefully verify (powered by aily)

References

代码不是本文的重点,也不重要.本文的思路大家都能听懂,跟着学习思路就能理解R1的蒸馏是怎么回事了.相信我,我做到了,你完全可以跟着做到.[heading1]模型部署[content]1.模型部署为了便宜,咱们部署32b的蒸馏模型来展示同样的效果:选中模型卡片以后,就会出现部署按钮.选择vLLM部署小插曲:竞价系统(用更便宜的价格部署模型)1.部署完成后在EAS服务中可以找到API的endpoint和key信息同样也是在EAS服务中可以查看部署情况和日志,如果竞价获得不了资源,可以适当调整价格在EAS服务中可以直接尝试试用模型:调试方法:Get models方法:需要用vllm框架部署才能支持:chat方法:比如7b的蒸馏模型就换成这样的就可以了.尝试部署一个qwen2.5-7b-instruct的原生模型,并看看它的回答方式,并且测试问题“9.11和9.9的大小?”[heading1]蒸馏->数据[content]在咱们本地的python环境中,或者notebook gallery里建立一个实例来执行python.代码不重要,重要的是思路!完全可以直接用百炼/PAI的工作流,嵌套大模型的方式,一行代码都没有来执行实现.执行这段代码:咱们最终会获得一个一个json文件,就是蒸馏出来的数据集了.通常这里都需要检查下数据的正确性,才进行下一步的训练微调过程.

基于阿里云PAI平台: 复现R1蒸馏+蒸馏训练模型过程

(完成提交,将获得由阿里云提供的作业完成礼包🎁!)在阿里云PAI平台上部署一个模型,并调试验证确认自己的部署成功.要求:调试信息中修改content的内容,必须在content内容中带上自己的钉钉“昵称”来向大模型对话.完成后,在截止时间2025/03/05之前,将自己调试成功的效果截图(截图中的“content”内必须带着自己的钉钉),提交到「问卷地址」.提交的截图示例:

基于阿里云PAI平台: 复现R1蒸馏+蒸馏训练模型过程

由于我们上一步中蒸馏的数据集很小,不足以改变模型权重,因此我们使用一个别人做好的数据集.在使用前可以打开看下里面的结构,和我们蒸馏出来的数据结构是一致的.[Bespoke-Stratos-17k_thought.json.zip](https://bytedance.feishu.cn/space/api/box/stream/download/all/Wk2fbCI5YohTIxxn1XIclRAZn4e?allow_redirect=1)1.建立你用于训练的数据集下载并解压这个数据集,然后在PAI平台的数据集中找到你的OSS存储,建立数据集.然后上传数据集:1.开始部署模型进行训练选择这个7b-instruct的原生模型,选择训练选择全参微调,并选择自定义数据集:注意超参需要这么配置:系统提示词的内容如下:最后体现在我们的配置上就是这样的:这个训练要求需要使用灵骏的资源,比如8卡H100,需要的显存比较大:点击训练就可以开始训练了.如果在DLC里看到下面的状态就是训练成功了.1.训练完成就可以测试模型效果了同样在model gallery里面找到训练好的模型,点击右上角的部署.使用vllm部署.部署完成后,使用如下命令调试(注意大小写):