模型微调-WayToAGI

回答

模型微调包括以下方面：

使用微调模型：当作业成功时，fine_tuned_model 字段将填充模型名称，完成后可能需几分钟准备好处理请求，若超时可能仍在加载中，可几分钟后重试。可通过将模型名称作为 model 完成请求的参数传递来开始发出请求，如 OpenAI 命令行界面、cURL、Python、Node.js 等方式。同时，可继续使用如 temperature、frequency_penalty、presence_penalty 等所有其他完成参数对微调模型进行请求。
Step4: 加载微调模型：基于 LoRA 微调的模型参数见基于 Llama2 的中文微调模型，LoRA 参数需要和基础模型参数结合使用。通过PEFT加载预训练模型参数和微调模型参数，示例代码中，base_model_name_or_path 为预训练模型参数保存路径，finetune_model_path 为微调模型参数保存路径。
创建微调模型：假设已准备好训练数据。使用 OpenAI CLI 开始微调工作，需明确从哪里 BASE_MODEL 开始的基本模型的名称（ada、babbage、curie 或 davinci），可使用后缀参数自定义微调模型的名称。运行命令会进行上传文件、创建微调作业、流式传输事件直到作业完成等操作。每个微调工作都从默认为 curie 的基本模型开始，模型选择会影响性能和成本，包括 ada、babbage、curie 或 davinci 等。开始微调作业后，可能需几分钟或几小时完成，工作可能排队，若事件流中断可恢复。此外，还可列出现有作业、检索作业状态或取消作业。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

当作业成功时，该fine_tuned_model字段将填充模型名称。您现在可以将此模型指定为我们的Completions API的参数，并使用Playground向它发出请求。在您的工作首次完成后，您的模型可能需要几分钟时间才能准备好处理请求。如果对您的模型的完成请求超时，可能是因为您的模型仍在加载中。如果发生这种情况，请在几分钟后重试。您可以通过将模型名称作为model完成请求的参数传递来开始发出请求：OpenAI命令行界面：cURL：Python：Node.js：您可以继续使用所有其他完成参数，如temperature等，对这些frequency_penalty请求presence_penalty进行微调模型。

模型微调

基于LoRA微调的模型参数见：基于Llama2的中文微调模型，LoRA参数需要和基础模型参数结合使用。通过[PEFT](https://github.com/huggingface/peft)加载预训练模型参数和微调模型参数，以下示例代码中，base_model_name_or_path为预训练模型参数保存路径，finetune_model_path为微调模型参数保存路径。

微调（Fine-tuning）

以下假设您已经按照上述说明准备了训练数据。使用OpenAI CLI开始微调工作：您从哪里BASE_MODEL开始的基本模型的名称（ada、babbage、curie或davinci）。您可以使用后缀参数自定义微调模型的名称。运行上面的命令会做几件事：1.使用文件API上传文件（或使用已经上传的文件）2.创建微调作业3.流式传输事件直到作业完成（这通常需要几分钟，但如果队列中有很多作业或您的数据集很大，则可能需要数小时）每个微调工作都从一个默认为curie的基本模型开始。模型的选择会影响模型的性能和运行微调模型的成本。您的模型可以是以下之一：ada、babbage、curie或davinci。请访问我们的定价页面，了解有关微调费率的详细信息。开始微调作业后，可能需要一些时间才能完成。在我们的系统中，您的工作可能排在其他工作之后，训练我们的模型可能需要几分钟或几小时，具体取决于模型和数据集的大小。如果事件流因任何原因中断，您可以通过运行以下命令恢复它：工作完成后，它应该显示微调模型的名称。除了创建微调作业外，您还可以列出现有作业、检索作业状态或取消作业。