以下是关于微调的最佳实践:
如果您要对预先存在的数据集进行微调,而不是从头开始编写提示,请务必在可能的情况下手动检查您的数据是否存在令人反感或不准确的内容,或者如果数据集很大,请检查尽可能多的随机样本。
使用更多高质量的示例进行微调效果更好。要微调一个比使用我们的基本模型使用高质量提示更好地执行的模型,您应该提供至少几百个高质量的示例,最好由人类专家审查。从那里开始,性能往往会随着示例数量的每增加一倍而线性增加。增加示例的数量通常是提高性能的最佳和最可靠的方法。分类器是最容易上手的模型。对于分类问题,我们建议使用ada,经过微调后,它通常只会比功能更强大的模型稍微差一点,同时速度更快,成本更低。如果您要对预先存在的数据集进行微调,而不是从头开始编写提示,请务必在可能的情况下手动检查您的数据是否存在令人反感或不准确的内容,或者如果数据集很大,请检查尽可能多的随机样本。
微调是一种强大的技术,可用于创建特定于您的用例的新模型。在微调您的模型之前,我们强烈建议您阅读以下针对您的用例的最佳实践和具体指南。
微调可以解决多种问题,最佳使用方式可能取决于您的具体用例。下面,我们列出了最常见的微调用例和相应的指南。[分类](https://platform.openai.com/docs/guides/fine-tuning/classification)[该模型是否做出了不真实的陈述?](https://platform.openai.com/docs/guides/fine-tuning/case-study-is-the-model-making-untrue-statements)[情绪分析](https://platform.openai.com/docs/guides/fine-tuning/case-study-sentiment-analysis)[电子邮件分类的分类](https://platform.openai.com/docs/guides/fine-tuning/case-study-categorization-for-email-triage)[条件生成](https://platform.openai.com/docs/guides/fine-tuning/conditional-generation)[根据维基百科文章撰写引人入胜的广告](https://platform.openai.com/docs/guides/fine-tuning/case-study-write-an-engaging-ad-based-on-a-wikipedia-article)[实体提取](https://platform.openai.com/docs/guides/fine-tuning/case-study-entity-extraction)[客户支持聊天机器人](https://platform.openai.com/docs/guides/fine-tuning/case-study-customer-support-chatbot)[基于技术属性列表的产品描述](https://platform.openai.com/docs/guides/fine-tuning/case-study-product-description-based-on-a-technical-list-of-properties)