合理。因为LLM 应用优化是个迭代过程,应该不断尝试:尝试->验证->再尝试->再迭代。通过 prompt 工程(或结合 RAG)先获取第一批高质量输入输出数据,然后微调模型,模型性能提升后,数据质量进一步提升,将更优质的数据用于模型训练,然后更好的模型产出更好的数据,如此循环,构建正向迭代循环(也称数据飞轮)。