以下是关于模型训练的基本名词和方法的介绍:
基本名词:
方法:
此外,在模型训练中还需注意:
1.过拟合&欠拟合2.泛化性3.正则化[heading3][过拟合&欠拟合]:[content]在这个问题上ChatGPT从美术角度给出的解释:总结下来就是:过拟合和欠拟合都是不好的现象,我们需要加以控制,让模型最终得到我们想要的效果。解决方法:在模型训练中需要不断对训练集、正则化、训练参数、进行调整,(过拟合可以尝试减少训练集的素材量,欠拟合就增加训练集的素材量。)[heading3][泛化性]:[content]ChatGPT从美术角度给出的解释:总结:泛化性不好的模型很难适应其他风格和多样性的创作力。可以通过跑lora模型生图测试来判断泛化性是否良好。解决办法:跟解决过拟合欠拟合问题一样,从训练集、正则化、训练参数、进行调整。[heading3][正则化]:[content]ChatGPT从美术角度给出的解释:总结:正则化是解决过拟合和欠拟合的情况,并提高泛化性的手段。相当于给模型加一些规则和约束,限制要优化的参数有效防止过拟合,同时也可以让模型更好适应不同情况的表现,提高泛化性。
*这一节只需要对训练模型的概念进行一个简单的了解即可[heading3]在模型训练中需要关注的几个方面:[content]1.全面充分的采集训练素材:列如在角色训练素材中,应该有各种角度、表情、光线等情况下的素材,这样才能确保模型具有较好的泛化性。2.图像预处理:对训练素材进行分辨率调整、裁切操作,并对训练集进行打标签处理。3.参数调优:尽可能把训练时长控制在半小时左右,时间过长容易导致过拟合,通过调整等参数控制训练时长。4.观察学习曲线:通过观察学习曲线来对训练素材、训练参数进行调整。5.过拟合&欠拟合处理:测试训练好的模型观察过拟合和欠拟合的问题,再进一步通过调整训练素材和正则化等手段来优化。(综上所述,模型训练中需要关注的几个重点,需要结合具体的任务需求和数据特点来进行调整和优化,以达到最优的训练效果。)
[heading2]总结AIPO共学课之厚德云模型训练分享AIPO共学课倒数第二节:10月17日是AIPO共学课倒数第二节,由黄忠忠分享厚德云模型训练,8点开始直播。线下活动安排:10月20日下午2点到6点,全国35个学校将同时启动AIPO线上模拟创投活动,北京有清华、北大等学校举办分会场。模型训练流程:包括处理数据集、设置参数训练、生成模型和生图等步骤。数据集获取渠道:有网上收集、购买、使用无版权问题的如古画等,原则是想生成什么图就找对应数据集,且要清晰、主体元素干净、风格统一。数据集处理:包括基础处理如裁剪保证清晰和分辨率,更重要的是写标注。模型训练的数据标注与流程设置模型触发词:模型触发词可自定义,如BD icon等,完整形式可以是一句话,建议以王flags模型为主。统一标注风格与应用场景:例如未来高科技3D天然风格,用于互联网首页图像等,并概括主题内容、描述物体特征等。利用GPT辅助描述并人工审核:可以让GPT按要求描述,人工审核修改,之前课程有相关教学,后续会提供参考提示词。模型训练的准备与流程:完成数据集描述后进入训练流程,选择模型训练分类和数据集,创建并上传数据集压缩包,注意数据名与图片命名一致。选择训练模式和参数:新手选用普通基础模式,训练集质量重要,训练参数中总步数与训练集图片数量相关,触发词可任意设定但要避免概念混乱。