以下是关于对图片和视频进行智能标签的相关内容:
用 SD 训练一套贴纸 LoRA 模型的打标方法:
【SD】提示词标签选择器 Easy Prompt Selector 的使用:
用 SD 训练一套贴纸 LoRA 模型的打标优化方法:
点击左侧菜单【WD1.4标签器】在path中粘贴素材文件夹的根目录路径阈值设置为0.35(生成尽可能多的标签来描述图片内容)阈值是什么:ai理解这种图片中内容,给出关键词,会有一个自己的评分,0-1,分数越大,就说明越确定是这个东西,一般阈值设大于0.35Tagger模型即训练lora的底模,尽可能选择公认成熟稳定的模型其它设置基本不用更改调试点击【启动】,会为目标文件夹里的图像素材自动打标自动打标完成后,会在素材原文件直接生成对应图像的txt打标文件
我按顺序选择了一些标签词:女孩,白头发,蓝眼睛,兔子耳朵,马尾辫,手臂放在背后,无袖连衣裙,天使般的微笑,环形耳环,手镯,丝带,光腿,月亮。接下来,还可以选择画质和视角,我选择了:最好的质量,杰作,高度详细,生动的色彩,从人物的角度往下看。艺术风格选择了:皮克斯动画、轮廓光。负面提示词里面都是我们常用的一些,然后记得点击一下选框结尾的“负面”(可能是汉化的原因,点击这里后并不会显示打勾,但是点一下就好)。然后,点击全部,就可以加入所有的负向提示词了。模型选择“revAnimated”,调整一下尺寸,点击生图。在没有开高清修复的情况下,这样靠选词出来的画面,质量还是很不错的,氛围感很好。分类中还有一个“魔法系”的分类,感觉很中二的样子,我选一个“深入星海”试试看。可以看到它加入了一系列配置好的词组。点击生成,感觉更像游戏角色了有木有~不过我还是喜欢刚才那张,色彩光线很温馨舒适,将它发送到图生图,使用tile模型细化一下,重绘幅度0.5。ok,完工。
预处理生成tags打标文件后,就需要对文件中的标签再进行优化,一般有两种优化方法:方法一:保留全部标签对标签不做删标处理,直接用于训练。一般在训练画风,或想省事快速训练人物模型时使用。优点:不用处理tags省时省力,过拟合的出现情况低。缺点:风格变化大,需要输入大量tag来调用、训练时需要把epoch训练轮次调高,导致训练时间变长。方法二:删除部分特征标签训练某个特定角色,要保留蓝眼睛作为其自带特征,那么就要将blue eyes标签删除,以防止将基础模型中的blue eyes引导到训练的LoRA上。简单来说删除标签即将特征与LoRA做绑定,保留的话画面可调范围就大。一般需要删掉的标签:如人物特征long hair,blue eyes这类。不需要删掉的标签:如人物动作stand,run这类,人物表情smile,open mouth这类,背景simple background,white background这类,画幅位置等full body,upper body,close up这类。优点:调用方便,更精准还原特征。缺点:容易导致过拟合,泛化性降低。过拟合:过拟合会导致画面细节丢失、画面模糊、画面发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。