Chat with Wiki - 对图片和视频进行智能标签

Answer

以下是关于对图片和视频进行智能标签的相关内容：

用 SD 训练一套贴纸 LoRA 模型的打标方法：

点击左侧菜单【WD1.4 标签器】。
在 path 中粘贴素材文件夹的根目录路径。
将阈值设置为 0.35（生成尽可能多的标签来描述图片内容，阈值是指 AI 理解图片内容给出关键词的评分，分数越大越确定，一般阈值设大于 0.35）。
选择公认成熟稳定的 Tagger 模型作为训练 lora 的底模，其它设置基本不用更改调试。
点击【启动】，会为目标文件夹里的图像素材自动打标，自动打标完成后，会在素材原文件直接生成对应图像的 txt 打标文件。

【SD】提示词标签选择器 Easy Prompt Selector 的使用：

按顺序选择一些标签词，如女孩、白头发、蓝眼睛、兔子耳朵等。
选择画质和视角，如最好的质量、杰作、高度详细等。
选择艺术风格，如皮克斯动画、轮廓光。
在负面提示词中进行选择并点击选框结尾的“负面”。
选择模型，如“revAnimated”，调整尺寸后点击生图。

用 SD 训练一套贴纸 LoRA 模型的打标优化方法：

方法一：保留全部标签。对标签不做删标处理，直接用于训练。一般在训练画风，或想省事快速训练人物模型时使用。优点是不用处理 tags 省时省力，过拟合的出现情况低；缺点是风格变化大，需要输入大量 tag 来调用、训练时需要把 epoch 训练轮次调高，导致训练时间变长。
方法二：删除部分特征标签。训练某个特定角色时，要保留蓝眼睛作为其自带特征，那么就要将 blue eyes 标签删除，以防止将基础模型中的 blue eyes 引导到训练的 LoRA 上。一般需要删掉的标签如人物特征 long hair，blue eyes 这类；不需要删掉的标签如人物动作 stand，run 这类，人物表情 smile，open mouth 这类，背景 simple background，white background 这类，画幅位置等 full body，upper body，close up 这类。优点是调用方便，更精准还原特征；缺点是容易导致过拟合，泛化性降低。过拟合会导致画面细节丢失、画面模糊、画面发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。

Content generated by AI large model, please carefully verify (powered by aily)

References

如何用 SD 训练一套贴纸 LoRA 模型

点击左侧菜单【WD1.4标签器】在path中粘贴素材文件夹的根目录路径阈值设置为0.35（生成尽可能多的标签来描述图片内容）阈值是什么：ai理解这种图片中内容，给出关键词，会有一个自己的评分，0-1，分数越大，就说明越确定是这个东西，一般阈值设大于0.35Tagger模型即训练lora的底模，尽可能选择公认成熟稳定的模型其它设置基本不用更改调试点击【启动】，会为目标文件夹里的图像素材自动打标自动打标完成后，会在素材原文件直接生成对应图像的txt打标文件

【SD】提示词标签选择器Easy Prompt Selector

我按顺序选择了一些标签词：女孩，白头发，蓝眼睛，兔子耳朵，马尾辫，手臂放在背后，无袖连衣裙，天使般的微笑，环形耳环，手镯，丝带，光腿，月亮。接下来，还可以选择画质和视角，我选择了：最好的质量，杰作，高度详细，生动的色彩，从人物的角度往下看。艺术风格选择了：皮克斯动画、轮廓光。负面提示词里面都是我们常用的一些，然后记得点击一下选框结尾的“负面”（可能是汉化的原因，点击这里后并不会显示打勾，但是点一下就好）。然后，点击全部，就可以加入所有的负向提示词了。模型选择“revAnimated”，调整一下尺寸，点击生图。在没有开高清修复的情况下，这样靠选词出来的画面，质量还是很不错的，氛围感很好。分类中还有一个“魔法系”的分类，感觉很中二的样子，我选一个“深入星海”试试看。可以看到它加入了一系列配置好的词组。点击生成，感觉更像游戏角色了有木有~不过我还是喜欢刚才那张，色彩光线很温馨舒适，将它发送到图生图，使用tile模型细化一下，重绘幅度0.5。ok，完工。

如何用 SD 训练一套贴纸 LoRA 模型

预处理生成tags打标文件后，就需要对文件中的标签再进行优化，一般有两种优化方法：方法一：保留全部标签对标签不做删标处理,直接用于训练。一般在训练画风，或想省事快速训练人物模型时使用。优点：不用处理tags省时省力，过拟合的出现情况低。缺点：风格变化大，需要输入大量tag来调用、训练时需要把epoch训练轮次调高，导致训练时间变长。方法二：删除部分特征标签训练某个特定角色，要保留蓝眼睛作为其自带特征，那么就要将blue eyes标签删除，以防止将基础模型中的blue eyes引导到训练的LoRA上。简单来说删除标签即将特征与LoRA做绑定，保留的话画面可调范围就大。一般需要删掉的标签：如人物特征long hair，blue eyes这类。不需要删掉的标签：如人物动作stand，run这类，人物表情smile，open mouth这类，背景simple background，white background这类，画幅位置等full body，upper body，close up这类。优点：调用方便，更精准还原特征。缺点：容易导致过拟合，泛化性降低。过拟合：过拟合会导致画面细节丢失、画面模糊、画面发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。