Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

什么是炼丹

Answer

在AI图像设计领域,"炼丹"这个术语被用来形象地描述一些复杂且需要大量实验的模型训练和优化过程。具体来说,它可能涉及以下几个方面:

  1. 模型训练:在图像识别、分类、生成等任务中,需要训练深度学习模型以从大量图像数据中学习特征和模式。

  2. 参数调整:调整模型的超参数(如学习率、网络层数、神经元数量等)以优化性能,这个过程可能需要大量的实验和试错。

  3. 数据增强:为了提高模型的泛化能力,需要通过数据增强技术(如旋转、缩放、裁剪等)来增加训练数据的多样性。

  4. 特征工程:在图像处理中,选择合适的特征是关键。这可能涉及到复杂的特征提取和选择过程。

  5. 风格迁移:在图像风格迁移任务中,需要训练模型将一种图像的风格应用到另一种图像上,这通常需要精细的参数调整和多次迭代。

  6. 图像生成:在生成对抗网络(GAN)等生成模型中,训练过程需要精心设计网络结构和损失函数,以达到逼真的图像生成效果。

  7. 损失函数设计:设计合适的损失函数以指导模型训练,使其能够更好地学习图像的特征和结构。

  8. 网络架构设计:尝试不同的网络架构(如卷积神经网络、循环神经网络等)来解决特定的图像处理任务。

  9. 实验迭代:在图像设计中,通常需要多次实验和迭代来优化模型,这个过程可能非常耗时且需要耐心。

  10. 结果验证:验证模型在不同数据集上的性能,确保其泛化能力和鲁棒性。

  11. 自动化工具:使用自动化机器学习(AutoML)工具来辅助模型选择和参数调整,减少"炼丹"的工作量。

在AI图像设计领域,"炼丹"强调的是模型训练和优化过程中的复杂性和不确定性,以及需要投入大量时间和精力来达到理想的效果。随着技术的进步,研究人员正在探索更高效的方法来简化这一过程。

Content generated by AI large model, please carefully verify (powered by aily)

References

【Lora炼丹术】从零开始,炼制你的第一个LoRA(1)

从接触SD到现在,相信大家一定使用过各种各样的lora,包括人物的、建筑的、画风的等等,那么你有没有想过炼制一款属于自己的lora模型呢。我们先来了解一下炼丹的基础概念,它的关键原理就是——等价交换法则!不好意思,说错了。重新来,Lora全称Low-Rank Adaptation Models,中文翻译为低阶自适应模型。它的作用在于影响和微调画面。通过lora的帮助,可以再现人物或物品的特征。大模型的训练通常是非常复杂且需要很高的电脑配置的,LoRA采用的方式就是在原有的模型中插入新的数据处理层,这样就避免了修改原有模型的参数。LORA模型训练,其实就是用一些特定特征来替换大模型中的对应元素,比如一个固定的人物相貌、特定的服装或者是特定的风格,这样就可以生成不同于底模的图片。所以,lora训练是比较轻量化的,需要的显存也少了很多,硬件门槛显存达到6G就可以开启训练了。我们今天要使用的是B站UP主“朱尼酱”的赛博丹炉,他的这款丹炉,界面更加友好、美观,适合新手入门。废话不多说,我们就正式开始吧。

【Lora炼丹术】国庆节去哪玩?炼个丹儿玩!人像lora炼制(2)

18张脸部图片,20张整体图片,各训练50步,循环训练10次,并行步数为1,所以训练总步数为19000,训练时长为45分钟,loss值为0.0769。从数值上来看是个不错的丹,但具体好坏还是要我们自己通过测试来判断,毕竟像不像只有我们自己知道。

【Lora炼丹术】从零开始,炼制你的第一个LoRA(1)

接下来就可以看到训练过程了,每训练50步,右下角就会生成一张图,方便查看目前的效果。这个图会随着训练的进行越来越像,静下心慢慢等待吧。训练完毕之后,这里会有一个loss值,这代表着一个深度学习的效果,数值在0.07-0.09之间是最优的,如果数值太大说明学习效果不好。我们这个丹是0.0734,所以目前来看还是不错的。然后我们点击这个模型文件夹,就可以看到我们的炼丹成果了。一共有10枚丹,我们改一下名字,将第一枚丹的后缀改为“……000010”。至此,我们的训练过程就全部结束。

Others are asking
炼丹需要了解的参数
炼丹需要了解的参数主要包括以下方面: 1. 学习步数:指 AI 对每张图片的学习次数。二次元图片的 repeat 一般在 10 15,写实人物图片的 repeat 一般在 30 50,真实世界的景观场景可能要达到 100。repeat 值越高,AI 对图片的理解越好,但图片精细度越高,学习步数也要越高。 2. 循环次数:AI 将所有图片按照学习步数学习一轮即为一次循环,循环次数指将这个过程重复的遍数。一般数值在 10 20 之间,次数并非越多越好,过多可能导致过拟合,即训练结果过于僵化。 3. 训练总步数:通过图片张数×学习步数×循环次数计算得出。例如 5 张图片,学习步数 50,循环次数 10,训练总步数为 2500 步。
2025-02-21
炼丹
炼丹是指在 Lora 模型训练中的一系列过程,主要包括以下步骤: 1. 训练过程:每训练 50 步,右下角会生成一张图查看效果,训练完毕后会有一个 loss 值,数值在 0.07 0.09 之间为最优。 2. 模型查看:训练完成后点击模型文件夹查看炼丹成果,可修改丹的后缀名。 3. 跑图测试:炼丹完成后需放入 SD 中进行跑图测试。 4. 打标:选择基础大模型,如“麦橘写实”,填写 lora 名字,将照片导入丹炉,选择分辨率,可勾选“脸部加强训练”并点击“预处理”,手动裁剪,为脸部和整体文件夹中的照片打好 tag 标签,注意描述的详细程度会影响人物 lora 的泛化性。 5. 参数调整:大部分参数固定,主要参数按人物参数配置,后期根据生成结果调整。 6. 炼丹:如 18 张脸部图片、20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1 。 7. 测试:将丹放入 SD 的 lora 文件夹,启动 SD 后在 lora 选项卡中刷新查看,通过 XYZ 脚本测试不同 lora 在不同权重下的效果,用肉眼对比寻找最像的,再更换提示词查看效果。
2025-02-12
Flux炼丹,炼丹物品如何打标
在 Flux 炼丹中,炼丹物品的打标步骤如下: 1. 选择一个基础大模型,如“麦橘写实”,并填写一个 lora 的名字。 2. 将照片导入到丹炉,选择适合的分辨率,可勾选“脸部加强训练”,然后点击“预处理”。手动裁剪照片,预处理后会出现脸部和整体的文件夹,且每张照片会自动打好 tag 标签。 3. 可以给整体添加统一的标签,也可单独给每一张修改标签。标签的作用是帮助 AI 理解图片内容,若想让某些特征成为人物的固定效果,则不填写相关关键词。打标过程需仔细检查每张图片,打标的好坏会影响人物 lora 的泛化性,若想让人物有更多变化,应尽量描述详细。 在打标过程中还需注意以下几点: 1. 注册为开发者,按照流程填写信息,获取 AppID 和密钥,并填入相关位置,开启双语 TAG,检查每幅图的 tag,删除不正确的,新增需要的。 2. 打标要用自然语言,语句精简,选好触发词和打标模型,推荐短标并检查。
2025-02-12
lora炼丹活动
以下是关于 Lora 炼丹活动的相关信息: 魔多·LoRA 模型创作大赛正在进行中。基于 SD1.5、SDXL、FLUX.1 底模创作 LoRA 模型,有中国神话、武侠风云、写实人像、灵动萌兽、银幕穿梭机、盲盒幻想六个赛题方向可供选择。 10 月 17 日晚 8 点有免费的 0 基础炼丹课程,由忠忠(设计类模型 Top1,Canva、平安科技、华为、腾讯等领先互联网公司培训讲师)授课。会议主题为教你 0 基础炼丹,会议时间为 20:00 22:00,会议 ID 为 370 697 604,会议链接为 https://vc.feishu.cn/j/370697604 。 此外,还有关于人像 lora 炼制的详细步骤: 1. 打标:选一个基础大模型,如“麦橘写实”,填一个 lora 的名字。将照片导入丹炉,选择适合的分辨率,可勾选“脸部加强训练”,然后点击“预处理”。手动裁剪照片,预处理后会出现脸部和整体的文件夹,且每张照片自动打好 tag 标签。可给整体添加统一标签或单独修改每张的标签,注意描述的详细程度会影响人物 lora 的泛化性。 2. 参数调整:前面环节重要,此环节可佛系,大部分参数固定,主要参数按人物参数配置,后期根据生成结果调整。 3. 炼丹:18 张脸部图片,20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1,训练总步数为 19000,训练时长为 45 分钟,loss 值为 0.0769。但具体好坏需通过测试判断。 活动详情地址:
2025-02-07