直达「通往AGI之路」飞书知识库 →

首页/问答列表/问答详情

Flux 的lora模型训练教程，我想用用diffuser代码训练，而不是webui或comfyui

回答

以下是关于 Flux 的 lora 模型训练的相关信息：

Flux GGUF 模型：https://huggingface.co/city96/FLUX.1-dev-gguf/tree/main
GGUF 配套节点插件：https://github.com/city96/ComfyUI-GGUF
在最新版本的 ComfyUI 中，GGUF 的节点插件可在 Manager 管理器中搜到下载安装，但 NF4 的配套节点插件搜不到。
注意使用精度优化的低配模型时，工作流和原版不同。把官方的 fp8 工作流中底模的节点换成 NF4 或者 GUFF 即可。
相关生态发展迅速，有 Lora、Controlnet、IP-adpter 相关生态建设，字节最近发布的 Flux Hyper lora 可用于 8 步快速生图。下节将先讲讲 Flux 的 lora 训练。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

工具教程：Flux

Flux GGUF模型：https://huggingface.co/city96/FLUX.1-dev-gguf/tree/mainGGUF配套节点插件GGUF节点包：https://github.com/city96/ComfyUI-GGUF以下是使用GGUF生图：值得一提的是在最新版本的comfyUI中GGUF的节点插件是可以在Manager管理器中搜到下载安装的，NF4的配套节点插件则搜不到。注意使用精度优化的低配模型的话，工作流和原版是不一样的。此处没有专门列举。自己改的话就是把上面官方的这个fp8的工作流，只需把底模的节点换成NF4的或者GUFF的即可。相关生态发展很快，有Lora、Controlnet、IP-adpter相关生态建设非常速度，以及字节最近发布的Flux Hyper lora是为了8步快速生图。下节我们先讲讲Flux的lora训练。

其他人在问

这个网站的作用是什么？是通过这个网站更好的使用训练AI吗？

WaytoAGI 网站具有以下功能： 1. 和 AI 知识库对话：您可以在此询问任何关于 AI 的问题。 2. AI 网站：集合了精选的 AI 网站，可按需求找到适合您的工具。 3. AI 提示词：集合了精选的提示词，能复制到 AI 对话网站使用。 4. 知识库精选：将每天知识库的精华内容呈现给大家。总之，WaytoAGI 网站和 WaytoAGI 知识库相互独立又有关联，希望成为您学习 AI 路上的好助手。

想自学ai训练师推荐哪个视频去学习

以下是为您推荐的自学 AI 训练师的视频： 1. 3 月 26 日｜自由讨论｜离谱视频切磋大会猫先生介绍自己的背景和擅长领域 AI 学习与实践的重要性 AI 交流会：分享项目经验和技能讨论比赛规则和资源分配 AI 工具学习与合作广州 AI 训练师叶轻衣分享使用 AI 工具的经验和想法组队提升工作效率 AI 技术在 3D 动画制作中的应用与优势链接：https://waytoagi.feishu.cn/minutes/obcnc915891t51l64uyonvp2?t=0 2. AI 大神 Karpathy 再发 LLM 入门介绍视频神经网络训练的目标：训练神经网络的目标是让模型学习 token 在序列中彼此跟随的统计关系，即预测给定上下文（token 序列）后，下一个最有可能出现的 token。 Token 窗口：训练时，模型从数据集中随机抽取固定长度的 token 窗口（例如 8000 个 token）作为输入。神经网络的输入与输出：输入为 Token 序列（上下文），输出为预测下一个 token 的概率分布，词汇表中每个 token 都有一个概率值。随机初始化与迭代更新：神经网络初始参数是随机的，预测也是随机的。训练过程通过迭代更新参数，调整预测结果，使其与训练数据中的统计模式相匹配。损失函数与优化：训练过程使用损失函数来衡量模型预测与真实 token 的差距。优化算法（如梯度下降）用于调整参数，最小化损失函数，提高预测准确率。神经网络内部结构：Transformer 包含注意力机制和多层感知器等组件，能够有效地处理序列数据并捕捉 token 之间的复杂关系。链接：无

想自学ai训练师

如果您想自学成为 AI 训练师，以下是一些相关的知识和建议：一、AI 训练的基本概念训练是指通过大数据训练出一个复杂的神经网络模型。这需要使用大量标记过的数据来训练相应的系统，使其能够适应特定的功能。训练过程需要较高的计算性能，能够处理海量的数据，并具有一定的通用性，以便完成各种各样的学习任务。二、相关领域的知识 1. 机器学习：机器学习是人工智能的一个分支，是实现人工智能的途径之一，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。 2. 自然语言处理：自然语言（NLP）认知和理解是让电脑把输入的语言变成有意思的符号和关系，然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言，是人工智能和语言学领域的分支学科。三、学习资源和实践您可以参考以下的一些资源和实践方式： 1. 参加相关的线上交流会，例如 3 月 26 日的自由讨论活动，其中会分享项目经验、技能以及使用 AI 工具的经验和想法。 2. 了解一些健身的 AI 产品，如 Keep（https://keep.com/）、Fiture（https://www.fiture.com/）、Fitness AI（https://www.fitnessai.com/）、Planfit（https://planfit.ai/）等，虽然这些主要是健身领域的应用，但也能帮助您了解 AI 在不同场景中的应用和创新。请注意，以上内容由 AI 大模型生成，请仔细甄别。

怎么用把AI训练成自己的东西？

要将 AI 训练成自己的东西，可以参考以下方法： 1. 像马斯克提到的，对于公开的推文数据可以合理使用，但不能使用私人的东西进行训练。同时，要注重数据的质量和使用方式，高质量的数据对于训练效果至关重要。 2. 张梦飞的方法中，例如部署 LLama Factory 时，需要添加选中“identity”数据集，将训练轮数改成 15 等，并通过一系列操作进行训练和测试。但需要注意的是，训练大模型是复杂的过程，数据集和训练参数都会影响最终效果，需要反复调试和深入学习实践。 3. 在写作方面，我们可以根据自身需求选择人类驱动为主，利用 AI 进行修改完善，或者先由 AI 生成内容再进行修改以符合自己的风格。

如何训练一个AI 阅读教练

训练一个 AI 可以类比为培养一位职场新人，主要包括以下三个阶段： 1. 规划阶段：明确目标确定 AI 的具体任务，比如结构化外文精读等。将任务拆解为可管理的子任务。设计每个子任务的执行方法。 2. 实施阶段：实战指导搭建工作流程。为每个子任务设置清晰的操作指南。像指导新员工一样，手把手引导 AI 完成任务，并及时验证其输出质量。 3. 优化阶段：持续改进通过反复测试和调整，不断优化 AI 的性能。调整工作流程和 Prompt 配置，直到 AI 能稳定输出高质量的结果。当前大模型在处理多步骤复杂任务时存在明显局限，比如在“数据分析图表、剧情游戏”或“本文结构化外文精读”等任务中，仅依靠单一 Prompt 指令难以稳定执行，现阶段的 AI 更像缺乏独立解决问题能力的职场新人，需要遵循指引和给定的流程才能完成特定任务。如果您已经完全了解上述内容，不妨自己设定一个任务目标，动手构建一个专属于自己的 AI 。

模型训练的基本名词和方法

以下是关于模型训练的基本名词和方法的介绍：基本名词： 1. 过拟合&欠拟合：过拟合和欠拟合都是不好的现象，需要加以控制以让模型达到理想效果。解决方法包括调整训练集、正则化和训练参数等，过拟合可减少训练集素材量，欠拟合则增加训练集素材量。 2. 泛化性：泛化性不好的模型难以适应其他风格和多样的创作。可通过跑 lora 模型生图测试判断泛化性，解决办法与过拟合和欠拟合类似，从训练集、正则化、训练参数等方面调整。 3. 正则化：是解决过拟合和欠拟合情况、提高泛化性的手段，给模型加规则和约束，限制优化参数，有效防止过拟合，提高模型适应不同情况的表现和泛化性。方法： 1. 全面充分采集训练素材：例如在角色训练素材中，应包含各种角度、表情、光线等情况的素材，确保模型具有较好泛化性。 2. 图像预处理：对训练素材进行分辨率调整、裁切操作，并对训练集进行打标签处理。 3. 参数调优：尽量将训练时长控制在半小时左右，过长易导致过拟合，通过调整参数控制时长。 4. 观察学习曲线：通过观察学习曲线来调整训练素材和参数。 5. 过拟合&欠拟合处理：测试训练好的模型，观察过拟合和欠拟合问题，进一步通过调整训练素材和正则化等手段优化。此外，在模型训练中还需注意： 1. 数据集获取渠道：可通过网上收集、购买、使用无版权问题的如古画等，原则是根据生成图的需求找对应数据集，要清晰、主体元素干净、风格统一。 2. 数据集处理：包括基础处理如裁剪保证清晰和分辨率，更重要的是写标注。 3. 设置模型触发词：可自定义，完整形式可以是一句话，建议以王 flags 模型为主。 4. 统一标注风格与应用场景：例如未来高科技 3D 天然风格，用于互联网首页图像等，并概括主题内容、描述物体特征等。 5. 利用 GPT 辅助描述并人工审核：让 GPT 按要求描述，人工审核修改。 6. 模型训练的准备与流程：完成数据集描述后进入训练流程，选择模型训练分类和数据集，创建并上传数据集压缩包，注意数据名与图片命名一致。选择训练模式和参数，新手选用普通基础模式，训练集质量重要，训练参数中总步数与训练集图片数量相关，触发词设定要避免概念混乱。

comfyui工作流

ComfyUI 工作流主要包括以下内容： FLUX 低显存运行工作流：目的是让 FLUX 模型能在较低的显存情况下运行。分阶段处理思路为：先在较低分辨率下使用 Flux 模型进行初始生成，然后采用两阶段处理，即先用 Flux 生成，后用 SDXL 放大，有效控制显存的使用，最后使用 SD 放大提升图片质量。工作流的流程包括初始图像生成（Flux）的一系列操作，如加载相关模型、处理输入提示词、生成初始噪声和引导等，以及初始图像预览；图像放大和细化（SDXL）的一系列操作，如加载 SDXL 模型、对初始图像进行锐化处理等，还有最终图像预览。工作流网站： “老牌”workflow 网站 Openart.ai：https://openart.ai/workflows/ 。流量比较高，支持上传、下载、在线生成，免费账户总共有 50 个积分，加入 Discord 可以再加 100 积分，开通最低的每个月 6 美元的套餐后，每个月会有 5000 积分。 ComfyWorkflows 网站：https://comfyworkflows.com/cloud 。支持在线运行工作流，从 workflow 的实际下载量和访问量来看，略少于 openart。 Flowt.ai：https://flowt.ai/community 。绿幕工作流：包含两个组，即生成绿幕素材和绿幕素材抠图。因为 SD 无法直接生成透明背景的 png 图片，所以要先生成一张素材图，前景是重要的主体素材，背景是纯色（方便识别），选择绿幕是为了方便抠图。工作流文件可通过链接 https://pan.quark.cn/s/01eae57419ce 提取（提取码：KxgB），下载拖入 ComfyUI 中自动加载工作流进行学习。

ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI，类似于集成了 stable diffusion 功能的 substance designer，通过将 stable diffusion 的流程拆分成节点，实现了更精准的工作流定制和完善的可复现性。其优势包括： 1. 对显存要求相对较低，启动速度快，出图速度快。 2. 具有更高的生成自由度。 3. 可以和 webui 共享环境和模型。 4. 可以搭建自己的工作流程，可以导出流程并分享给别人，报错时能清晰发现错误所在步骤。 5. 生成的图片拖进后会还原整个工作流程，模型也会选择好。劣势有： 1. 操作门槛高，需要有清晰的逻辑。 2. 生态没有 webui 多（常用的都有），也有一些针对 Comfyui 开发的有趣插件。官方链接：从 github 上下载作者部署好环境和依赖的整合包，按照官方文档按照即可：https://github.com/comfyanonymous/ComfyUI 。安装部署方面： 1. 地址：https://github.com/comfyanonymous/ComfyUI ，可以下载安装包也可以直接 Git clone https://github.com/comfyanonymous/ComfyUI.git ，或者下载安装包 file:ComfyUI.zip ，下载安装包或者点击链接下载并解压至本地除 C 盘外的任意盘。然后找到文件名称为 run_nvidia_gpu 的文件双击并启动。启动完成即进入基础界面。 2. 节点存放目录：comfyUI 的节点包括后面安装的拓展节点都存放在本目录下 D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 。 3. 模型存放目录：大模型：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints 。 Lora：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras 。 Vae：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 。 4. 模型共用：已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型即可，这样就不用重复下载模型了。找到已安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件，将后缀.example 删除，然后右键用记事本打开。此外，还可以直接在 Comfy UI 中训练 LoRA 模型。

ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI，可想象成集成了 stable diffusion 功能的 substance designer，将 stable diffusion 流程拆分成节点，实现更精准工作流定制和完善的可复现性。其优势包括： 1. 对显存要求相对较低，启动和出图速度快。 2. 生成自由度更高。 3. 可以和 webui 共享环境和模型。 4. 能搭建自己的工作流程，可导出流程并分享，报错时能清晰发现错误所在。 5. 生成的图片拖进后会还原整个工作流程，模型也会选择好。劣势有： 1. 操作门槛高，需要有清晰逻辑。 2. 生态没有 webui 多（但常用的都有），也有一些针对 Comfyui 开发的有趣插件。官方链接：https://github.com/comfyanonymous/ComfyUI 。安装部署方面： 1. 地址：https://github.com/comfyanonymous/ComfyUI ，可以下载安装包也可以直接 Git clone https://github.com/comfyanonymous/ComfyUI.git ，或者下载安装包 file:ComfyUI.zip ，下载安装包或者点击链接下载并解压至本地除 C 盘外的任意盘。然后找到文件名称为 run_nvidia_gpu 的文件双击并启动，启动完成即进入基础界面。 2. 节点存放目录：comfyUI 的节点包括后面安装的拓展节点都存放在 D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 。 3. 模型存放目录：大模型：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints 。 Lora：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras 。 Vae：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 。 4. 模型共用：已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型，找到已安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件，将后缀.example 删除，然后右键用记事本打开。此外，还可以直接在 Comfy UI 中训练 LoRA 模型。默认情况下，训练结果直接保存在 ComfyUI lora 文件夹中，训练后只需刷新并选择 LoRA 就可以测试。

comfyui漫画工作流

ComfyUI 漫画工作流包含以下内容： 1. 绿幕工作流：包含两个组，即生成绿幕素材和绿幕素材抠图。因为 SD 无法直接生成透明背景的 png 图片，所以要先生成一张素材图，前景是重要的主体素材，背景为纯色（方便识别），选择绿幕是为了便于抠图。工作流文件链接：https://pan.quark.cn/s/01eae57419ce 提取码：KxgB 2. 动画工作流：啊朔提供的动画工作流文件，如：

comfyui动画片工作流怎么构建

构建 ComfyUI 动画片工作流的步骤如下： 1. 打开 Comfyui 界面后，右键点击界面，找到 Comfyui LLM party 的目录。您可以学习手动连接节点来实现最简单的 AI 女友工作流，也可以将工作流文件拖拽到 Comfyui 界面中一键复刻提示词工程实验。 2. 从 ollama 的 github 仓库找到对应版本并下载。启动 ollama 后，在 cmd 中输入 ollama run gemma2 将自动下载 gemma2 模型到本地并启动。将 ollama 的默认 base URL=http://127.0.0.1:11434/v1/以及 api_key=ollama 填入 LLM 加载器节点即可调用 ollama 中的模型进行实验。 3. 若 ollama 连接不上，很可能是代理服务器的问题，请将 127.0.0.1:11434 添加到不使用代理服务器的列表中。此外，还有以下相关工作流搭建的信息供您参考： 1. 搭建艺术二维码工作流：打开 ComfyUI 导入相应工作流。工作流所用到的节点包括大模型节点（可选择如 AWPainting、primemixanything、xxmix9realistic v40 等，并提供了相应链接）、关键词节点、Lora 节点、ControlNet 节点（选用 qrcode_monster V2 版本，下载链接：https://huggingface.co/monsterlabs/control_v1p_sd15_qrcode_monster/tree/main/v2 ）、采样器节点（Step 选择高步数，35 50 即可，采样器默认的 euler a/dpmpp 2m sde ）。 2. 搭建 ComfyUI 基础工作流：从零开始搭建时，首先准备加载大模型的节点，在工作区鼠标右键点击，选择 Add Node > 选择 loaders > 选择 Load Checkpoint，并选择对应的模型。然后加载 Conditioning（条件），在工作区鼠标右键点击，选择 Add Node > 选择 Conditioning > 选择 CLIP TEXT Encode，输入正反向提示词。添加采样器时，部分参数设置与 WEB_UI 有所不同，如 seed 值只有固定、随机、每次增加、每次减少这四个选项，采样器和调度器是分开的。

comfyui如何本地安装

以下是在本地安装 ComfyUI 的详细步骤：安装方式有两种，分别是安装到本地和安装到云端。本部分主要介绍本地安装方法。本地安装方法： 1. 命令行安装：这是普适性最强的方法，安装后二次遇到问题的概率相对较低，但对于不熟悉命令行以及代码的用户来说，可能会有一定的门槛。 ComfyUI 的源码地址在：https://github.com/comfyanonymous/ComfyUI ，安装方法写在了 Readme 中。您也可以按照 Readme 文档进行操作。如果会 Git 请在 Terminal 运行以下代码：如果不会用 Git，推荐使用 Github 的客户端（https://desktop.github.com/）拉代码。下载并安装好 Github Desktop 后，打开该应用。然后打开 ComfyUI 的 Github 页面（https://github.com/comfyanonymous/ComfyUI），点击右上角的绿色按钮，并点击菜单里的「Open with GitHub Desktop」，此时浏览器会弹出是否要打开 GitHub Desktop，点击「是」。 GitHub Desktop 会让您选择一个保存位置，按需调整，然后点击确定。看到下方特定界面，意味着完成了代码同步。 2. 安装包安装：这种方法安装比较简单，下载就能用。 ComfyUI 的官方安装包：目前仅支持 Windows 系统，且显卡必须是 Nivida。下载地址是：https://github.com/comfyanonymous/ComfyUI/releases ，只需下载最新的版本，解压就能使用。安装完成后： 1. 节点存放目录：comfyUI 的节点包括后面安装的拓展节点都存放在本目录下：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 2. 模型存放目录：大模型：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints Lora：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras Vae：D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 3. 模型共用：已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型即可，这样就不用重复下载模型了。找到您已经安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件，将后缀.example 删除，然后右键用记事本打开。希望以上内容对您有所帮助。

以下是关于 Lora 训练的详细步骤：创建数据集： 1. 进入厚德云模型训练数据集（https://portal.houdeyun.cn/sd/dataset）。 2. 在数据集一栏中，点击右上角创建数据集。 3. 输入数据集名称。 4. 可以上传包含图片+标签 txt 的 zip 文件，也可以只有图片没有打标文件（之后可在 C 站使用自动打标功能），或者一张一张单独上传照片，但建议提前把图片和标签打包成 zip 上传。 5. Zip 文件里图片名称与标签文件应当匹配，例如：图片名“1.png”，对应的达标文件就叫“1.txt”。 6. 上传 zip 以后等待一段时间。 7. 确认创建数据集。 8. 返回到上一个页面，等待一段时间后上传成功，可以点击详情检查，预览到数据集的图片以及对应的标签。 Lora 训练： 1. 点击 Flux，基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集，点击右侧箭头，会跳出所有上传过的数据集。 3. 触发词可有可无，取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 4. 训练参数这里可以调节重复次数与训练轮数，厚德云会自动计算训练步数。如果不知道如何设置，可以默认 20 重复次数和 10 轮训练轮数。 5. 可以按需求选择是否加速，点击开始训练，会显示所需要消耗的算力。 6. 然后等待训练，会显示预览时间和进度条。 7. 训练完成的会显示出每一轮的预览图。 8. 鼠标悬浮到想要的轮次模型，中间会有个生图，点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。此外，还有一些相关的补充内容： Flux 的 Lora 训练准备：需要下载几个模型：t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。注意： 1. 不使用的话它们放到哪里都可以，甚至放一起一个文件夹，只要知道“路径”，后面要引用到“路径”。 2. 因为是训练，不是跑图，训练的话，模型就用 flux1dev.safetensors 这个版本，编码器也用 t5xxl_fp16.safetensors 这个版本最好。下载脚本和安装虚拟环境： 1. 下载脚本：夸克网盘链接：https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接：https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码：pfsq 2. 下载完解压，在文件中找到 installcnqinglong.ps1 这个文件，右键选择“使用 PowerShell 运行”，新手的话这里就点击“Y”，然后等待 1 2 小时的漫长下载过程，下好了之后最后会提示是否下载 hunyuan 模型，选择 n 不用下载。 SD 训练一套贴纸 LoRA 模型： 1. 在 lora 训练器的根目录下，点击【A 强制更新国内加速】，跑完即可关闭窗口。 2. 双击【A 启动脚本】，请保持终端一直运行，不要关闭。出现下列代码即为启动成功。 3. 滚动至最下点击【LoRA 训练】或者直接点击左侧菜单【LoRA 训练】。

LoRA 微调相关内容如下：微调脚本： LoRA 微调脚本见：，单机多卡的微调可通过修改脚本中的include localhost:0 来实现。全量参数微调脚本见：。加载微调模型：基于 LoRA 微调的模型参数见：基于 Llama2 的中文微调模型，LoRA 参数需要和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数，示例代码中，base_model_name_or_path 为预训练模型参数保存路径，finetune_model_path 为微调模型参数保存路径。对于全量参数微调的模型，调用方式同模型调用代码示例，只需要修改其中的模型名称或者保存路径即可。此外，在 Comfyui AnimateDiff 项目中，有一个关键的 lora 对图像模型进行了微调，lora 地址为 https://huggingface.co/guoyww/animatediff/blob/main/v3_sd15_adapter.ckpt，lora 的强度越高，画面越稳定，但需在合理范围。在 100 基础训练大模型的 Lora 生图中，模型上的数字代表模型强度，可在 0.61.0 之间调节，默认为 0.8。您也可以自己添加 lora 文件。正向提示词输入您写的提示词，可选择基于提示词一次性生成几张图，选择生成图片的尺寸（横板、竖版、正方形）。采样器和调度器新手小白可默认，迭代步数可在 2030 之间调整，CFG 可在 3.57.5 之间调整，随机种子1 代表随机生成图。所有设置完成后，点击开始生成，生成的图会显示在右侧。若某次生成结果不错，想要微调或高分辨率修复，可点开图，下滑复制随机种子，粘贴到随机种子处，下次生成的图会与此次结果近似。若确认合适的种子和参数，想要高清放大，点开高清修复，选择放大倍数，新手小白可默认算法，迭代步数建议在 2030 之间，重回幅度在 0.30.7 之间调整。

LoRA 微调相关内容如下：微调脚本： LoRA 微调脚本见：，单机多卡的微调可通过修改脚本中的include localhost:0 来实现。全量参数微调脚本见：。加载微调模型：基于 LoRA 微调的模型参数见：基于 Llama2 的中文微调模型，LoRA 参数需要和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数，示例代码中，base_model_name_or_path 为预训练模型参数保存路径，finetune_model_path 为微调模型参数保存路径。对于全量参数微调的模型，调用方式同模型调用代码示例，只需要修改其中的模型名称或者保存路径即可。此外，在 Comfyui AnimateDiff 项目中，有一个关键的 lora 对图像模型进行了微调，lora 地址为 https://huggingface.co/guoyww/animatediff/blob/main/v3_sd15_adapter.ckpt，lora 的强度越高，画面越稳定，但需在合理范围。在 100 基础训练大模型的 Lora 生图中，模型上的数字代表模型强度，可在 0.61.0 之间调节，默认为 0.8。您也可以自己添加 lora 文件。正向提示词输入您写的提示词，可选择基于提示词一次性生成几张图，选择生成图片的尺寸（横板、竖版、正方形）。采样器和调度器新手小白可默认，迭代步数可在 2030 之间调整，CFG 可在 3.57.5 之间调整，随机种子1 代表随机生成图。所有设置完成后，点击开始生成，生成的图会显示在右侧。若某次生成结果不错，想要微调或高分辨率修复，可点开图，下滑复制随机种子，粘贴到随机种子处，下次生成的图会与此次结果近似。若确认合适的种子和参数，想要高清放大，点开高清修复，选择放大倍数，新手小白可默认算法，迭代步数建议在 2030 之间，重回幅度在 0.30.7 之间调整。

LoRA 微调相关内容如下：微调脚本： LoRA 微调脚本见：，单机多卡的微调可通过修改脚本中的include localhost:0 来实现。全量参数微调脚本见：。加载微调模型：基于 LoRA 微调的模型参数见：基于 Llama2 的中文微调模型，LoRA 参数需要和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数，示例代码中，base_model_name_or_path 为预训练模型参数保存路径，finetune_model_path 为微调模型参数保存路径。对于全量参数微调的模型，调用方式同模型调用代码示例，只需要修改其中的模型名称或者保存路径即可。此外，在 Comfyui AnimateDiff 项目中，有一个关键的 lora 对图像模型进行了微调，lora 地址为 https://huggingface.co/guoyww/animatediff/blob/main/v3_sd15_adapter.ckpt，lora 的强度越高，画面越稳定，但需在合理范围。在 100 基础训练大模型的 Lora 生图中，模型上的数字代表模型强度，可在 0.61.0 之间调节，默认为 0.8。您也可以自己添加 lora 文件。正向提示词输入您写的提示词，可选择基于提示词一次性生成几张图，选择生成图片的尺寸（横板、竖版、正方形）。采样器和调度器新手小白可默认，迭代步数可在 2030 之间调整，CFG 可在 3.57.5 之间调整，随机种子1 代表随机生成图。所有设置完成后，点击开始生成，生成的图会显示在右侧。若某次生成结果不错，想要微调或高分辨率修复，可点开图，下滑复制随机种子，粘贴到随机种子处，下次生成的图会与此次结果近似。若确认合适的种子和参数，想要高清放大，点开高清修复，选择放大倍数，新手小白可默认算法，迭代步数建议在 2030 之间，重回幅度在 0.30.7 之间调整。

flux lora训练

以下是关于 Flux 的 Lora 模型训练的详细步骤：模型准备： 1. 下载所需模型，包括 t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。注意：不使用时存放位置随意，只要知晓路径即可。训练时建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。下载脚本： 1. 网盘链接：夸克网盘链接：https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接：https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码：pfsq 安装虚拟环境： 1. 下载完脚本并解压。 2. 在文件中找到 installcnqinglong.ps1 文件，右键选择“使用 PowerShell 运行”。 3. 新手在此点击“Y”，然后等待 1 2 小时的下载过程，完成后提示是否下载 hunyuan 模型，选择 n 不用下载。数据集准备： 1. 进入厚德云模型训练数据集：https://portal.houdeyun.cn/sd/dataset 2. 创建数据集：在数据集一栏中，点击右上角创建数据集。输入数据集名称。可以上传包含图片 + 标签 txt 的 zip 文件，也可以上传只有图片的文件（之后可在 c 站使用自动打标功能），或者一张一张单独上传照片。 Zip 文件里图片名称与标签文件应当匹配，例如：图片名“1.png”，对应的达标文件就叫“1.txt”。上传 zip 以后等待一段时间，确认创建数据集，返回到上一个页面，等待一段时间后上传成功，可点击详情检查，预览数据集的图片以及对应的标签。 Lora 训练： 1. 点击 Flux，基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集，点击右侧箭头，选择上传过的数据集。 3. 触发词可有可无，取决于数据集是否有触发词。 4. 模型效果预览提示词则随机抽取一个数据集中的标签填入。 5. 训练参数可调节重复次数与训练轮数，厚德云会自动计算训练步数。若不知如何设置，可默认 20 重复次数和 10 轮训练轮数。 6. 按需求选择是否加速，点击开始训练，会显示所需要消耗的算力。 7. 等待训练，会显示预览时间和进度条。训练完成会显示每一轮的预览图。 8. 鼠标悬浮到想要的轮次模型，中间会有个生图，点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。数据集存放位置：.Flux_train_20.4\\train\\qinglong\\train 运行训练：约 1 2 小时即可训练完成。验证和 lora 跑图：有 ComfyUI 基础的话，直接在原版工作流的模型后面，多加一个 LoraloaderModelOnly 的节点就可以，自行选择 Lora 和调节参数。

LoRA 模型相关信息如下： Fooocus 程序默认用到了 3 个 SDXL 的模型，包括一个 base、一个 Refiner 和一个 LoRA。LoRA 模型默认放在 Fooocus_win64_1110\\Fooocus\\models\\loras 。如果单独安装，需要下载三个模型： SDXL 基础模型：https://huggingface.co/stabilityai/stablediffusionxlbase1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors refiner 模型：https://huggingface.co/stabilityai/stablediffusionxlrefiner1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors LoRA 模型：https://huggingface.co/stabilityai/stablediffusionxlbase1.0/resolve/main/sd_xl_offset_examplelora_1.0.safetensors 若部署了 SD 秋叶包，也可共用模型（大模型和 LoRA），可在 Fooocus_win64_1110\\Fooocus\\modules\\path.py 中修改路径为秋叶包模型对应的路径，配置好后点击 run.bat 文件启动。 Lora 全称 LowRank Adaptation Models，中文翻译为低阶自适应模型，作用在于影响和微调画面，通过它可以再现人物或物品的特征。大模型训练复杂且对电脑配置要求高，LoRA 采用在原模型中插入新的数据处理层的方式，避免修改原有模型参数，训练轻量化，显存达到 6G 即可开启训练。有利用新版 SDXL 生成的 lora 如针线娃娃，需要使用 SDXL1.0 的模型才可以运行，触发词是 BJ_Sewing_doll。想体验可添加公众号【白马与少年】，回复【SDXL】。

开源flux模型如何快速使用

以下是关于开源 Flux 模型快速使用的方法： 1. 模型的下载：如果因为环境问题，可以在网盘中下载。 siglipso400mpatch14384（视觉模型）：siglip 由 Google 开发的视觉特征提取模型，负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip，在地址栏输入 CMD 回车，打开命令行，输入下面的命令拉取模型（也可以在网盘里下载）。 image_adapter.pt（适配器）：连接视觉模型和语言模型，优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征，使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载，放到 models 的 Joy_caption 文件夹里，如果该文件夹不存在，就新建一个。 MetaLlama3.18Bbnb4bit（语言模型）：大型语言模型，负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM，地址栏输入 CMD 回车，在命令行里面输入下面命令。 2. 下载地址： ae.safetensors 和 flux1dev.safetensors 下载地址：https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。准备了夸克和百度的网盘链接，方便部分同学下载： flux 相关模型（体积较大）的夸克网盘链接：https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型（体积较大）的百度网盘链接：https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码：ub9h 。如果 GPU 性能不足、显存不够，底模可以使用 fp8 的量化版模型，速度会快很多，下载地址：https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载：最后我们再下载 dev 的工作流：。或者下面官方原版的图片链接，图片导入 comfyUI 就是工作流：https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI，把工作流或图片拖拽到 ComfyUI 里。

我现在是学了一段时间的comfyui+flux，接下来准备学Python开发comfyui节点、对接模型，这样学下去方向有没有问题呢

您学习 ComfyUI 和 Flux 一段时间后准备学习 Python 开发 ComfyUI 节点并对接模型，这个方向是可行的。以下是一些相关的知识和要点供您参考：工作流方面：工作流节点可直接拖动单个节点到任意位置，也可按住 Control 键并用鼠标左键滑框选中多个节点，再按 Shift 键一起拖动。选中节点后右键新建组，可修改组名、颜色等，组被覆盖时可直接拖动组。选中节点后右键选择对齐方式，如顶部对齐、左边对齐等。第三方节点的安装方式包括在 customer NODE manager 中安装、在 GitHub 上复制链接安装、通过终端输入指令安装、在秋叶启动器的版本管理中安装。可通过 group by Parser 节点控制组，也可通过按住节点按 control b 跳过或按 control m 终止执行。模型方面：噪声强度由种子调节，种子固定噪声分布方式，噪声与 CLIP 无关，增大噪声设置值会增强模型对图片重绘的程度。模型版本的提示词差异：1.5 以 tag 为主，XL 论文称以自然语言为主，但实际使用中因模型微调情况可能仍需用 tag。 Flux 模型有时生成黑图，可能有修复方案，需自行查询。图像生成结果为空，可能是 VAE 编码器与大模型未连接，调整连接后问题解决。安装方面：自动打标 joy_caption 副本的节点安装地址为 D:\\ComfyUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes。安装步骤包括：（Comfyui evn python.exe）python m pip install rrequirements.txt 或点击 install_req.bat，注意 transformers 版本不能太低。下载模型或者运行 ComfyUI 自动下载模型到合适文件夹，如从 https://huggingface.co/unsloth/MetaLlama3.18Bbnb4bit 下载并放到 Models/LLM/MetaLlama3.18Bbnb4bit 文件夹内。新版的 PuLID 解决了模型污染的问题，使用新版的节点需要禁用或者删除之前的 PuLID 节点，不然可能会有冲突问题。模型放在 ComfyUI\\models\\pulid 文件夹里面，注意用新版的。如果使用 PuLID，还需要安装 EVA CLIP 等模型。

flux ae.sft放在哪个文件夹

在 ComfyUI 中，flux ae.sft 应放在 ComfyUI/models/vae/ 文件夹下。 Flux 模型在 ComfyUI 中的使用，需要将相关模型放在对应的目录下。具体来说，t5xxl_fp16.safetensors 放在 ComfyUI/models/clip/ 目录下，clip_l.safetensors 放在 ComfyUI/models/clip/ 目录下，ae.safetensors 放在 ComfyUI/models/vae/ 目录下，flux1dev.safetensors 放在 ComfyUI/models/unet/ 目录下。flux1dev.safetensors 是底模，ae.safetensors 是 VAE，clip_l.safetensors 和 t5xxl_fp16.safetensors 是关于文字语言编码。

ERROR: Could not detect model type of: D:\AIruanjian\AIRUANJIAN\ComfyUI-aki(1)\ComfyUI-aki-v1.6\ComfyUI\models\checkpoints\flux1-dev-fp8.safetensors

很抱歉，根据您提供的错误信息“ERROR: Could not detect model type of: D:\AIruanjian\AIRUANJIAN\ComfyUIaki\ComfyUIakiv1.6\ComfyUI\models\checkpoints\flux1devfp8.safetensors”，暂时无法明确具体的问题原因。可能是模型文件格式不被识别，或者文件路径存在错误等。建议您检查文件的完整性和正确性，确保其符合相关软件的要求。

midjourney_whisper_flux_lora_v01

以下是关于您提到的“midjourney_whisper_flux_lora_v01”的相关信息： 1. XLabsAI 发布了 6 个不同的 Lora，包括 Midjourney 风格、写实风格、动漫风格、迪斯尼风格、风景风格等，并提供了相应示例。 2. 文生图模型排序（从高到低）：Imagen 3 真实感满分，指令遵从强；Recraft 真实感强，风格泛化很好，指令遵从较好（会受风格影响）；Midjourney 风格化强，艺术感在线，但会失真，指令遵从较差；快手可图影视场景能用，风格化较差；Flux.1.1 真实感强，需要搭配 Lora 使用；文生图大模型 V2.1L（美感版）影视感强，但会有点油腻，细节不够，容易糊脸；Luma 影视感强，但风格单一，糊；美图奇想 5.0 AI 油腻感重；腾讯混元 AI 油腻感重，影视感弱，空间结构不准；SD 3.5 Large 崩。 3. 指定 AI 生图里的文字，有 9 种解决方案，其中 2 种快过时了。包括 Midjourney（v6 版本开始支持文字效果，主要支持英文，中文支持有限）、Ideogram（以图片嵌入文字能力闻名，2.0 模型能力得到进一步加强，支持复杂文本和多种艺术风格，文字与图像能够自然融合，支持英文，中文提示词可自动翻译为英文）、Recraft（V3 开始支持文本渲染能力，是目前唯一能在图像中生成长文本的模型，支持精确的文本位置控制，支持图像编辑功能，支持矢量图生成，支持英文，中文渲染能力较弱）、Flux（FLUX.1 是一款高质量的开源图像生成模型，支持复杂指令，支持文本渲染，支持图像编辑，生成图像的质量很高，主要支持英文）。