要确认 torch 的版本,可以通过以下几种常见方法:
torch.__version__
来获取版本信息。另外,在一些相关的配置和安装说明中也可能会提及 torch 的版本要求,例如:
同时,在处理与 CUDA 相关的配置时,要确保 pytorch 版本与 CUDA 版本相匹配,例如 cuda12.1 实测可以匹配 cuda 12.4 对应的 Pytorch 版本。
这个视频介绍了从头开始到高级水平使用Web UI和DreamBooth扩展进行稳定扩散训练的教程。内容涵盖了如何安装和更新Web UI的扩展,使用DreamBooth进行训练,准备训练数据集,检查点保存,如何处理过度训练,生成图像,以及如何使用AI进行图像升级等。此外,还介绍了如何在Google Colab中使用训练模型,进行微调和混合训练,以及如何解决内存不足错误等问题。这个视频介绍了如何将训练好的模型注入到自定义的Stable Diffusion模型中,和什么是主模型、次要模型和第三方模型,如何为新注入的主题模型选择合适的提示强度和CFG值等细节教程。这个视频主要介绍了如何降级CUDA和xformers版本以进行合适的训练,以及如何在仅具备8GB GPU的情况下进行LoRA训练。这个视频介绍DreamBooth技术的最佳训练设置和参数,并且举了使用0-100张不同张数训练集进行训练的案例,提供了对应的xyz轴对比图。还有文本引导视图合成、属性修改和配饰添加等内容。这个视频也是介绍各种设置和优化器的比较的,通过对比各实验的x/y/z网格图像来确定最佳训练模型。这个视频主要是讲如何升级到Torch版本2(PyTorch 2),以实现显著的图像生成和训练速度提升。视频教程这部分提供的视频很详细,我觉得讲解参数设置对比的视频比较重要,毕竟跑通流程并不难,能掌控参数训练出自己想要的模型才比较难,后续也会继续学习分享视频教程的笔记。Usage使用方法Create a Model创建一个模型1.进入Dreambooth选项卡。
以Windows为例:Python:由于实用到了f-string,至少要python 3.6以上版本,推荐现在比较流行的python 3.10ffmpeg:需要把ffmpeg里bin文件夹设置path环境变量,让python可以正常调用在cmd界面运行ffmpeg,可以查看到版本信息,就是变量设置成功了cuda:如果使用GPU来处理音频,可以用cuda提速,我是3050显卡,一首歌半分钟就转完了pytorch:一定要对应cuda对应的支持版本,否则程序无法正确运行目前cuda官网最新的版本是[12.4](https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local#),对应找到配套的[Pytorch](https://pytorch.org/get-started/locally/)版本,cuda12.1,实测可以匹配cuda 12.4下载完以后默认安装就可以本地运行完成安装如果没有N卡,可以用cpu代替cuda进行运算处理,缺点就是速度慢一些,代码中可以做一些相应调整(后面会讲到)[heading1]生成MID文件[content]把源文件放在input文件夹(支持MP3,WAV)可以直接用vs code运行start.py,也可以右键点击文件夹空白,打开Powershell窗口输入在cmd环境运行原始的start.py代码里是默认cuda运行的如果用cpu跑,还得把里面的cuda改成cpu,有点麻烦,我做了个简单的条件语句,这样可以在判定cuda不可用时自动转为cpu模式。转谱完成后,在output文件夹找到对应的mid文件
python 3.8及以上版本pytorch 1.13.1及以上版本transformers 4.26.1及以上版本建议使用CUDA 11.7及以上1、仓库克隆及依赖安装2、模型权重下载([链接](https://huggingface.co/Kwai-Kolors/Kolors)):或者3、模型推理:4、Web demo:[heading3]在Diffusers中使用[content]确保您安装了最新版本的diffusers(0.30.0.dev0):注意:KolorsPipeline默认使用EulerDiscreteScheduler作为噪声调度器。我们推荐使用该调度器时搭配guidance scale=5.0及num_inference_steps=50。KolorsPipeline同时支持EDMDPMSolverMultistepScheduler。在使用该噪声调度器时,推荐使用参数guidance scale=5.0及num_inference_steps=25。除了文生图能力,KolorsImg2ImgPipeline同时也支持图文生图功能。运行以下指令进行图像生成: