Chat with Wiki - 怎么训练自己的模型

Answer

训练自己的模型可以参考以下内容：

基于百川大模型：
- 选择 Baichuan2-7B-Chat 模型作为底模，配置模型本地路径和提示模板。
- 在 Train 页面里，选择 sft 训练方式，加载定义好的数据集（如 wechat 和 self_cognition）。
- 注意学习率和训练轮次的设置，要根据数据集大小和收敛情况来调整。
- 使用 FlashAttention-2 可减少显存需求，加速训练速度。
- 显存小的情况下，可以减少 batch size 并开启量化训练，内置的 QLora 训练方式好用。
- 需要用到 xformers 的依赖。
- 显存占用约 20G 左右，训练时间根据聊天记录规模大小而定，少则几小时，多则几天。
训练自己的 AI 绘画模型（Stable Diffusion）：
- 样本采样器（sample_sampler）：可选择["ddim","pndm","lms","euler","euler_a","heun","dpm_2","dpm_2_a","dpmsolver","dpmsolver++","dpmsingle","k_lms","k_euler","k_euler_a","k_dpm_2","k_dpm_2_a"]，默认是“ddim”。
- 保存模型格式（save_model_as）：可选择["ckpt","safetensors","diffusers","diffusers_safetensors"]，SD WebUI 兼容"ckpt"和"safetensors"格式模型。
- 训练流程主要包括：
  - 训练集制作：数据质量评估、标签梳理、数据清洗、标注、标签清洗、增强等。
  - 训练文件配置：预训练模型选择、训练环境配置、训练步数及其他超参数设置等。
  - 模型训练：运行训练脚本，使用 TensorBoard 监控。
  - 模型测试：用于效果评估与消融实验。
- 训练资源：
  - https://github.com/Linaqruf/kohya-trainer
  - https://github.com/huggingface/diffusers/tree/main/examples
  - Rocky 整理优化过的 SD 完整训练资源 SD-Train 项目，可通过关注公众号 WeThinkIn，后台回复“SD-Train”获取。

Content generated by AI large model, please carefully verify (powered by aily)

References

选择Baichuan2-7B-Chat模型作为底模，配置模型本地路径，配置提示模板Train页面里，选择sft训练方式，加载定义好的数据集wechat和self_cognition。其中学习率和训练轮次非常重要，根据自己的数据集大小和收敛情况来设置，使用FlashAttention-2则可以减少显存需求，加速训练速度；显存小的朋友可以减少batch size和开启量化训练，内置的QLora训练方式非常好用。需要用到xformers的依赖具体命令参数如下：显存占用20G左右，耐心等待一段时间，请神模式开启...根据聊天记录规模大小，少则要几小时，多则几天，一个虚拟助手就能训练完成了。专不专业还有待大量标准问答验证，只是口气和习惯的模仿是有点意思的，若再加上[《克隆自己的声音——赛博分身必备技能》](http://mp.weixin.qq.com/s?__biz=MzI0MzA4NDkwMw==&mid=2247492147&idx=1&sn=efacb40a6c5610b6ed7368ba1d043f13&chksm=e970d93bde07502df2ff09ae3e700923ae285c21c7151282870d9e1db309da07ee5a49f609ed&scene=21#wechat_redirect)的效果，那几乎就传神了。不过这里还有很多细节工作需要完善：

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

sample_sampler：设置训练中测试模型效果时使用的sampler，可以选择["ddim","pndm","lms","euler","euler_a","heun","dpm_2","dpm_2_a","dpmsolver","dpmsolver++","dpmsingle","k_lms","k_euler","k_euler_a","k_dpm_2","k_dpm_2_a"]，默认是“ddim”。save_model_as：每次模型权重保存时的格式，可以选择["ckpt","safetensors","diffusers","diffusers_safetensors"]，目前SD WebUI兼容"ckpt"和"safetensors"格式模型。（3）SD关键参数详解（4）SD模型训练完成训练参数配置后，我们就可以运行训练脚本进行SD模型的全参微调训练了。我们本次训练用的底模型选择了WeThinkIn_SD_二次元模型，大家可以关注Rocky的公众号WeThinkIn，后台回复“ SD_二次元模型”获取模型资源链接。我们打开SD_finetune.sh脚本，可以看到以下的代码：我们把训练脚本封装在accelerate库里，这样就能启动我们一开始配置的训练环境了。在本文的6.2节中，我们已经详细介绍了如何配置accelerate训练环境，如果我们想要切换不同的训练环境参数，我们只需要将accelerate_config.yaml改成我们所需要的配置文件与路径即可（比如：/本地路径/new_accelrate_config.yaml）。

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

Stable Diffusion系列模型的训练流程主要分成以下几个步骤：1.训练集制作：数据质量评估，标签梳理，数据清洗，数据标注，标签清洗，数据增强等。2.训练文件配置：预训练模型选择，训练环境配置，训练步数设置，其他超参数设置等。3.模型训练：运行SD模型/LoRA模型训练脚本，使用TensorBoard监控模型训练等。4.模型测试：将训练好的自训练SD模型/LoRA模型用于效果评估与消融实验。讲完Stable Diffusion模型训练的方法论，Rocky再向大家推荐一些Stable Diffusion的训练资源：[https:// github.com/Linaqruf/koh ya-trainer](https://link.zhihu.com/?target=https%3A//github.com/Linaqruf/kohya-trainer)（本文中主要的训练工程）[https:// github.com/huggingface/ diffusers/tree/main/examples](https://link.zhihu.com/?target=https%3A//github.com/huggingface/diffusers/tree/main/examples)（huggingface的diffusers开源训练框架）Rocky整理优化过的SD完整训练资源SD-Train项目，大家只用在SD-Train中就可以完成SD的模型训练工作，方便大家上手实操。SD-Train项目资源包可以通过关注公众号WeThinkIn，后台回复“ SD-Train ”获取。目前我们对Stable Diffusion的训练流程与所需资源有了初步的了解，接下来，就让我们跟随着Rocky的脚步，从0到1使用Stable Diffusion模型和训练资源一起训练自己的Stable Diffusion绘画模型与LoRA绘画模型吧！