Chat with Wiki - 部署私有大模型需要什么显卡

Answer

部署私有大模型对显卡的要求如下：

显存是显卡选择的第一要素，生成速度优先级相对较低。
- SD1.5 版本的底模 6G 显存能勉强跑，8G 显存可较流畅生成图片和炼制 lora，12G 能流畅使用 Dreambooth 微调大模型。
- 即将到来的 SDXL 对显卡性能要求更高，8G 显存起步，建议 16G 显存，微调大模型可能需要 20G 以上的显存，只有 4090 和 3090 能较好应对。
预算不足时，可选择 30 系显卡或二手显卡。但不建议选择 P40 之类超大显存但速度超级慢的卡。
常见显卡中，4090 生成 512 的图可跑进 1 秒内。
对于一些垂直场景的专有技能模型，极端情况下单机单卡，如消费级显卡 3090、3080、RTX 显卡也可以使用。

综合多方评测结论，4090 是用于 SD 图像生成综合性价比最高的显卡。如果有打算进行 Dream booth 微调大模型，硬盘空间要准备充足，一次训练可能会产生几十 G 的文件。同时，其他电脑配件只要不太差即可，内存建议 32GB 以上。硬盘方面，不建议考虑机械盘，可选择国产固态。

Content generated by AI large model, please carefully verify (powered by aily)

References

Stable Diffusion电脑配置选购指南

其他电脑配件只要不太差就行了，要使用SDXL的话内存建议32GB以上。以前可能执着于要搭配好的电源主板等等，现在觉得国产的虽然没那么好，但是价格有便宜下来也可以，选择带有保修服务的商家就可以更放心一点了。如果预算不足的话，其他硬件都可以压一压，i9压成i5就省下不少。但是硬盘这一块我建议可以不用考虑买机械盘了，上个500块的长江存储2T的国产固态做系统盘，再买个1000块的4T国产固态做仓库盘，就很美好了。机械硬盘性价比不高，要买建议买大容量的。如果有打算进行Dream booth微调大模型的话，那么硬盘空间要准备多一点，一次训练可能会产生几十G的文件，基本上都需要多次训练测试，空间很快就满了。最后，综合我看过的多方评测的结论，4090才是用于SD图像生成综合性价比最高的显卡哈哈哈，贵的比较值得，其他便宜一点的代价是更大的损失。有志于深入研究SD图像生成的同学都可以考虑配备一个，工欲善其事，必先利其器。

Stable Diffusion电脑配置选购指南

显卡的选择中显存是第一要素，生成速度优先级相对较低。SD1.5版本的底模6G显存也能勉强跑，8G显存就可以比较流畅的生成图片和炼制lora，12G可以流畅的使用Dreambooth微调大模型。下图为Dreambooth的显存使用要求：即将到来的SDXL对显卡性能要求上了一个台阶，目前我了解到的参数是8G显存起步，建议16G显存，微调大模型可能需要20G以上的显存，只有4090和3090顶得住哈哈。预算不足的话选择30系的显卡，或者二手显卡也是一个选择，总比跑不动炸显存要好。至于P40之类超大显存但速度超级慢的卡我不太了解，这边不建议普通用户选择。下图为SDXL的显存使用要求：下方的常见显卡跑图性能、性价比表可以作为参考之一，数据并非100%准确。我的个人体验是4090生成512的图可以跑进1秒内，M1 Max的则可能需要10秒左右。（再次强调，MAC虽然勉强能跑，但不适合正式使用，不建议折腾）

周鸿祎免费课AI系列第二讲-企业如何拥抱AI

那么如果我们提出这样的要求，我们就发现我们所有的问题就得到了一个很满意的解答。我只要不追求这个大模型，又会写诗，又会翻译，还又能解数学题，还能够写营销文章，还能作画。我们过去通用大模型是给我们一个幻觉，觉得我大模型就该做这么多事，对吧？但实际上我们仔细的分析到，现在如果我们对大模型的要求放低，像我就降低对自己的期望，我就没有那么大压力。所以如果做一个垂直场景的专有技能的模型，不需要千亿万亿的参数，那个参数就浪费百亿，十亿的参数就够用。最近出现的一些新的大模型大概都是在几十亿到百亿这个参数，现在大家已经流行的是说看谁能用更小，用少的参数实现那些过去千亿模型才能实现的能力。所以说的夸张点，不需要H800，不需要H100，也不需要A800，也不需要A100。最极端上单机，单卡弄张消费机显卡30903080这RTX显卡就可以用。