直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

4060显卡用Stable Diffusion怎么样

回答

4060 显卡用于 Stable Diffusion 的情况如下:

在 30 系列显卡中,3060ti 12GB 显卡、3090 和 3090ti 比较适合 Stable Diffusion 生成图片,其他显存不够的显卡意义不大。2080ti 22GB 魔改版本显卡比较考验运气,不建议普通玩家选购。A5000 等专业卡不能玩游戏,生成速度不如同价位游戏卡,半精度训练模型运算速度可能会快一点,也不建议普通玩家选购。

如果使用 40 系显卡,16GB 的 4060ti 虽然速度比 12GB 的 4070ti 慢一点,但大显存可以执行更多样的 AI 生成任务,比如生成更大分辨率的超清图片,使用更高的参数进行 Dream booth 微调等。

需要注意的是,如果在 Stable Diffusion 模型加载时遇到 CUDA 显存不足的错误,简单来说就是显卡不行,没有足够的显存空间分配给该模型。解决方法有:换个好一些的显卡,至少英伟达 2060 以上;或者开启低显存模式。

开启低显存模式的方法如下:在 stable-diffusion-webui 文件夹下找到 webui-user.bat,用文本或代码编辑器打开该文件夹。如果显卡显存不足 3G,可以在 set COMMANDLINE_ARGS=的后面添加参数–lowvram –always-batch-cond-uncond 之后保存。如果显卡只有 4G 显存,可以在 set COMMANDLINE_ARGS=的后面添加参数–precision full –no-half –lowvram –always-batch-cond-uncond 之后保存。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Stable Diffusion电脑配置选购指南

30系列显卡中,我认为3060ti12GB显卡和3090、3090ti三款显卡是比较适合SD生成图片的,其他的显存不够,快一点意义不大。至于2080ti22GB魔改版本显卡,比较考验运气哈哈,建议还是多花点求个稳定。A5000等专业卡不能玩游戏,生成速度不如同价位游戏卡,半精度训练模型运算速度可能会快一点,不建议普通玩家选购。

教程:Stable Diffusion 安装过程中常见报错解决方法

Stable diffusion model failed to load,exiting请按任意键继续。..根据错误信息显示,Stable Diffusion模型加载时遇到了CUDA显存不足的错误,简单点来说就是显卡不行,没有足够的显存空间分配给该模型。解决方法1:换个好一些的显卡,至少英伟达2060以上。解决方法2:开启低显存模式,开启低显存模式的方法如下。在stable-diffusion-webui文件夹下找到webui-user.bat,用文本或代码编辑器打开该文件夹,可以看到如下内容。@echo offset PYTHON=set GIT=set VENV_DIR=set COMMANDLINE_ARGS=call webui.bat我们只需要修改set COMMANDLINE_ARGS=部分即可,该部分内容是启动参数。低于3G显存如果你的显卡显存不足3G,可以在set COMMANDLINE_ARGS=的后面添加参数–lowvram –always-batch-cond-uncond之后保存即可,变更之后的文件内容如下。@echo offset PYTHON=set GIT=set VENV_DIR=set COMMANDLINE_ARGS=–lowvram –always-batch-cond-uncondcall webui.bat4G显存如果你的显卡只有4G显存,可以在set COMMANDLINE_ARGS=的后面添加参数–precision full –no-half –lowvram –always-batch-cond-uncond之后保存即可,变更之后的文件内容如下。@echo offset PYTHON=set GIT=set VENV_DIR=set COMMANDLINE_ARGS=–precision full –no-half –lowvram –always-batch-cond-uncond

Stable Diffusion电脑配置选购指南

下方是40系的产品对比图,大家可以按照自己的预算选购。我认为16GB的4060ti虽然速度比12GB的4070ti慢了一点,但是大显存可以执行更多样的AI生成任务,比如生成更大分辨率的超清图片,使用更高的参数进行Dream booth微调等,相比起能不能执行任务,执行任务慢一点就不那么重要了。

其他人在问
蛟龙16pro配置(处理器R7-7745HX,显卡RTX4060 8G,硬盘512GPCIE4.0SSD)可以用于审计人员本地化部署大模型用于数据分析工作吗
蛟龙 16pro 的配置(处理器 R77745HX,显卡 RTX4060 8G,硬盘 512G PCIE4.0 SSD)对于审计人员本地化部署大模型用于数据分析工作来说,可能存在一定的局限性。 处理器 R77745HX 具有一定的计算能力,但在处理大规模数据和复杂的模型运算时,其性能可能不够强劲。 显卡 RTX4060 8G 对于一些较为复杂的图形处理和计算任务能够提供一定的支持,但对于大规模的深度学习模型训练和数据分析,可能会显得不足。 512G 的 PCIE4.0 SSD 硬盘容量相对较小,在存储大量数据时可能会很快耗尽空间。 综上所述,该配置在一定程度上可以用于简单的数据分析任务,但对于较为复杂和大规模的大模型本地化部署及数据分析工作,可能需要更强大的硬件配置,例如更高性能的处理器、更大容量和更高性能的显卡,以及更大的存储空间。
2024-09-14
部署私有大模型需要什么显卡
部署私有大模型对显卡的要求如下: 显存是显卡选择的第一要素,生成速度优先级相对较低。 SD1.5 版本的底模 6G 显存能勉强跑,8G 显存可较流畅生成图片和炼制 lora,12G 能流畅使用 Dreambooth 微调大模型。 即将到来的 SDXL 对显卡性能要求更高,8G 显存起步,建议 16G 显存,微调大模型可能需要 20G 以上的显存,只有 4090 和 3090 能较好应对。 预算不足时,可选择 30 系显卡或二手显卡。但不建议选择 P40 之类超大显存但速度超级慢的卡。 常见显卡中,4090 生成 512 的图可跑进 1 秒内。 对于一些垂直场景的专有技能模型,极端情况下单机单卡,如消费级显卡 3090、3080、RTX 显卡也可以使用。 综合多方评测结论,4090 是用于 SD 图像生成综合性价比最高的显卡。如果有打算进行 Dream booth 微调大模型,硬盘空间要准备充足,一次训练可能会产生几十 G 的文件。同时,其他电脑配件只要不太差即可,内存建议 32GB 以上。硬盘方面,不建议考虑机械盘,可选择国产固态。
2024-09-08
显卡对于AI的作用
显卡在 AI 领域具有重要作用: 1. 提供计算能力:算力可以直接转化为 GPU,电脑里的显卡就是 GPU。购买云服务时,也是服务商购买显卡“租”给用户使用,算力约等于显卡。 2. 图像和图形运算:GPU(图形处理器)是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。 3. 数据处理和存储:显存用于存储显卡芯片处理过或者即将提取的渲染数据,如同计算机的内存一样,是存储要处理的图形信息的部件。 4. 执行特定任务优势:在模型启动过程中,数据从硬盘加载到显卡中。显卡在处理某些任务上优于 CPU,主要是因为它专注于执行浮点运算,而 CPU 负责执行更广泛的计算任务。 5. 满足多样生成任务需求:如在 Stable Diffusion 中,16GB 的 4060ti 虽速度比 12GB 的 4070ti 慢,但大显存可执行更多样的 AI 生成任务,如生成更大分辨率的超清图片,使用更高的参数进行 Dream booth 微调等。
2024-08-27
Stable Diffusion需要什么显卡
Stable Diffusion 对显卡的要求如下: 1. 显存是显卡选择的第一要素,生成速度优先级相对较低。SD1.5 版本的底模 6G 显存能勉强跑,8G 显存可较流畅生成图片和炼制 lora,12G 能流畅使用 Dreambooth 微调大模型。即将到来的 SDXL 对显卡性能要求更高,8G 显存起步,建议 16G 显存,微调大模型可能需要 20G 以上显存,只有 4090 和 3090 能较好应对。 2. 预算不足时可选择 30 系显卡或二手显卡,但不建议普通用户选择 P40 之类超大显存但速度超级慢的卡。 3. 常见显卡跑图性能、性价比表可作为参考之一,但数据并非 100%准确。例如 4090 生成 512 的图可跑进 1 秒内,M1 Max 则可能需要 10 秒左右。 4. 必须确认是 NVIDIA(英伟达)的显卡(俗称 N 卡)才可进行下一步。如果是 AMD 或者 Intel 显卡,电脑可能不太支持 SD,安装教程也较麻烦,可考虑使用云平台。 5. 专用 GPU 内存 4GB 时,电脑勉强可跑动 SD,出图时间较长;6GB 时,出一张图时间为 20 50 秒,SD 大部分功能可用;8GB 时,5 20 秒可出一张图,SD 所有功能基本开放。 6. 安装前需注意:电脑系统为 Win10 或 Win11,避免使用更低版本系统以避免兼容性问题。检查电脑配置能否带动 SD 需满足 3 个要求,即电脑运行内存 8GB 以上、是英伟达显卡、显卡内存 4GB 以上。检查方法为鼠标右击桌面底部任务栏,点击“任务管理器”,在“性能”里查看内存和 GPU。
2024-08-13
联想thinkpad t14p ai 笔记本选择i5处理器还是i7处理器,选择独显还是集成显卡,针对一个刚上大学的学生来说?
对于刚上大学的学生来说,选择联想 ThinkPad T14p AI 笔记本的处理器和显卡需要综合考虑多方面因素。 在处理器方面,i5 处理器通常能够满足大多数日常学习和娱乐需求,如文档处理、网页浏览、观看视频等。如果您只是进行这些常规操作,并且预算相对有限,i5 处理器是一个经济实惠的选择。 然而,如果您计划进行一些较为复杂的任务,例如视频编辑、运行大型软件或同时处理多个繁重的任务,i7 处理器可能会提供更流畅和快速的性能。 在显卡方面,集成显卡足以应对日常的学习和一般的多媒体使用。如果您不玩大型游戏或进行专业的图形设计工作,集成显卡可以满足需求,并且具有更低的功耗和更好的续航表现。 但如果您偶尔会玩一些对显卡性能有一定要求的游戏,或者有涉及图形处理的课程或兴趣爱好,那么独立显卡可能会带来更好的体验。 综上所述,如果您的预算有限,且日常使用场景较为简单,选择 i5 处理器和集成显卡的组合是可以的。如果您希望在未来几年内有更强大的性能应对可能出现的复杂任务,并且预算充足,可以考虑 i7 处理器和独立显卡的配置。
2024-08-13
显卡3060ti和3060tig6x谁好
比较显卡 NVIDIA GeForce RTX 3060 Ti 和 RTX 3060 Ti G6X 的性能和规格,可以帮助你确定哪一款更适合你的需求。 NVIDIA GeForce RTX 3060 Ti 发布年份:2020年 显存类型:GDDR6 显存容量:8 GB 显存带宽:448 GB/s CUDA 核心数:4864 基础/加速频率:1410 MHz / 1665 MHz 功耗:200W 建议零售价:较低 NVIDIA GeForce RTX 3060 Ti G6X 发布年份:2022年 显存类型:GDDR6X 显存容量:8 GB 显存带宽:608 GB/s CUDA 核心数:4864 基础/加速频率:可能略有提高(具体频率待确认) 功耗:220W 建议零售价:较高 主要区别 1. 显存类型和带宽: RTX 3060 Ti 使用 GDDR6 显存,带宽为 448 GB/s。 RTX 3060 Ti G6X 使用更先进的 GDDR6X 显存,带宽为 608 GB/s。 这意味着 G6X 版本在处理大数据量和高速数据传输方面表现更好。 2. 功耗: RTX 3060 Ti 的功耗为 200W。 RTX 3060 Ti G6X 的功耗为 220W。 G6X 版本功耗稍高,需要更好的散热和电源配置。 3. 价格: 由于 G6X 显存更先进,RTX 3060 Ti G6X 的售价通常会比 RTX 3060 Ti 略高。 性能对比 在大多数游戏和应用程序中,RTX 3060 Ti G6X 的性能会略优于 RTX 3060 Ti,特别是在高分辨率或需要大量显存带宽的情况下。 对于一般的1080p和1440p游戏,两者性能差距可能不大,但在4K分辨率和需要更多带宽的任务(如视频编辑和3D渲染)中,G6X 版本会有更明显的优势。 适用场景 RTX 3060 Ti:适合预算较低,注重性价比的用户,主要用于1080p和1440p游戏。 RTX 3060 Ti G6X:适合希望获得更高显存带宽,进行高分辨率游戏,视频编辑,3D建模等对显存带宽要求较高的用户。 总结 如果你的主要需求是高分辨率游戏和专业内容创作,并且你愿意为更好的性能付出额外的费用,那么 RTX 3060 Ti G6X 是更好的选择。否则,对于一般的游戏和日常使用,RTX 3060 Ti 依然是一个非常强大的显卡,性价比更高。
2024-05-30
Stable Diffusion官网
以下是 Stable Diffusion 的相关信息: Stable Diffusion 系列资源: SD 1.4 官方项目: SD 1.5 官方项目: SD 2.x 官方项目: diffusers 库中的 SD 代码 pipelines: SD 核心论文: SD Turbo 技术报告: 教程目录: 1. Stable Diffusion 系列资源 2. 零基础深入浅出理解 Stable Diffusion 核心基础原理 2.1 通俗讲解 Stable Diffusion 模型工作流程(包含详细图解) 2.2 从 0 到 1 读懂 Stable Diffusion 模型核心基础原理(包含详细图解) 2.3 零基础读懂 Stable Diffusion 训练全过程(包含详细图解) 2.4 其他主流生成式模型介绍 3. Stable Diffusion 核心网络结构解析(全网最详细) 3.1 SD 模型整体架构初识 3.2 VAE 模型 3.3 UNet 模型 3.4 CLIP Text Encoder 模型 3.5 SD 官方训练细节解析 4. 从 0 到 1 搭建使用 Stable Diffusion 模型进行 AI 绘画(全网最详细讲解) 4.1 零基础使用 ComfyUI 搭建 Stable Diffusion 推理流程 4.2 零基础使用 SD.Next 搭建 Stable Diffusion 推理流程 4.3 零基础使用 Stable Diffusion WebUI 搭建 Stable Diffusion 推理流程 目前 Stable Diffusion WebUI 可以说是开源社区使用 Stable Diffusion 模型进行 AI 绘画最热门的框架。是 AI 绘画领域最为流行的框架,其生态极其繁荣,非常多的上下游插件能够与 Stable Diffusion WebUI 一起完成诸如 AI 视频生成,AI 证件照生成等工作流,可玩性非常强。接下来,咱们就使用这个流行框架搭建 Stable Diffusion 推理流程。首先,我们需要下载安装 Stable Diffusion WebUI 框架,我们只需要在命令行输入如下代码即可。安装好后,我们可以看到本地的 stablediffusionwebui 文件夹。下面我们需要安装其依赖库,我们进入 Stable Diffusion WebUI 文件夹,并进行以下操作。和 SD.Next 的配置流程类似,我们还需要配置 Stable Diffusion WebUI 的 repositories 插件,我们需要运行下面的代码。如果发现 repositories 插件下载速度较慢,出现很多报错,don't worry,大家可以直接使用 Rocky 已经配置好的资源包,可以快速启动 Stable Diffusion WebUI 框架。Stable Diffusion WebUI 资源包可以关注公众号 WeThinkIn,后台回复“ WebUI 资源”获取。 4.4 零基础使用 diffusers 搭建 Stable Diffusion 推理流程 4.5 Stable Diffusion 生成示例 5. Stable Diffusion 经典应用场景 5.1 文本生成图像 5.2 图片生成图片 5.3 图像 inpainting 5.4 使用 controlnet 辅助生成图片 5.5 超分辨率重建 6. 从 0 到 1 上手使用 Stable Diffusion 训练自己的 AI 绘画模型(全网最详细讲解) 6.0 Stable Diffusion 训练资源分享 6.1 Stable Diffusion 模型训练初识 6.2 配置训练环境与训练文件 6.3 SD 训练数据集制作 6.4 Stable Diffusion 微调(finetune)训练
2024-09-18
stable diffusion可以用macbook 13来运行吗?配置够吗
Stable Diffusion(简称“SD”)的运行对电脑配置有一定要求。对于 Windows 系统: 显卡:必须是 NVIDIA(俗称 N 卡)。 专用 GPU 内存:4GB 勉强可以跑动 SD,出图时间较长;6GB 出一张图时间为 20 50 秒,大部分功能可用;8GB 5 20 秒出一张图,所有功能基本开放。 电脑运行内存:8GB 以上。 电脑系统:Win10 或者 Win11。 对于 Mac 系统,可以查看以下视频进行一键安装:https://www.bilibili.com/video/BV1Kh4y1W7Vg/?spm_id_from=333.788&vd_source=6f836e2ab17b1bdb4fc5ea98f38df761 但具体 MacBook 13 是否能运行及配置是否足够,还需根据上述标准进行对照检查。
2024-09-16
stable diffusion 与大模型的关系?
Stable Diffusion 与大模型的关系如下: 与其他大模型相比,Stable Diffusion 让用户使用消费级显卡就能实现文生图,且完全免费开源,代码在 GitHub 公开可拷贝使用。 在公众传播层面,AIGC 指用 Stable Diffusion 或 Midjourney 生成图像内容,后来泛指用 AI 生成音乐、图像、视频等内容。LLM 指 NLP 领域的大语言模型,如 ChatGPT。GenAI 是生成式人工智能模型,涵盖了 LLM 和 AIGC。 Stable Diffusion 原采用 LDM+UNet,后来改为 DiT。Transformer 是公众传播中常用名词的底层结构,其底层是 function loss 损失函数,是一个大参数(千亿级别)的回归方程,能在一定 prompt condition 下,重复曾经出现的数据内容实现“生成”能力。 大语言模型是一个 perfect memory,能重复曾经出现的内容,其智能体验在于能解释两个数据集压缩后的“连续”能力。与 Alpha Go 不同,Alpha Go 是增强学习模型,学习结果会调整自身参数,有推理能力,而大语言模型在推理方面较弱。Transformer 决定 LLM 是一个生成式模型。
2024-09-13
stable diffusion和comfly UI
Stable Diffusion 是一种图像生成模型,而 ComfyUI 是一个基于节点流程式的 Stable Diffusion AI 绘图工具 WebUI。 ComfyUI 具有以下特点和相关知识: 工作流定制:通过将 Stable Diffusion 的流程拆分成节点,实现更加精准的工作流定制和完善的可复现性。 核心组件: UNET:从噪音中生成图像的主要组件,在预测过程中通过反复调用,将其预测输出的 noise slice 从原有的噪声中去除,得到逐步去噪后的图像表示。Stable Diffusion Model 的 UNET 包含约 860M 的参数,以 float32 的精度编码大概需要 3.4G 的存储空间。 CLIP:将用户输入的 Prompt 文本转化成 text embedding,UNET 进行迭代降噪,在文本引导下进行多轮预测。 存放路径:ComfyUI 的 Checkpoint 存放路径为 models/checkpoints/,包括 SD 基础预训练模型,如 SD1.5、SDXL 以及 SD 微调模型。 模型实例:如【majicMIX realistic 麦橘写实 V7】by 麦橘 MERJIC sd1.5 微调、【LEOSAM HelloWorld 新世界】by LEOSAM 是只兔狲 SDXL 微调。 训练方法:如 DreamBooth,by Google。 格式:EMAonly & pruned 和 Full,EMAonly & pruned 只画图,Full 可画图和微调训练。 在与 Blender 结合方面: 安装:先安装稳定版 Blender(可从网盘下载或在 Steam 平台下载),然后安装无限圣杯的插件。进入“偏好设置”——插件——选择“安装”,找到“无限圣杯节点工具”里面的压缩包进行安装,安装好之后打上勾。接着更改 ComfyUI 路径为电脑中的地址,并选择适合自己的显存模式。安装完成后重启。 使用:打开软件,编辑器类型中出现“ComfyUI Node”,点击进入 ComfyUI 界面,先点击上方的“新建”按钮,然后展开右侧的 N 面板可以看到无限圣杯的界面。
2024-09-10
国内较好用可以替代Midjourney或Stable Diffusion的图像生成工具有哪些
以下是国内一些较好用可以替代 Midjourney 或 Stable Diffusion 的图像生成工具: 1. 吐司:https://tusiart.com/images/635511733697550450?post_id=635512498197535244&source_id=nzywoVHilkK7o_cqaH31xAh 2. 哩布:https://www.liblib.ai/ 此外,还有一些常见的图像生成工具: 1. DALLE:来自 OpenAI,已纳入 Bing(您必须使用创意模式)和 Bing 图像创建器。 2. Adobe Firefly:内置在各种 Adobe 产品中,但在质量方面落后于 DALLE 和 Midjourney。不过 Adobe 宣布它只使用有权使用的图像。
2024-09-10
stable diffusion模型训练怎么样提升效果
以下是一些提升 Stable Diffusion 模型训练效果的方法: 1. 理解核心原理: 与 GAN 等生成式模型相比,SD 模型学习拟合训练集分布,训练过程更稳定且泛化性能更强,这归功于其核心的前向扩散过程和反向扩散过程。 前向扩散过程是对图像持续添加高斯噪声直至变成随机噪声矩阵,反向扩散过程则是去噪声直至生成图像。 2. 掌握训练全过程: 训练具体过程是对每个加噪和去噪过程进行计算,从而优化 SD 模型参数。包括从训练集中选取加噪过的图片和噪声强度输入到 UNet 中,让其预测噪声,计算预测噪声与真实噪声的误差,最后通过反向传播更新 UNet 的参数。 完成 UNet 的训练后,可对噪声图片进行去噪,逐步重建出有效图像的 Latent Feature。 3. 利用语义信息控制图片生成: SD 模型生成图片时输入的 prompt,其语义信息通过注意力机制影响图片生成。在训练中,每个训练样本对应标签通过 CLIP Text Encoder 输出 Text Embeddings,并以 Cross Attention 的形式与 UNet 结构耦合,使图片信息与文字信息融合训练。 4. 微调训练参数: train_text_encoder:设置是否在训练时对 Text Encoder 进行微调。 lr_scheduler:设置学习率调度策略,如 linear、cosine 等。 lr_warmup_steps:在启动学习率调度策略前,先固定学习率训练的步数。 debug_dataset:训练时对数据进行 debug 处理,防止破损数据中断训练进程。 in_json:读取数据集 json 文件,其中包含数据名称、标签、分桶等信息。 train_data_dir:读取本地数据集存放路径。 dataset_repeats:整个数据集重复训练的次数,可根据数据量级进行设置。 shuffle_caption:设置为 true 时,对训练标签进行打乱,能一定程度提高模型的泛化性。
2024-09-04
4060和4060TI哪个更适合SD
在 Stable Diffusion(SD)的应用中,30 系列显卡中 3060ti 12GB 显卡、3090 和 3090ti 比较适合生成图片,其他显存不够的显卡意义不大。2080ti 22GB 魔改版本显卡比较考验运气,建议求稳定。SD 的图像生成主要依赖显卡,只要显存足够,其他配置不太差就行。之前有文章分析,i9 和 i5 的 CPU 对于生成速度影响在 10%以下。能上 4090 建议上 4090,哪怕是万丽版本也好过高配 4080。在实际测试中,使用 4080ti 笔记本,12G 显存,不同模型和设置的出图时间有所不同。例如使用 diffusers 的 2.5Gfull 模型绘制 10241024 尺寸的图片,一张图花了 2 分 57 秒;使用 320Mb 的 small 模型,用时 34 秒。对于 4060 和 4060TI 哪个更适合 SD,上述内容未给出直接对比,但综合来看,显存大小和性能表现是关键因素,您可以参考以上信息进行判断。
2024-08-13