Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你有内置sd吗

Answer

Stable Diffusion(SD)相关知识如下:

  • SD 内置了 LyCORIS,使用 LoRA 模型较多,其与 LyCORIS 相比可调节范围更大。LoRA 和 LyCORIS 的后缀均为.safetensors,体积较主模型小,一般在 4M - 300M 之间。管理模型时可进入 WebUl 目录下的 models/LoRA 目录,在 WebUl 中使用时,可在 LoRA 菜单中点击使用,也可直接使用 Prompt 调用。
  • SD 的安装:系统需为 Win10 或 Win11。Win 系统查看配置,包括查看电脑系统(在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格)和查看电脑配置(需要满足电脑运行内存 8GB 以上、是英伟达(NVIDA)的显卡、显卡内存 4GB 以上。打开任务管理器:同时按下 ctrl + shift + esc,查看电脑运行内存和显卡内存)。配置达标可跳转至对应安装教程页,如1.Win 系统 SD 安装。配置不够可选择云端部署(Mac 也推荐云端部署),如3.SD 云端部署。备选:SD 好难,先试试简单的无界 AI:图像类 - 无界 AI 使用教程
  • 【SD】无需 Lora,一键换脸插件 Roop:勾选相关项目,确保包含 Python 和 C++包。更改安装位置,点击右下角安装。安装时间长需耐心等待。安装好后,打开 SD 文件目录下的相关文件夹,在地址栏输入“cmd”回车,在打开的 dos 界面粘贴“python -m pip install insightface==0.7.3 --user”安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),后台回复【SD】下载。安装完成后,重新打开启动器,后台会继续下载模型,需全程科学上网。Roop 插件主要适用于真实人脸替换,对二次元人物作用不大。选用真实系模型,设置相关参数后生成,若人脸像素偏低模糊,可发送到“图生图”进行重绘。
Content generated by AI large model, please carefully verify (powered by aily)

References

guahunyo:SD入门讲解PPT.pptx

y shdow.a realteelcateys.DeOldifyImage Browse!LoRA和LyCORIS的后缀均为.safetensors,体积较主模型要小得多,一般在4M-300M之间。一般使用LoRA模型较多,而LyCORIS与LoRA相比可调节范围更大,以前需要额外的扩展才可使用,现在sd已经内置了。需要管理模型时我们可以进入WebUl目录下的models/LoRA目录下。群友二次元古风Chekpoint各种调节场景妖尾姿势建筑Default Sort服装未分类Refresh机甲海贼火影王者荣耀在WebUl中使用时,可在LoRA菜单中点击使用。也可以直接使用Prompt调用。海贼王-多弗朗明哥海贼王-大和海贼王-女帝海贼王-娜美海贼王-布鲁克01Textual InversionYOUR LOGOTextual Inversion是文本编码器模型,用于改变文字向量。可以将其理解为一组Prompt。Textual Inversion后缀为.pt或者.safetensors,体积非常小,一般只有几kb。模型所在的目录不在models下,而是在WebUl中的embeddings目录下。

0. SD的安装

①系统需为Win10、Win11②Win系统查看配置③配置达标跳转至对应安装教程页[1.Win系统SD安装](https://qa3dhma45mc.feishu.cn/wiki/D5nawAs1fivF4ykx88ucRIYwn1d)④配置不够可选择云端部署(Mac也推荐云端部署)[3.SD云端部署](https://qa3dhma45mc.feishu.cn/wiki/A6WYw1Nm0ikGplkuO9Ecwomqnnd)⑤备选:SD好难,先试试简单的无界AI:[图像类-无界AI使用教程](https://qa3dhma45mc.feishu.cn/wiki/LRdOw75tQiN3wAkU43ucwb5Ondd)[heading2]Win系统查看配置[content]Win10和Win11一样没区别[heading3]查看电脑系统:[content]在桌面上找到“我的电脑”一鼠标右键点击一一点击"属性”一一查看Windows规格[heading3]查看电脑配置:[content]这里是检查自己的电脑配置能不能带动SD(Stable Diffusion)需要满足3个要求(推荐):电脑运行内存8GB以上是英伟达(NVIDA)的显卡显卡内存4GB以上①打开任务管理器:同时按下ctrl+shift+esc②查看电脑运行内存8GB运行内存可以勉强运行SD推荐16GB以上运行内存③查看电脑显卡内存(显存)4GB显存可运行SD,推荐8GB以上显存

【SD】无需Lora,一键换脸插件Roop

勾选如下项目,要确保包含Python和C++包。更改到你想要安装的位置,然后点击右下角的安装就行。安装时间比较长,要耐心等待。安装好之后,打开SD文件目录下的这个文件夹。在地址栏输入“cmd”,然后回车。在打开的dos界面里面,将这行代码“python-m pip install insightface==0.7.3--user”粘贴进来,就会自动开始安装insightface。如果这个阶段出现错误,建议去下载使用最新的秋叶4.2整合包(6月23号更新),下载包我已经更新到了云盘里,后台回复【SD】就可以下载。安装完成后,重新打开我们的启动器,后台会继续下载一些模型,此时一定要保证全程科学上网。完成这些后,我们的Roop插件就可以正常使用了。这个插件主要适用于真实的人脸替换,所以对二次元之类的人物作用不大。我们选用一个真实系模型“realisticVisionV20”,关键词描述的是一个老人举着气球。得到了一张如下的照片。接下来启用ROOP插件,选择你想要替换的人物照片,面部修复选择“GFPGAN”。右边的参数数值越低,人物会越像,但是图像会很模糊;数值越高人物越不像,但是图像会很清晰。这个就取决于你的需求了,我使用0.5测试一下。最下面还有一个放大算法,可以使用一个模型放大你的图像,基本就相当于高清修复。设置好后,点击生成。可以看到,人脸部分的像素是偏低的,有点模糊。但是没有关系,我们可以将这张图发送到“图生图”,开一个比较小的重绘幅度。

Others are asking
sd的关键词可以用中文吗
在 Stable Diffusion 中,通常只能识别英语关键词。但不用担心,您可以直接使用翻译工具将中文关键词翻译成英语后输入。比如,若您想生成一个漂亮的小姐姐站在大街上,可以写成“1 girl, beautiful, standing, street”这样的形式。输入关键词时,常用一个个单词并用英文状态下的逗号隔开。不过,对于中文字体的处理,也有一些方法,如将中文字做成白底黑字存成图片样式,再使用文生图的方式等。在输入关键词时,还可以先写一些提升照片质量的词语,使生成的照片更加精致。
2025-03-06
中文可以用sd吗
中文可以使用 Stable Diffusion(SD)。以下是使用 SD 制作中文文字的一些方法和步骤: 1. 将中文字做成白底黑字,存成图片样式。 2. 使用文生图的方式,使用大模型真实系,作者用的 realisticVisionV20_v20.safetensorsControlNet 预设置。 3. 输入关键词,如奶油的英文单词“Cream+Cake”(加强质感),反关键词:“Easynegative”(负能量),反复刷机,得到满意的效果即可。 4. 同理可输出 C4D 模型,可自由贴图材质效果,如“3d,blender,oc rendering”。 5. 如果希望有景深效果,也可以打开“depth”(增加阴影和质感)。 6. 打开高清修复,分辨率联系 1024 以上,步数:29 60。 SD 是 Stable Diffusion 的简称,是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7),源代码库:github.com/StabilityAI/stablediffusion 。
2025-03-06
b站的秋葉aaaki大佬对sd做过什么
B 站的秋葉 aaaki 大佬在 SD 方面的相关贡献包括: 1. 提供了 SD 的开源整合包和 LoRA 模型训练一键包。最新一次更新整合包版本为 v4.5,于 11 月更新。此整合包支持 SDXL,预装多种必须模型,无需安装 python、cuda、git,解压即用。获取方式为一键三连+关注私信发送“整合包”。 2. 其相关内容有助于用户了解 SD 的工作原理和基本功能,对于还未接触过 AI 绘画的朋友有启蒙作用。很多人在安装 SD 软件时会参考他的视频。 您可以通过以下链接获取更多相关资源: 整合包百度盘:https://pan.baidu.com/s/1MjO3CpsIvTQIDXplhE0OA?pwd=aaki LoRA 模型训练一键包百度盘:https://pan.baidu.com/s/1TBaoLkdJVjk_gPpqbUzZFw ,提取码:p8uy
2025-03-06
sd是哪位大佬做的
SD 是 Stable Diffusion 的简称。它是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,于 2022 年发布的深度学习文本到图像生成模型,主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行,当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。我们可以通过一系列的工具搭建准备,使用 SD 进行想要的图片 AIGC 。 此外,还有与 SD 相关的 Fooocus,它使用的是最新推出的 SDXL 1.0 模型,对 stable diffusion 和 Midjourney 做了结合升级。保留了 SD 的开源属性,可以部署到本地免费使用,在操作界面吸取了 Midjourney 简洁的特点,省去了 WebUI 中复杂的参数调节,让用户可以专注于提示和图像。配置要求为本地部署,需要不低于 8GB 的内存和 4GB 的英伟达显卡。Fooocus 介绍/安装包下载:https://github.com/lllyasviel/Fooocus 。 另外,在 Video Battle 视频挑战中,有一种方法是使用 SD 的分支版本 CONTROLNET 大佬开发的 Forge,特点是支持图生视频、图生 SD,而且对低端显卡支持良好。下载链接为:https://github.com/lllyasviel/stablediffusionwebuiforge/releases/download/latest/webui_forge_cu121_torch21.7z ,解压后,优先运行 update.bat 进行升级,然后再运行 run.bat ,接着就打开了和 SD 基本一模一样的界面。核心区别在于 FORGE 增加了 2 个王炸功能,SVD【图生视频】和 Z123【图生 3D】。
2025-03-06
sd可以用中文输入吗
SD3stable diffusion3 已开源,艺术实现更自由。Qwen2 接上 SD3 Medium 支持中文输入,会自动优化并输出英文提示词。相关资源如下: 下载地址(huggingface 比较慢,多放几个百度云盘): 工作流:https://github.com/ZHOZHOZHO/ComfyUIWorkflowsZHO Qwen2 插件:https://github.com/ZHOZHOZHO/ComfyUIQwen2 SD3 dreambooth 脚本:https://github.com/huggingface/diffusers/blob/sd3/examples/dreambooth/README_sd3.md 、https://github.com/bghira/SimpleTuner/tree/feature/sd3 另外,关于 SD 做中文文字有持续更新的教程: 制作思路可参考 Nenly 同学的视频教程:【“牛逼”的教程来了!一次学会 AI 二维码+艺术字+光影光效+创意 Logo 生成,绝对是 B 站最详细的 Stable Diffusion 特效设计流程教学!AI 绘画进阶应用哔哩哔哩】https://b23.tv/c33gTIQ 群友自制的详细视频教程步骤: 1. 将中文字做成白底黑字,存成图片样式。 2. 使用文生图的方式,使用大模型真实系,作者用的 realisticVisionV20_v20.safetensorsControlNet 预设置。 3. 输入关键词,如奶油的英文单词,Cream+Cake(加强质感),反关键词:Easynegative(负能量),反复刷机,得到满意的效果即可。 4. 同理可输出 C4D 模型,可自由贴图材质效果,3d,blender,oc rendering。 5. 如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 6. 打开高清修复,分辨率联系 1024 以上,步数:2960。 当然 https://firefly.adobe.com/也可以,但 SD 感觉可操控性更强,尤其是中文字体。
2025-03-06
sd
SD 是 Stable Diffusion 的简称。它是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,于 2022 年发布的深度学习文本到图像生成模型,主要用于根据文本描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。 SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。 我们可以通过一系列的工具搭建准备,使用 SD 进行想要的图片 AIGC 。例如,在二维码制作中,进入 SD 版块需要下载两个 SD 的 ControlNET 模型和一个预处理器,在特定路径下放置相应文件,并设置相关参数,如选择模型、填入关键词、设置迭代步数、采样方式和图像大小等。 此外,还有 SD 绘画学社,在这里可以携手探索 SD AI 绘画的无限可能,不熟悉 SD 的小伙伴可以查看入门教程: 。
2025-03-05
请罗列一些内置大模型的手机产品
以下是一些内置大模型的手机产品: 华为、荣耀、小米、OPPO、VIVO、三星等品牌都已宣布会在手机端侧搭载大模型。 三星 S24 搭载了 Google Gemini Nano。 Vivo 推出了五个大型自研模型,宣称在中文能力方面达到行业第一。 目前这些手机搭载大模型还存在一些问题,如只能用最新的骁龙 8Gen3 旗舰处理器,且耗能散热都是问题。短期内的端上智能仍有诸多限制。
2024-11-29
我想知道大模型厂商内置的提示词一般都有多少个字比较合理?并给出数据来源
大模型厂商内置的提示词字数并没有一个固定的标准,其合理性取决于多种因素。 一般来说,提示词的字数可能寥寥无几,但更多时候需要提供详尽的上下文和相关细节。例如,在要求 GPT 删除个人信息的官方示例中,提示词包括背景、定义术语、给出模型应如何完成任务的具体细节等多个方面。 在一些经验分享中提到,提示词中的示例 5 6 个效果最佳。同时,提示词的整体结构需要调整和优化,除了技能外还应有完整的工作流程设定,角色信息中的人设应特点鲜明,避免同质化。还需注意避免矛盾和重复的提示词内容,可通过调整提示词顺序的方法提高重要指令的权重。 数据来源包括胡凯翔基于阅读 Claude Cookbook 的思考和测试、Agent 共学“谁是人类”活动参赛心得分享等。
2024-08-20