Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Sd文生图的专业术语有哪些

Answer

以下是一些关于 SD 文生图的专业术语:

  1. 内容型提示词:主要用于描述想要的画面,如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”。
  2. 标准化提示词:例如“(masterpiece:1.2),best quality,masterpiece,highres,original,extremelydetailed wallpaper,perfect,lighting,(extremely detailed CG:1.2),drawing,paintbrush”。
  3. 权重:通过括号和特定数值来增加提示词的权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。
  4. 反向提示词:告诉 AI 不要的内容,如“NSFw,(最差质量:2),(低质量:2),(正常质量:2),(低质量:2),((单色)),((灰度)),皮肤斑点,痤疮,皮肤瑕疵,老年斑,(丑陋:1.331),(重复:1.331),(病态:1.21),(残缺:1.21),(变形:1.331),变异的手,(画得不好的手:1.5),模糊,(解剖不良:1.21),(比例不良:1.331),多余的四肢,(毁容:1.331),(缺胳膊:1.331),(多余的腿:1.331),(融合的手指:1.61051),(过多的手指:1.61051),(不清晰的眼睛:1.331),低质量,坏的手,缺手指,多余的手指,受伤的手,缺失的手指,(((多余的胳膊和腿))”。
  5. 采样迭代步数:指 AI 绘画去噪的次数,步数越高绘画越清晰,但绘画速度越慢,通常数值控制在 20 - 40 之间较好。
  6. 采样方法:AI 生成图像时的特定算法,常用的有“Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM”。
  7. 比例:尺寸并非越大越好,模型练图通常按 512x512 的框架绘制,高宽比尽量在这个数值附近。高清修复可放大图像倍率,高宽比主要控制画面比例。
Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】文生图怎么写提示词

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-01 20:00原文网址:https://mp.weixin.qq.com/s/kwNfc9NCaKJRy30wHI95UgStable Diffusion的生成方式主要分为文生图和图生图两种:文生图是仅通过正反向词汇描述来发送指令;图生图除了可以添加文字以外,还可以给AI参考图进行模仿,也就是我们常说的“垫图”。接下去就是对你想要的图形进行文本描述,文本描述上又分为两类:内容型提示词和标准化提示词。内容型提示词主要用于描述你想要的画面,我们选择anythingV5这个专门用于二次元绘画的大模型,然后输入以下提示词:1个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面。(使用翻译软件翻译成英文)采样迭代步数是指AI绘画去噪的次数,步数越高绘画越清晰,但是绘画速度也会越慢,通常数值控制在20-40之间最好。采样方法是指AI生成图像时候的某种特定算法,我们不用全部了解,一般常用的为:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。有的模型会有指定的算法,搭配起来更好用。将比例设置为800:400,注意这里的尺寸并不是越大越好,因为模型的练图基本上都是按照512x512的框架去画,所以我们的高宽比尽量都在这个数值附近。太大的数值比如1920x1080,会使AI做出很奇怪的构图。那你就会说,我就想要很高清的图怎么办,其实Stable Diffusion也提供了图片放大的功能,我们可以同时点选这个高清修复来放大图像倍率,而高宽比我们只要记住这里主要是控制一个画面比例就可以了。

【SD】文生图怎么写提示词

英文为:(masterpiece:1.2),best quality,masterpiece,highres,original,extremelydetailed wallpaper,perfect,lighting,(extremely detailed CG:1.2),drawing,paintbrush在这组提示词中,括号和:1.2,都是用来增加权重的,权重越高在画面中体现越充分,同样提示词的先后顺序也会影响权重。接下来我们再增加一组反向提示词,可以告诉AI我们不要什么,在这里也是一组标准化提示词:NSFw,(最差质量:2),(低质量:2),(正常质量:2),(低质量:2),((单色)),((灰度)),皮肤斑点,痤疮,皮肤瑕疵,老年斑,(丑陋:1.331),(重复:1.331),(病态:1.21),(残缺:1.21),(变形:1.331),变异的手,(画得不好的手:1.5),模糊,(解剖不良:1.21),(比例不良:1.331),多余的四肢,(毁容:1.331),(缺胳膊:1.331),(多余的腿:1.331),(融合的手指:1.61051),(过多的手指:1.61051),(不清晰的眼睛:1.331),低质量,坏的手,缺手指,多余的手指,受伤的手,缺失的手指,(((多余的胳膊和腿))英文为:NSFw,(worst quality:2),(low quality:2),(normal quality:2),lowres,normal quality,((monochrome)),((grayscale)),skin spots,acnes,skin blemishes,age spot,(ugly:1.331),(duplicate:1.331),(morbid:1.21),(mutilated:1.21),(tranny:1.331),mutated hands,(poorly drawn hands:1.5),blurry,(bad anatomy:1.21),(badproportions:1.331),extra limbs,(disfigured:1.331),(missingarms:1.331),(extra legs:1.331),(fused fingers:1.61051),(toomany finger

【SD】角色设计的福音!绘制一致性多角度头像

设置文生图提示词:大模型:majicmixRealistic_v6.safetensors正向提示词:(a character sheet of a woman from different angles with a grey background:1.4),auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography,负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,(easynegative),((((ugly)))),(((duplicate))),((morbid)),((mutilated)),out of frame,extra fingers,mutated hands,((poorly drawn hands)),((poorly drawn face)),((bad art)),blurry,(((mutation))),(((deformed))),blurry,((bad anatomy)),(((bad proportions))),((extra limbs)),cloned face,(((disfigured))),gross proportions,(malformed limbs),((missing arms)),((missing legs)),((floating limbs)),((disconnected limbs)),((malformed hands)),((missing fingers)),worst quality,((disappearing arms)),((disappearing legs)),(((extra arms))),(((extra legs))),(fused fingers),(too many fingers),(((long neck))),canvas frame,((worst quality)),((low quality)),lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w,设置一下参数:迭代步数:50采样方法:DPM++2M Karras尺寸:1328×800px出图!15个不同角度的人物图片,大概看下来基本就是同一个人,没毛病。

Others are asking
文生图
以下是关于文生图的详细教程: 定主题:明确您需要生成的图片的主题、风格以及要表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看的帖子中使用的 lora。 ControlNet:可控制图片中特定的图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 设置 VAE:通常选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需考虑语法,单词、短语间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选择 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选择 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图工具: 腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-03-11
文生图提示词怎么完善
完善文生图提示词可以从以下几个方面入手: 1. 明确具体的描述:使用更具体、细节的词语和短语来表达需求,避免过于笼统。 2. 添加视觉参考:在提示词中插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整整体语气和情感色彩,以生成期望的语境和情绪。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最准确表达需求的描述方式。 5. 增加约束条件:添加限制性条件,如分辨率、比例等,避免 AI 产生意外输出。 6. 分步骤构建提示词:将复杂需求拆解为逐步的子提示词,引导 AI 先生成基本结构,再逐步添加细节和完善。 7. 参考优秀案例:研究 AI 社区流行且有效的提示词范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同写法,并根据输出效果反馈持续优化完善,直至达到理想结果。 在具体的文生图提示词编写中,例如在 SD 中,括号和“:1.2”等用于增加权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时,还可以增加反向提示词,告诉 AI 不要生成的内容。 在使用 Tusiart 进行文生图时: 先确定主题,明确要生成的图的主题、风格和表达的信息。 选择基础模型 Checkpoint,找内容贴近的模型。 选择 lora,寻找内容重叠的 lora 控制图片效果及质量。 对于 ControlNet,可控制图片中特定图像,如人物姿态等。 设置 VAE,可无脑选择 840000。 编写 Prompt 提示词,用英文写需求,使用单词和短语组合,用英文半角逗号隔开。 编写负向提示词 Negative Prompt,同样用英文单词和短语组合,用英文半角逗号隔开。 选择采样算法,如 DPM++2M Karras,也可参考模型作者推荐的采样器。 确定采样次数,根据采样器特征,一般在 30 40 之间。 选择合适的尺寸,根据个人喜好和需求决定。
2025-03-11
文生图
以下是关于文生图的详细教程: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看的帖子中使用的 lora。 ControlNet:用于控制图片中的特定图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 设置 VAE:通常选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,不用管语法,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选择 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选择 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图工具和模型: 腾讯混元 luma Recraft 文生图大模型 V2.1L(美感版) 美图奇想 5.0 midjourney 快手可图 Flux.1.1 Stable Diffusion 3.5 Large Imagen 3 网页版
2025-03-11
文生图
以下是关于文生图的详细教程: 定主题:确定您想要生成的图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看的帖子中使用的 lora。 ControlNet:可控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语组合,不用管语法,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,单词和短语组合,中间用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras 较多,也可留意 checkpoint 详情页上模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数一般在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图模型:腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-03-10
论文生成
以下是关于论文生成的相关信息: ChatGPT 是以“词”为单位进行文本生成的,具有随机性。有一个特定的“温度”参数控制较低排名单词的使用频率,对于文章生成,“温度”为 0.8 效果较好。为方便演示,通常使用较小的 GPT2 系统,后续会深入研究其神经网络的工作原理。 在论文写作领域,AI 技术应用广泛,提供多方面辅助。常用的 AI 工具和平台包括: 文献管理和搜索:Zotero 可自动提取文献信息,Semantic Scholar 是 AI 驱动的学术搜索引擎。 内容生成和辅助写作:Grammarly 提供文本校对等,Quillbot 可重写和摘要。 研究和数据分析:Google Colab 支持 AI 和机器学习研究,Knitro 用于数学建模和优化。 论文结构和格式:LaTeX 结合自动化和模板处理格式,Overleaf 是在线 LaTeX 编辑器。 研究伦理和抄袭检测:Turnitin 和 Crossref Similarity Check 检测抄袭。使用时要结合自身需求选择合适工具。 增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成,包括图片、PPT、PDF 等。例如,输入诉求可生成相应图片、PPT 和 PDF 文件,还能一键创作系统架构论文。
2025-03-10
文生图
以下是关于文生图的详细教程: 定主题:确定您想要生成的图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型(麦橘写实、麦橘男团、墨幽人造人等)。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看帖子中使用的 lora。 ControlNet:可控制图片中特定图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 采样算法:一般选 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图模型: 腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-03-10
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF,0编程基础应该怎么做呢
对于您这种没有编程基础但想要制作针对电子元器件行业的 AI 工具来实现中文 PDF 上传并下载翻译好的 PDF 的需求,以下是一些建议: 首先,您需要学习一些基本的 AI 概念和技术知识,了解自然语言处理(NLP)的基本原理。 其次,可以考虑使用现有的无代码或低代码 AI 开发平台。这些平台通常具有可视化的界面和易于操作的工具,能够帮助您在不编写代码的情况下构建简单的 AI 应用。 然后,针对您的专业术语翻译需求,需要对电子元器件行业的术语进行系统整理和分类,建立一个清晰的术语库。 同时,确定固定描述语句的翻译规则和方法,并将其转化为可在 AI 工具中应用的逻辑。 在实施过程中,要不断测试和优化您的工具,以确保翻译的准确性和质量。 总之,虽然没有编程基础会增加一定的难度,但通过合理利用现有资源和持续学习,您是有可能实现这个目标的。
2025-01-04
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF
目前针对您想要针对电子元器件行业制作一个能上传中文 PDF 并下载翻译好的 PDF 的 AI 工具的需求,暂时没有相关的现成内容和方法。但您可以考虑以下步骤来实现这一目标: 1. 数据准备:收集和整理电子元器件行业的专业术语、固定描述语句以及对应的翻译,构建一个丰富准确的知识库。 2. 选择合适的技术:例如自然语言处理技术和机器翻译算法,以实现对中文 PDF 的翻译。 3. 开发工具界面:设计一个用户友好的界面,方便用户上传中文 PDF 和下载翻译后的 PDF。 4. 测试和优化:对工具进行充分的测试,根据测试结果不断优化翻译的准确性和工具的性能。 这是一个较为复杂的项目,需要一定的技术和资源投入,但如果成功实现,将为电子元器件行业带来很大的便利。
2025-01-04
请你用简单易懂的语言告诉我comfyui和SD的区别
ComfyUI 和 SD(Stable Diffusion)主要有以下区别: 1. UI 界面:SD WebUI 的 UI 更接近传统产品,有很多输入框和按钮;ComfyUI 的 UI 界面复杂,除输入框外,还有很多块状元素和复杂的连线。 2. 学习成本:ComfyUI 的学习成本比 SD WebUI 高。 3. 工作流方式:ComfyUI 主要通过连线搭建自动化工作流,从左到右依次运行;SD WebUI 则通过输入框和按钮配置参数。 4. 灵活性和拓展性:ComfyUI 具有更高的自由和拓展性,可以根据自身需求搭建、调整甚至改造工作流,无需依赖开发者,还能开发并改造节点;SD WebUI 在这方面相对较弱。 5. 功能实现:从功能角度看,两者提供的功能本质相同,但 ComfyUI 通过改变节点方式能实现不同功能,如一个节点是直接加载图片,另一个是通过画板绘制图片,从而实现导入图片生图和绘图生图等不同功能。
2025-03-08
你有内置sd吗
Stable Diffusion(SD)相关知识如下: SD 内置了 LyCORIS,使用 LoRA 模型较多,其与 LyCORIS 相比可调节范围更大。LoRA 和 LyCORIS 的后缀均为.safetensors,体积较主模型小,一般在 4M 300M 之间。管理模型时可进入 WebUl 目录下的 models/LoRA 目录,在 WebUl 中使用时,可在 LoRA 菜单中点击使用,也可直接使用 Prompt 调用。 SD 的安装:系统需为 Win10 或 Win11。Win 系统查看配置,包括查看电脑系统(在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格)和查看电脑配置(需要满足电脑运行内存 8GB 以上、是英伟达(NVIDA)的显卡、显卡内存 4GB 以上。打开任务管理器:同时按下 ctrl + shift + esc,查看电脑运行内存和显卡内存)。配置达标可跳转至对应安装教程页,如 【SD】无需 Lora,一键换脸插件 Roop:勾选相关项目,确保包含 Python 和 C++包。更改安装位置,点击右下角安装。安装时间长需耐心等待。安装好后,打开 SD 文件目录下的相关文件夹,在地址栏输入“cmd”回车,在打开的 dos 界面粘贴“python m pip install insightface==0.7.3 user”安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),后台回复【SD】下载。安装完成后,重新打开启动器,后台会继续下载模型,需全程科学上网。Roop 插件主要适用于真实人脸替换,对二次元人物作用不大。选用真实系模型,设置相关参数后生成,若人脸像素偏低模糊,可发送到“图生图”进行重绘。
2025-03-06
sd的关键词可以用中文吗
在 Stable Diffusion 中,通常只能识别英语关键词。但不用担心,您可以直接使用翻译工具将中文关键词翻译成英语后输入。比如,若您想生成一个漂亮的小姐姐站在大街上,可以写成“1 girl, beautiful, standing, street”这样的形式。输入关键词时,常用一个个单词并用英文状态下的逗号隔开。不过,对于中文字体的处理,也有一些方法,如将中文字做成白底黑字存成图片样式,再使用文生图的方式等。在输入关键词时,还可以先写一些提升照片质量的词语,使生成的照片更加精致。
2025-03-06
中文可以用sd吗
中文可以使用 Stable Diffusion(SD)。以下是使用 SD 制作中文文字的一些方法和步骤: 1. 将中文字做成白底黑字,存成图片样式。 2. 使用文生图的方式,使用大模型真实系,作者用的 realisticVisionV20_v20.safetensorsControlNet 预设置。 3. 输入关键词,如奶油的英文单词“Cream+Cake”(加强质感),反关键词:“Easynegative”(负能量),反复刷机,得到满意的效果即可。 4. 同理可输出 C4D 模型,可自由贴图材质效果,如“3d,blender,oc rendering”。 5. 如果希望有景深效果,也可以打开“depth”(增加阴影和质感)。 6. 打开高清修复,分辨率联系 1024 以上,步数:29 60。 SD 是 Stable Diffusion 的简称,是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7),源代码库:github.com/StabilityAI/stablediffusion 。
2025-03-06
b站的秋葉aaaki大佬对sd做过什么
B 站的秋葉 aaaki 大佬在 SD 方面的相关贡献包括: 1. 提供了 SD 的开源整合包和 LoRA 模型训练一键包。最新一次更新整合包版本为 v4.5,于 11 月更新。此整合包支持 SDXL,预装多种必须模型,无需安装 python、cuda、git,解压即用。获取方式为一键三连+关注私信发送“整合包”。 2. 其相关内容有助于用户了解 SD 的工作原理和基本功能,对于还未接触过 AI 绘画的朋友有启蒙作用。很多人在安装 SD 软件时会参考他的视频。 您可以通过以下链接获取更多相关资源: 整合包百度盘:https://pan.baidu.com/s/1MjO3CpsIvTQIDXplhE0OA?pwd=aaki LoRA 模型训练一键包百度盘:https://pan.baidu.com/s/1TBaoLkdJVjk_gPpqbUzZFw ,提取码:p8uy
2025-03-06
sd是哪位大佬做的
SD 是 Stable Diffusion 的简称。它是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,于 2022 年发布的深度学习文本到图像生成模型,主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行,当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。我们可以通过一系列的工具搭建准备,使用 SD 进行想要的图片 AIGC 。 此外,还有与 SD 相关的 Fooocus,它使用的是最新推出的 SDXL 1.0 模型,对 stable diffusion 和 Midjourney 做了结合升级。保留了 SD 的开源属性,可以部署到本地免费使用,在操作界面吸取了 Midjourney 简洁的特点,省去了 WebUI 中复杂的参数调节,让用户可以专注于提示和图像。配置要求为本地部署,需要不低于 8GB 的内存和 4GB 的英伟达显卡。Fooocus 介绍/安装包下载:https://github.com/lllyasviel/Fooocus 。 另外,在 Video Battle 视频挑战中,有一种方法是使用 SD 的分支版本 CONTROLNET 大佬开发的 Forge,特点是支持图生视频、图生 SD,而且对低端显卡支持良好。下载链接为:https://github.com/lllyasviel/stablediffusionwebuiforge/releases/download/latest/webui_forge_cu121_torch21.7z ,解压后,优先运行 update.bat 进行升级,然后再运行 run.bat ,接着就打开了和 SD 基本一模一样的界面。核心区别在于 FORGE 增加了 2 个王炸功能,SVD【图生视频】和 Z123【图生 3D】。
2025-03-06