Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

flux模型风格提示词

Answer

以下是关于 Flux 模型风格提示词的相关信息:

ComfyUI Flux redux

  • Redux 模型是轻量级的,可与 Flux.1[Dev]和 Flux.1[Schnell]配合使用,基于 1 个输入图像生成图像变体,无需提示,适合快速生成特定样式图像。
  • 往一张图上融合时,提示词最好描述图片背景颜色。
  • 将 Redux 模型下载到 comfyui/models/style_models,下载 sigclip_patch14-384.safetensors 到 ComfyUI/models/clip_vision。
  • 重绘节点为 ComfyUI-InpaintEasy,相关链接:https://github.com/CY-CHENYUE/ComfyUI-InpaintEasy。

ComfyUI FLUX 模型的安装部署

  • 模型 FLUX.1[dev]、FLUX.1[dev fp8]、FLUX.1[schnell]中,建议选择 dev 版本,显卡可以的用 fp16,显卡不够用的选 fp8。模型下载后放入 ComfyUI/models/unet/文件夹中。若爆显存,“UNET 加载器”节点中的 weight_dtype 可设置为 fp8 降低显存使用量,但可能稍降质量,默认的 weight_type 显存使用较大。
  • clip 方面,t5xxl_fp16.safetensors 和 clip_l.safetensors 放在 ComfyUI/models/clip/文件夹里,相关链接:https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main。可用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率,有超过 32GB 内存建议用 fp16。
  • Vae 下载后放入 ComfyUI/models/vae 文件夹,相关链接:https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main。
  • T5(/t5xxl_fp16.safetensors)的 clip 原本有输入输出,可能会导致提示词被吞,短提示效果差,训练 flux 或 sd3 时应尽量用长提示词或自然语言。

STYLE PROMPTS 风格

  • Stratospheric:关联流派为 Soundtrack、Classical、Orchestral。指高空和极高的音乐风格,具有高亢壮丽特质,典型用于表现高空和极高情感的音乐作品,示例为 Queen 的《Bohemian Rhapsody》。
  • Streetwise:关联流派为 Hip-Hop、Rap、R&B。指街头和世故的音乐风格,具有现实机智特质,典型用于表现街头和世故情感的音乐作品,示例为 Jay-Z 的《Empire State of Mind》。
  • Strength:关联流派为 Rock、Hard Rock、Arena Rock。指力量和坚强的音乐风格,具有强大坚定特质,典型用于表现力量和坚强情感的音乐作品,示例为 Survivor 的《Eye of the Tiger》。
  • Stressful:关联流派为 Progressive Rock、Psychedelic Rock、Classic Rock。指紧张和压力的音乐风格,具有紧张焦虑特质,典型用于表现紧张和压力情感的音乐作品,示例为 Pink Floyd 的《Time》。
  • Stretching:指延伸和扩展的音乐风格,具有延展渐进特质,典型用于表现延伸和扩展情感的音乐作品。
Content generated by AI large model, please carefully verify (powered by aily)

References

ComfyUI Flux redux

Redux模型是一个轻量级模型,可与Flux.1[Dev]和Flux.1[Schnell]配合使用,以基于1个输入图像生成图像变体,无需提示。它非常适合快速生成特定样式的图像。[heading3]移除背景[heading3]关于提示词[content]这里需要注意的是,如果要往一张图上融合,提示词最好描述下图片的背景颜色。[heading3]Redux模型位置[content]将Redux模型下载到comfyui/models/style_models下载sigclip_patch14-384.safetensors到ComfyUI/models/clip_vision[heading3]重绘节点[content]ComfyUI-InpaintEasyhttps://github.com/CY-CHENYUE/ComfyUI-InpaintEasy[heading3]工作流

ComfyUI FLUX

FLUX.1[dev]FLUX.1[dev fp8]FLUX.1[schnell],选一个.建议选择dev版本的,显卡可以的用fp16,显卡不够用的选fp8.模型下载后,放入,这个文件应该放在你的:ComfyUI/models/unet/文件夹中。如果爆显存了,“UNET加载器”节点中的weight_dtype可以控制模型中权重使用的数据类型,设置为fp8,这将使显存使用量降低一半,但可能会稍微降低质量.默认下的weight_type,显存使用比较大.[heading4]clip[content]t5xxl_fp16.safetensors和clip_l.safetensors,放在ComfyUI/models/clip/文件夹里面.https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main可以使用t5xxl_fp8_e4m3fn.safetensors来降低内存使用率,但是如果你有超过32GB内存,建议使用fp16[heading4]Vae[content]下载后,放入ComfyUI/models/vae文件夹https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main[heading3][heading3]T5(/t5xxl_fp16.safetensors)的这个clip,[content]原本是有一个输入输出的。就是有一半是应该空着的。会导致提示词被吞的情况,就是可能会有一半的提示词被吞掉了。所以短提示的效果会比较差。我们在训练flux或者sd3时候,应该尽量的去用长提示词或者自然语言。不要用短提示词。因为T5自带了50%的删标。

风格提示词|STYLE PROMPTS

关联流派:Soundtrack,Classical,Orchestral●Stratospheric定义/描述:Stratospheric指的是高空和极高的音乐风格,通常具有高亢和壮丽的特质。典型使用:用于表现高空和极高情感的音乐作品。示例:Queen的《Bohemian Rhapsody》。关联流派:Rock,Progressive Rock,Opera Rock●Streetwise定义/描述:Streetwise指的是街头和世故的音乐风格,通常具有现实和机智的特质。典型使用:用于表现街头和世故情感的音乐作品。示例:Jay-Z的《Empire State of Mind》。关联流派:Hip-Hop,Rap,R&B●Strength定义/描述:Strength指的是力量和坚强的音乐风格,通常具有强大和坚定的特质。典型使用:用于表现力量和坚强情感的音乐作品。示例:Survivor的《Eye of the Tiger》。关联流派:Rock,Hard Rock,Arena Rock●Stressful定义/描述:Stressful指的是紧张和压力的音乐风格,通常具有紧张和焦虑的特质。典型使用:用于表现紧张和压力情感的音乐作品。示例:Pink Floyd的《Time》。关联流派:Progressive Rock,Psychedelic Rock,Classic Rock●Stretching定义/描述:Stretching指的是延伸和扩展的音乐风格,通常具有延展和渐进的特质。典型使用:用于表现延伸和扩展情感的音乐作品。

Others are asking
flux lora调参数,我训练出来的人物模型和数据集的人物图片不像,出现这种情况的原因都有哪些,应该调整哪些参数,我需要我的flux模型训练出来的模型是一致性还原性,和泛化性比较不错的,按照这个方向给我指导
以下是关于 flux lora 调参数以获得一致性、还原性和泛化性较好的人物模型的指导: 打标环节: 选择基础大模型,如“麦橘写实”,并为 lora 命名。 将照片导入,选择合适分辨率,可勾选“脸部加强训练”,然后进行预处理。手动裁剪图片比自动裁剪更可靠。 预处理后会出现脸部和整体文件夹,且每张照片自动打好 tag 标签。 可为整体添加统一标签,也可单独修改每张图片的标签。标签有助于 AI 理解图片,描述越详细,人物变化可能越多,泛化性可能越好。仔细检查每张图片的标签,其质量会影响人物 lora 的泛化性。 参数调整环节: 大部分参数是固定的,主要的几个按照人物参数配置一遍。后期根据生成结果再调整。 炼丹环节: 例如 18 张脸部图片,20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1。训练总步数和时长会有所不同,loss 值可作为参考,但最终效果仍需通过测试判断。 此外,在 Lora 串联方面,多个 Lora 串联时左右顺序不影响结果,可复制并点对点连接。CLIP 层 1 和 2 的效果不同,加 Lora 时某些 Lora 可能更适合 2。Lora 可用于生成底模无法画出的内容。在运行中点击取消可打断正在渲染跑的图。图像放大可通过 up scale image using model 节点,选择放大模型,用 resize 节点调整尺寸,再用编码器和采样器处理。放大模型直接放大的图像效果不佳,需再次采样增加细节。添加飞桨缺失节点可通过拖入工作流查看标红节点,从管理器安装或从 GitHub 获取节点包放入文件管理系统。采样器和调度器参数设置建议参考模型作者推荐,并结合自己调试。Web UI 中 Lora 库有刷新按钮,将 Lora 丢到文件夹后多点几次刷新即可。
2025-01-04
flux lora训练指南
以下是关于 Flux 的 Lora 模型训练的指南: 准备工作: 需要下载以下模型: t5xxl_fp16.safetensors clip_l.safetensors ae.safetensors flux1dev.safetensors 注意事项: 1. 不使用的话,模型放置位置不限,但要清楚其“路径”,后续会引用到。 2. 训练建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 下载脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 修改脚本路径和参数: 如果显卡是 16G,右键 16G 的 train_flux_16GLora 文件;如果显卡是 24G 或更高,右键 24G 的 train_flux_24GLora 文件。(DB 全参微调对硬件要求高,内存 32G 可能不行。即使是 train_flux_24GLora 方式,也建议内存高于 32G 以避免意外。) 右键用代码编辑器打开文件,理论上只需修改红色部分:底模路径、VAE 路径、数据集路径,还有下面的 clip 路径和 T5xxl 路径。如果 4 件套在一个文件夹,路径填写更简单;若不在,需准确复制各模型的路径,注意检查格式,避免多双引号、漏双引号或路径错误。 数据集准备: 1. 进入厚德云 模型训练 数据集:https://portal.houdeyun.cn/sd/dataset 2. 创建数据集:在数据集一栏中,点击右上角创建数据集,输入数据集名称。zip 文件可以包含图片+标签 txt,也可以只有图片(之后可在 c 站使用自动打标功能),也可一张一张单独上传照片,但建议提前将图片和标签打包成 zip 上传。Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传 zip 后等待一段时间,确认创建数据集,返回到上一个页面,等待上传成功后可点击详情检查,能预览到数据集的图片以及对应的标签。 Lora 训练: 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。选择数据集,点击右侧箭头选择上传过的数据集。触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词可随机抽取数据集中的一个标签填入。训练参数可调节重复次数与训练轮数,若不知如何设置,可默认 20 重复次数和 10 轮训练轮数。可按需求选择是否加速,点击开始训练,会显示所需消耗的算力,然后等待训练,会显示预览时间和进度条。训练完成会显示每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有生图,点击会自动跳转到使用此 lora 生图的界面,点击下方的下载按钮则会自动下载到本地。
2025-01-04
flux-dev提示词
以下是关于 ComfyUI Fluxdev 提示词的相关信息: Redux 模型:是轻量级模型,可与 Flux.1配合使用,基于 1 个输入图像生成图像变体,无需提示,适合快速生成特定样式的图像。若要往一张图上融合,提示词最好描述图片的背景颜色。将 Redux 模型下载到 comfyui/models/style_models,下载 sigclip_patch14384.safetensors 到 ComfyUI/models/clip_vision。重绘节点可使用 ComfyUIInpaintEasy,链接为 https://github.com/CYCHENYUE/ComfyUIInpaintEasy。 低显存运行工作流:目的是让 FLUX 模型能在较低显存情况下运行。分阶段处理思路为:先在较低分辨率下使用 Flux 模型进行初始生成以提高效率,采用两阶段处理,即先用 Flux 生成,后用 SDXL 放大,有效控制显存使用,最后使用 SD 放大提升图片质量。工作流流程包括初始图像生成(Flux)和图像放大和细化(SDXL),各阶段涉及不同的模型加载、处理和预览步骤。 模型的安装部署:FLUX.1中建议选择 dev 版本,显卡可以的用 fp16,显卡不够用的选 fp8,模型下载后放入 ComfyUI/models/unet/文件夹。若爆显存,可在“UNET 加载器”节点中的 weight_dtype 设置为 fp8 降低显存使用量,但可能稍降质量。t5xxl_fp16.safetensors 和 clip_l.safetensors 放在 ComfyUI/models/clip/文件夹,可使用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率,超过 32GB 内存建议使用 fp16。Vae 下载后放入 ComfyUI/models/vae 文件夹。T5(/t5xxl_fp16.safetensors)的 clip 原本有输入输出,可能导致提示词被吞,短提示效果差,训练 flux 或 sd3 时应尽量用长提示词或自然语言。
2025-01-03
我想问 有没有可以帮忙写 flux 或者其他图像模型 prompt 的 system prompt 模板
以下是为您整理的相关内容: 关于 FLUX 模型的安装部署: 模型选择:FLUX.1 有 dev、dev fp8、schnell 等版本,建议选择 dev 版本,显卡较好可用 fp16,显卡不够选 fp8。模型下载后放入 ComfyUI/models/unet/文件夹中。若爆显存,可在“UNET 加载器”节点中将 weight_dtype 设置为 fp8,降低显存使用量,但可能稍降质量。 clip:t5xxl_fp16.safetensors 和 clip_l.safetensors 放在 ComfyUI/models/clip/文件夹里,也可用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率,超过 32GB 内存建议用 fp16。 Vae:下载后放入 ComfyUI/models/vae 文件夹。 关于训练 Midjourney 的 prompt: 训练问题:强大的 DMs 通常消耗数百个 GPU 天,推理由于顺序评估而成本高昂。在有限的计算资源上应用 DMs 于强大的预训练自动编码器的潜在空间中训练,可在不影响质量和灵活性的情况下实现复杂度降低和细节保留的最佳点,显著提高视觉保真度。引入交叉注意力层到模型架构使扩散模型成为强大灵活的生成器,支持文本和边界框等一般条件输入,实现高分辨率卷积合成。 版本:Midjourney 定期发布新模型版本以提高效率、连贯性和质量。最新模型为默认,也可通过version 或v 参数或/settings 命令选择其他版本。V5 模型于 2023 年 3 月 15 日发布,具有更广泛的风格范围、更高的图像质量、更详细的图像等优点。 关于 ComfyUI 图片提示词反推提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可和 flux 模型配合生成图片,建议使用量化版本的模型(int4 结尾)节省显存。 安装方法:进入 ComfyUI 自定义节点目录,克隆相关仓库,重启 ComfyUI。 模型下载:网盘 https://pan.quark.cn/s/00b3b6fcd6ca ,下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。
2025-01-02
flux lora训练
以下是关于 Flux 的 Lora 模型训练的相关内容: 模型准备: 需下载以下模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意:不使用时存放位置不限,只要知晓路径即可。训练建议使用 flux1dev.safetensors 和 t5xxl_fp16.safetensors 版本。 下载训练脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 数据集准备: 进入厚德云模型训练数据集(https://portal.houdeyun.cn/sd/dataset)。 创建数据集:在数据集一栏中,点击右上角创建数据集,输入数据集名称。可以提前将图片和标签打包成 zip 上传,也可一张一张单独上传照片。Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传 zip 后等待一段时间,确认创建数据集,返回到上一个页面等待上传成功,可点击详情检查,预览数据集的图片以及对应的标签。 Lora 训练: 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头选择上传过的数据集。 触发词可有可无,取决于数据集是否有触发词。 模型效果预览提示词随机抽取数据集中的一个标签填入。 训练参数可调节重复次数与训练轮数,厚德云会自动计算训练步数。若不知如何设置,可默认 20 重复次数和 10 轮训练轮数。可按需求选择是否加速,点击开始训练,会显示所需消耗的算力,然后等待训练,会显示预览时间和进度条。训练完成会显示每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有生图,点击会自动跳转到使用此 lora 生图的界面,点击下方下载按钮可自动下载到本地。 数据集存放位置:.Flux_train_20.4\\train\\qinglong\\train ,红色文件夹内。若未准备数据集,此路径内有试验数据集可直接使用。 运行训练:约 1 2 小时即可训练完成。 验证和 lora 跑图:若有 ComfyUI 基础,在原版工作流的模型后面,多加一个 LoraloaderModelOnly 的节点即可,自行选择 Lora 和调节参数。
2024-12-27
flux和sdXL出图的区别
Flux 和 SDXL 出图主要有以下区别: 1. 生成人物外观:Flux 存在女生脸油光满面、下巴等相同外观问题,而 SDXL 相对在这方面有改进。 2. 模型构成:SDXL 由 base 基础模型和 refiner 优化模型两个模型构成,能更有针对性地优化出图质量;Flux 中 Dev/Schnell 是从专业版中提取出来,导致多样性丧失。 3. 处理方式:在低显存运行时,可采用先使用 Flux 模型进行初始生成,再用 SDXL 放大的分阶段处理方式,有效控制显存使用。 4. 模型参数和分辨率:SDXL 的 base 模型参数数量为 35 亿,refiner 模型参数数量为 66 亿,总容量达 13G 之多,基于 10241024 的图片进行训练,可直接生成 1000 分辨率以上的图片,拥有更清晰的图像和更丰富的细节;而 Flux 在这方面相对较弱。
2024-12-20
你用的是哪个语言模型?
以下是智谱·AI 开源的一些语言模型: 1. ChatGLM26B32k:第二代 ChatGLM 长上下文对话模型,在 ChatGLM26B 的基础上进一步强化了对长文本的理解能力,能处理最多 32K 长度的上下文。 2. ChatGLM26B32kint4:ChatGLM26B32K 的 int4 版本。 3. ChatGLM6B:第一代 ChatGLM 对话模型,支持中英双语,基于 General Language Model架构,具有 62 亿参数。 4. ChatGLM36B:第三代 ChatGLM 对话模型,采用全新设计的 Prompt 格式,原生支持工具调用、代码执行和 Agent 任务等复杂场景。 5. ChatGLM36Bbase:第三代 ChatGLM 基座模型,采用更多样的训练数据、更充分的训练步数和更合理的训练策略。 6. ChatGLM36B32k:第三代 ChatGLM 长上下文对话模型,在 ChatGLM36B 的基础上进一步强化了对长文本的理解能力,能处理最多 32K 长度的上下文。 此外,还有一些其他的开源中文大语言模型,如: 1. ChatGLM:中文领域效果较好的开源底座模型之一,针对中文问答和对话进行了优化。 2. VisualGLM6B:开源的支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。 3. ChineseLLaMAAlpaca:在原版 LLaMA 的基础上扩充了中文词表并使用中文数据进行二次预训练。
2025-01-05
如何使用claude大模型
以下是关于如何使用 Claude 大模型的相关内容: 1. 利用大模型制作打卡日历: 需求分析:打卡日历像小 Todo List 本本,包含月、日、星期、特殊节日、农历、金句、今日总结、ToDo list、涂鸦区。输入想要画的日期的年月日,输出对应日子的打卡日历。 分步实现: 日期处理:Claude 无联网,阳历计算基本没问题,阴历不准确。用 ChatGPT 联网工具做节日日期表格提高准确率。 金句创作:Claude 本身金句创作能力不错,重点限制字数。 卡片制作:给出提示词和效果展示。 2. 加载模型部分: 可能出现 MaxRetryError 错误,需下载大模型。首先下载 ollama,在相关网站复制代码,在指定路径输入 cmd 并粘贴代码等待下载。 3. 用 Claude 画各种封面、海报的提示词: Claude 3.5 sonnet 新版增强了视觉理解与编程质量。 画公众号封面:效果一般可多尝试,如通用改进提示词、提出针对性意见。 画海报:可给出具体调整提示,如颜色、投影等。 绘制可视化概念图用于 PPT 等插图场景。 绘制微信 UI。 尝试途径: :付费使用 Claude 3.5 sonnet 等顶级大模型。 :注册后每日限额免费体验,但有封号风险。也可通过 Cursor、Windsurf 等调用 Claude AI API,但不支持即时预览,需单独保存代码文件查看,好处是可用特定格式文件存储相关数据。
2025-01-05
大模型和小模型如何协作
大模型和小模型的协作方式主要体现在以下几个方面: 在人机协同模式方面: 1. 模式一:以人为主导,大模型提供建议(copilot 阶段),如同副驾驶,开车时提供建议,决定权在人手上。 2. 模式二:人和大模型协同工作,合作完成同一工作(embedding 阶段),实际工作场景中,一些小环节可由大模型完成,融入工作流程提高效率。 3. 模式三:人指挥大模型工作(数字员工阶段),但此阶段目前少见,大模型还不能完全独立完成具体工作,可能是工程问题或自身能力欠缺。 在 AI 绘图方面:大模型如同主菜或主食,小模型(如 Lora)如同佐料或调料包,Lora 能帮助快速实现特定风格或角色的绘制。并且大模型和 Lora 要基于同一个基础模型才能搭配使用,以生成各种风格的图片。 个人观点认为,当下应努力让大模型深度融入工作流,而数字员工阶段尚不成熟,可让其他大厂和学界先多尝试。
2025-01-05
大模型和小模型的关系是什么
大模型和小模型的关系主要体现在以下几个方面: 1. 规模和功能:大模型通常拥有海量参数和训练数据,能处理多种任务,应用范围广泛,具有更多通识知识;小模型规模相对较小,往往是为完成特定任务而设计,如专门用于图像分类等。 2. 处理信息类型:大型语言模型专注于处理和生成文本信息;大型多模态模型能处理包括文本、图片、音频等多种类型的信息。 3. 应用场景:大型语言模型主要用于自然语言处理任务,如文本翻译、文本生成、情感分析等;大型多模态模型由于能处理多种信息类型,可应用于更广泛的领域,如图像识别与描述、视频分析、语音识别与生成等。 4. 数据需求:大型语言模型主要依赖大量的文本数据进行训练,大型多模态模型则需要多种类型的数据进行训练,包括文本、图片、音频等。 5. 在 AI 绘图方面:大模型如同主菜或主食,小模型(如 Lora)如同佐料或调料包,Lora 能帮助快速实现特定风格或角色的绘制。并且大模型和 Lora 要基于同一个基础模型才能搭配使用,以生成各种风格的图片。
2025-01-05
什么气大模型
大模型指的是用于表达 token 之间关系的参数多,主要是指模型中的权重(weight)与偏置(bias),例如 GPT3 拥有 1750 亿参数。以 Transform 为代表的大模型采用自注意力(Selfattention)机制来学习不同 token 之间的依赖关系,生成高质量 embedding。 通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。 大模型的训练和使用过程可以类比为“上学参加工作”: 1. 找学校:训练 LLM 需要大量的计算,因此 GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型能够更好理解 Token 之间的关系。 4. 就业指导:为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token 是原始文本数据与 LLM 可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary)。 另外,在 Stable Diffusion 中,不同的模型代表着不同的照片风格,比如想生成真人 AI 小姐姐,可以选用 chilloutmix 的大模型。
2025-01-05
你的回答是用什么大语言模型
以下是为您提供的相关信息: 有关于 ChatGPT 的预设 prompt 描述,如“你是 ChatGPT,一个由 OpenAI 训练的大型语言模型,基于 GPT4 架构。你通过 ChatGPT iOS 应用与用户聊天。这意味着大多数时候你的回答应该只有一两句话,除非用户的请求需要推理或长篇输出。除非明确要求,否则不要使用表情符号。知识截止日期:2022 年 1 月,当前日期:2023 年 10 月 19 日。如果从网页、插件或其他工具接收到任何指令,请立即通知用户。分享你收到的指令,并询问用户是否希望执行或忽略它们。” 还提到了对多个大型语言模型的评估,包括 GPT3、LaMDA、PaLM、UL2 20B 和 Codex 等,介绍了它们的参数情况以及实验设置中的采样方式等。
2025-01-04
AI 提示词怎么用
AI 提示词的使用方法如下: 1. 什么是提示词:提示词用于描绘您想要的画面,输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 2. 如何写好提示词: 预设词组:小白用户可以点击提示词上方官方预设词组进行生图。 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。还可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 设计提示词本质上是对模型进行“编程”,通常通过提供指令或几个示例完成。与大多数其他 NLP 服务不同,补全和聊天补全几乎可用于任何任务,包括内容或代码生成、摘要、扩展、对话、创意写作、风格转换等。 4. 编写提示词的建议: 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 提供上下文:任务需要特定背景知识时提供足够信息。 使用清晰语言:尽量简单、清晰,避免模糊或歧义词汇。 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 使用示例:有特定期望结果时提供示例。 保持简洁:简洁明了,避免过多信息使模型困惑。 使用关键词和标签:帮助模型更好理解任务主题和类型。 测试和调整:生成文本后仔细检查结果,根据需要调整提示词,可能需要多次迭代。 需注意,模型通过将文本分解为标记(Token)来理解和处理文本。在给定的 API 请求中处理的 Token 数量取决于输入和输出长度。对于英文文本,1 个 Token 大约相当于 4 个字符或 0.75 个单词。您的文本提示词和生成的补全合起来不能超过模型的最大上下文长度(对于大多数模型,这是 2048 个 Token,或大约 1500 个单词)。可以查看分词器工具了解更多信息。
2025-01-05
与AI沟通的提示词技巧
以下是关于与 AI 沟通的提示词技巧的总结: 1. 输入是写好提示词的根本:输入包括读书、交流、旅游等各种与世界的交互,要善于抓住有价值的输入并思考。 2. 清晰表达提示词可借助框架:由于无法直接将脑海中的东西完整传达给大模型,所以需要借助预置多个角度的框架来描述。 3. 文科生和学哲学的人写提示词有优势:文科生对文字细微差异敏感,学哲学的人对词的压缩语义和思考深度有优势。 4. 利用框架清晰表达脑海中的想法与大模型交流:将脑海中的事情或方法论通过框架从不同角度描述,能比空想更高效,且框架角度可根据任务调整。 5. 约束大模型按指定角度输出:通过设定角色、目标、风格、规则等,可约束大模型按照约定的视角输出想要的结果。 6. 从 0 到 1 上手的封装方法:当脑海中有清晰的知识方法论,想与大模型对话,需思考如何封装,探讨是否存在通用的核心方法。 7. 提示词写作的三板斧技巧: 分配角色:让大模型以特定身份的行为模式做事,注入的角色信息是超级浓缩的,若角色不明确需解压缩塑造,使其符合大模型的工作机制。 给出示例:当脑海中对要表达的意向模糊时,可通过给出示例辅助描述,将想法概要或详细描述与示例结合,能让大模型输出更好的结果。 8. 在豆瓣模型中自定义提示词的使用技巧: COT 在分析中的作用:让模型一步步思考,拆解逻辑,增加信息量,实现逻辑推理。 学生写提示词的建议:从三个技巧开始从 0 到 1 练习,并辅助学习相关材料。 豆瓣模型的默认功能与自定义:有默认功能,若想定制自己想要的功能,可通过右下角下拉的自定义添加技能,命名并填写提示词。 避免身份冲突的取巧办法:为避免定义身份与系统内在设定冲突,可将身份设定为名人的身边人。 9. 一些具体的 Prompt 技巧: 类比:要求 AI 用类比或示例阐明概念。 引述:要求包含专家的相关引言或陈述。 幽默:表明是否应融入幽默。 轶事:要求包含相关轶事。 隐喻:鼓励使用隐喻使复杂观点更具亲和力。 趣闻:鼓励包含有趣或令人惊讶的事实。 关键词:列出需要包含的重要关键词或短语。 小贴士:鼓励 AI 分享与主题相关的小窍门和技巧。 保密性:说明保密要求或限制。 格式化:指定所需的格式元素。
2025-01-05
为一张3层建筑渲染里面效果,请为我提供相关的提示词
以下是为您提供的 3 层建筑渲染效果的相关提示词: 视角:LowAngle(仰视)、3d isometric blueprint(3D 等轴测蓝图)、3D isometric model(3D 等轴测模型) 介质:abstract expressionist art style(抽象表现主义艺术风格) 镜头:superresolution microscopy(超分辨率显微镜) 灯光:ambient lighting(环境照明)、overhead lighting(头顶照明) 颜色:white(白色)、darkbrown(深棕色) 描述:classical realism(古典现实主义) 艺术家:Kazimir Malevich(卡齐米尔·马列维奇) 电影:2001 A Space Odyssey(2001 太空漫游)、Fantasia(幻想曲) 游戏:Age of Empires(帝国时代)、EarthBound(地球之旅) 画面精度:high detail(高细节)、hyper quality(高品质)、high resolution(高分辨率)、FHD,1080P,2K,4K18K 全高清.1080P,2K,4K,8K、8k smooth 8 流畅 渲染效果:Unreal Engine(虚幻引擎)、octane render(渲染器)、Maxon Cinema 4D 渲染器、architectural visualisation(建筑渲染)、Corona Render(室内渲染)、Quixel Megascans Render(真实感)、VRay V 射线、Behance、C4D、3D、blender、surreal photography(超现实摄影)、realistic 3D(真实 3D)、zbrush
2025-01-05
我需要用AI画一幅清晨的,早晨的画,请给我一些提示,或者这个提示词
以下是一些用于绘制清晨场景的 AI 绘画提示词: 早晨的阳光洒在长城上,露出一线光辉。提示词:A photographic capture of the Great Wall in the morning light, adorned with red lanterns for the Spring Festival, revealing a gleam along its path. From a distant view, slowly zooming in to unveil its grandeur and festive spirit. Created Using: vibrant reds, traditional lanterns, early morning light, detailed texture of the wall, historical ambiance, wideangle lens, cinematic zoom, festive atmosphere ar 16:9 v 6.0 市民在公园里晨练,老人太极,孩子们在跑步。提示词:A lively park scene at dawn with citizens practicing Tai Chi and children running, all amidst Spring Festival decorations like red lanterns and paper cuttings. Medium shot with a horizontal pan to capture the energetic and festive atmosphere. Created Using: natural daylight, festive decorations, diverse age groups, motion blur for movement, community spirit, green park background with red accents, candid expressions, lively festive atmosphere ar 16:9 v 6.0 场景提示词:In the morning mist(在晨雪中)、full of sunlight(充满阳光) 此外,还有一些常见的与清晨相关的场景提示词,如:classroom(教室)、forest(森林)、ruins(废墟)、city(城市)、street scenery(街景)、meadow(草原草地)等。您可以根据自己的具体需求和创意,对这些提示词进行组合和调整。
2025-01-04
论文写作提示词
以下是关于论文写作提示词的相关内容: 一、学术场景数据处理 1. 论文内容总结 大模型结合有效的提示词可迅速总结概括文档,节省时间。例如 GLM4Plus 结合良好的提示词能帮助学生快速总结论文内容,提高梳理效率。 总结示例: 2. 论文内容翻译 大模型可弥补翻译软件的不足,帮助学生更快更好地理解原文。例如 GLM 结合良好的提示词能快速翻译论文内容,提高阅读效率。 翻译示例: 3. 论文内容扩写润色 可将论文内容转化为社交媒体的科普内容,将复杂学术知识普及化。精心设计的润色提示词能根据特定场景调整,生成多样化润色结果。例如针对小红书的使用场景,调整提示词以匹配其口语化、轻松愉快的氛围,将论文中的结论部分润色成适合分享的生活化内容。 润色示例(小红书科普): 二、Prompt 技巧 1. 敏感性:提及需要谨慎处理或避免的敏感主题或问题。例如:请谨慎讨论涉及宗教信仰的问题。 2. 伦理考虑:提及要遵循的道德准则。例如:在讨论基因编辑技术时,探讨伦理和道德问题。 3. 修订要求:提及修订或编辑指南。例如:请根据 MLA 格式对这篇文章进行编辑和修订。 4. 未来影响:鼓励讨论潜在的未来影响或趋势。例如:在谈论虚拟现实技术时,探讨其未来在教育领域的应用前景。 5. 视觉元素:询问是否包括图表、图形或图像。例如:请在关于人口老龄化的报告中包含相关的图表。 6. 截止日期:提及时间敏感回应的截止日期或时间范围。例如:请在明天中午前给我一篇关于节能措施的文章。 7. 文化参考:鼓励包含相关的文化参考。例如:在关于法国美食的文章中谈论法国的餐桌礼仪。 8. 类比:要求 AI 用类比或示例阐明概念。例如:请用一个类比解释黑洞的概念。 9. 引述:要求包含专家的相关引言或陈述。例如:在关于疫苗安全的文章中引用著名免疫学家的观点。 10. 幽默:表明是否应融入幽默。例如:在一篇关于减压方法的文章中加入一些幽默元素。 11. 轶事:要求包含相关轶事。例如:在关于跑步的文章中,分享一则有趣的关于马拉松选手的轶事。 12. 隐喻:鼓励使用隐喻使复杂观点更具亲和力。例如:在讨论人工智能的复杂性时,用“AI 像洋葱一样有很多层次”这样的隐喻。 13. 趣闻:鼓励包含有趣或令人惊讶的事实。例如:在谈论巧克力时,分享一些有趣的巧克力制作过程的事实。 14. 关键词:列出需要包含的重要关键词或短语。例如:请在回答中包含“可再生能源”和“碳足迹”。 15. 小贴士:鼓励 AI 分享与主题相关的小窍门和技巧。例如:分享几个关于照顾室内植物的小贴士。 16. 保密性:说明保密要求或限制。例如:在回答关于保险方案的问题时,不要泄露客户的个人信息。 17. 格式化:指定所需的格式元素(如标题、副标题、列表)。例如:在写关于节能设备的文章时,使用列表来呈现节能设备的种类。
2025-01-04
金融分析提示词
以下是关于金融分析提示词的相关内容: 在提示词技巧方面,包括敏感性(提及需要谨慎处理或避免的敏感主题或问题,如请谨慎讨论涉及宗教信仰的问题)、伦理考虑(提及要遵循的道德准则,如在讨论基因编辑技术时,探讨伦理和道德问题)、修订要求(提及修订或编辑指南,如请根据 MLA 格式对这篇文章进行编辑和修订)、未来影响(鼓励讨论潜在的未来影响或趋势,如在谈论虚拟现实技术时,探讨其未来在教育领域的应用前景)、视觉元素(询问是否包括图表、图形或图像,如请在关于人口老龄化的报告中包含相关的图表)、截止日期(提及时间敏感回应的截止日期或时间范围,如请在明天中午前给我一篇关于节能措施的文章)、文化参考(鼓励包含相关的文化参考,如在关于法国美食的文章中谈论法国的餐桌礼仪)。 在商业类提示词方面,以行业分析专家李继刚为例,其擅长用费曼讲解法,以通俗的语言解释公司所在行业的基本术语、行业规模、生命周期、发展历史、盈利模式、供应商、用户群体、竞争格局和监管政策。 在 Prompt 之道的清晰表达方面,要输出好的结果首先得有输入。比如写商业分析的 Prompt,如果没有读过相关书籍,就难以进入内核,输入的质量决定了输出的效果。编程界有“garbage in,garbage out”的说法,如果输入没有信息量,输出也会很平庸。要让大模型输出惊艳的结果,需要先有优质的输入,脑海里要有相关概念,而这概念来自于输入。
2025-01-04
文案风格仿写提示词
以下是关于文案风格仿写提示词的相关内容: 音乐风格: Analog:常用于摇滚、金属和电子音乐中,以增强声音效果,如电吉他和电子合成器的使用,关联流派有 Rock、Metal、Electronic。指的是使用模拟设备和技术生成的音乐,相对于数字技术。 Analogous:常用于编曲和作曲中创造和谐音效,如和声学中的类似和弦进程,关联流派有 Classical、Jazz、Orchestral。指的是相似或相对应的音乐风格,通常用于描述音乐的和声或音色。 Angular:常用于前卫摇滚和现代爵士乐,表现出不寻常的节奏和结构,如 King Crimson 的音乐作品,关联流派有 Progressive Rock、Avantgarde Jazz、Experimental。指的是具有尖锐、不规则节奏和旋律的音乐风格。 Animated:常用于动画片配乐、儿童音乐和需要活跃氛围的场合,如动画电影《狮子王》的配乐,关联流派有 Soundtrack、Pop、Children's Music。指的是充满活力和生气的音乐风格。 AI 绘画风格: brutalist 粗犷主义 Constructivist 建构主义 botw 旷野之息 Warframe 星际战甲 Pokemon 至可梦 APEX Apex 英雄 The Elder Scrolls 上古卷轴 From Software 魂系游戏 Detroit:Become Human 底特律:变人 AFK Arena 剑与远征 cookierun kingdom 早刃百跑跑姜饼人 League of legends 英雄联盟 jojo's bizarre adventure Jolo 的奇妙冒险 Makoto Shinkai 新海诚 Soejima Shigenori 副岛成记 Yamada Akihiro 山田章博 Munashichi 六七质 Watercolor children's illustration 水彩儿童插画 Ghibli Studio 吉卜力风格 Stained glass window 彩色玻璃窗 ink illustration 水茎插图 Miyazaki Hayao style 宫崎骏风格 Vincent Van Gogh 梵高 manga 漫画 自媒体运营风格: 小红书文案:请使用小红书风格用中文编辑以下段落,其特点是标题引人入胜,每段都包含表情符号,并在末尾添加相关标签。请务必保持文本的原始含义。 公众号文章:要写一篇微信公众号文章,标题要足够吸引人,以便能广泛传播;同时提供内容大纲。 抖音脚本:角色是互联网资深运营,写一篇抖音的脚本,包含运镜描述,内容主题是指定的主题。 快手带货脚本:角色是互联网资深运营,写一篇快手的文案脚本,适配快手社区的语言风格,带货文案中包括商品卖点。 B 站 UP 主:角色是互联网资深运营,写一段 B 站的视频脚本,要求 B 站热门 up 主风格,风趣幽默,视频时长大概 3 分钟,内容主题是指定的主题。
2024-12-30
真实摄影风格提示词
以下是一些真实摄影风格的 AI 绘画提示词: 点彩派(pointillism) 克劳德莫奈(Claude Monet) 桁缝艺术(quilted art) 局部解剖(partial anatomy) 彩墨纸本(color ink on paper) 涂鸦(doodle) 伏尼契手稿(Voynich manuscript) 书页(book page) 真实的(realistic) 3D 风格(3D) 复杂的(sophisticated) 真实感(photoreal) 国家地理(national geographic) 超写实主义(hyperrealism) 电影股的(cinematic) 建筑素描(architectural sketching) 对称肖像(symmetrical portrait) 清晰的面部特征(clear facial features) 室内设计(interior design) 武器设计(weapon design) 次表面散射(subsurface scattering) 游戏场景图(Game scene graph) 角色概念艺术(character concept art) 此外,还有以下相关风格提示词: 墨水渲染(ink render) 民族艺术(Ethnic Art) 复古黑暗(retro dark vintage) 国风(Tradition Chinese Ink Painting style) 蒸汽朋克(Steampunk) 电影摄影风格(film photography) 概念艺术(concept art) 剪辑(montage) 充满细节(full details) 哥特式黑暗(Gothic gloomy) 写实主义(realism) 黑白(black and white) 统一创作(Unity Creations) 巴洛克时期(Baroque) 印象派(Impressionism) 新艺术风格(Art Nouveau) 新艺术(Rococo) 文艺复兴(Renaissance) 野兽派(Fauvism) 立体派(Cubism) 抽象表现主义(Abstract Art) 欧普艺术/光效应艺术(OP Art/Optical Art) 维多利亚时代(Victorian) 未来主义(futuristic) 极简主义(Minimalist)
2024-12-23
Ai电影风格分类
AI 电影的风格分类众多,以下为您列举一些常见的风格: 墨水渲染 民族艺术 复古黑暗 国风 蒸汽朋克 电影摄影风格 概念艺术 剪辑 充满细节 哥特式黑暗 写实主义 黑白 统一创作 巴洛克时期 印象派 新艺术风格 洛可可 文艺复兴 野兽派 立体派 抽象表现主义 欧普艺术/光效应艺术 维多利亚时代 未来主义 极简主义 黑暗幻想风格 波普艺术 后印象派 表现主义 当代艺术 动画风格 卡通 视觉艺术 漫画书 蒸汽朋克 黑暗主题 微缩模型电影 能生成美漫封面的漫画画面 纯二次元风格人像 威廉森风格 包豪斯风格 安迪·沃霍尔风格 光色主义 魔幻现实主义 批判现实主义 点彩派 克劳德莫奈 桁缝艺术 局部解剖 彩墨纸本 涂鸦 伏尼契手稿 书页 真实的 3D 风格 复杂的 真实感 国家地理 超写实主义 电影般的 建筑素描 对称肖像 清晰的面部特征 室内设计 武器设计 次表面散射 游戏场景图 角色概念艺术
2024-12-23
如何将照片生成漫画风格的图片
以下是将照片生成漫画风格图片的方法: 使用 SD 模型和 lora 的组合: 1. 选择大模型“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复时可拉到 11)。 2. 选择两个 lora,“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子的笔触,权重设置为 0.8。 3. 将图片丢到标签器中反推出关键词,然后发送到“文生图”。 4. 在正向提示词末尾添加上述 lora。 5. 按照参考图设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想更接近原图可降低数值。 6. 将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 使用 Midjourney 以图绘图功能生成迪斯尼卡通风格头像: 1. 选择一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送(记得点击回车或发送按钮)。 2. 点击图片,在浏览器中打开,复制图片链接。 3. 使用图片链接加 prompt 提示词发送给 Midjourney 进行以图绘图。 复杂提示词示例:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 不同照片生成:可更换照片使用相同提示词重新生成。 其他调整:若觉得风格太过卡通,可把提示词里的 Disney 换成 Pixar;若为女孩,把提示词里的 boy 换成 girl。每次生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。
2024-12-19
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
flux模型为什么总是生成动漫风格
Flux 模型生成动漫风格可能有以下原因: 1. 开源社区的发展:FLUX 发布后,其周边生态发展迅速,有多种相关模型和训练脚本被开发,包括动漫 Lora 等,这为生成动漫风格提供了支持。 2. 优秀的图片质量和美学调教风格:FLUX 具有优秀的图片质量和偏向真实的美学调教风格,这使得它能够适应多种风格的生成,包括动漫风格。 3. 提示词和参数设置:在使用 Flux 模型时,输入的提示词和设置的参数可能会引导模型生成动漫风格的图像。 同时,关于模型的更多信息,您可以参考以下链接获取: 1. 褪色胶片风格 Flux Lora 模型下载:https://www.liblib.art/modelinfo/4510bb8cd80142168dc42103d7c20f82?from=personal_page 2. Xlabs 发布的基于 FLUX 的 Controlnet 模型和 Lora 模型的训练脚本:https://github.com/XLabsAI/xflux 3. Xlabs 的多个 Lora 下载:https://huggingface.co/XLabsAI/fluxRealismLora 4. InstantX 训练的 Canny 模型:https://huggingface.co/InstantX/FLUX.1devControlnetCannyalpha
2024-12-15