Chat with Wiki - 文生图

Answer

以下是关于文生图的详细教程：

定主题：确定您需要生成的图片的主题、风格和要表达的信息。

选择基础模型 Checkpoint：根据主题选择内容贴近的模型，如麦橘、墨幽的系列模型，如麦橘写实、麦橘男团、墨幽人造人等。

选择 lora：基于生成内容寻找重叠的 lora，以控制图片效果和质量，可参考广场上优秀帖子中使用的 lora。

ControlNet：可控制图片中特定图像，如人物姿态、特定文字、艺术化二维码等，属于高阶技能。

局部重绘：下篇再教。

设置 VAE：无脑选择 840000 即可。

Prompt 提示词：用英文书写想要 AI 生成的内容，使用单词和短语组合，无需管语法，用英文半角逗号隔开。

负向提示词 Negative Prompt：用英文书写想要 AI 避免产生的内容，同样是单词和短语组合，用英文半角逗号隔开。

采样算法：一般选择 DPM++2M Karras 较多，也可参考 checkpoint 详情页中模型作者推荐的采样器。

采样次数：选择 DPM++2M Karras 时，采样次数通常在 30 - 40 之间。

尺寸：根据个人喜好和需求选择。

在不同的工具中，如 Tusiart 和 Liblibai，操作流程大致相同，但在一些细节上可能有所差异：

Tusiart：

定主题
选择 Checkpoint
选择 lora
ControlNet（高阶技能，后续学习）
局部重绘（下篇再教）
设置 VAE
Prompt 提示词
负向提示词 Negative Prompt
采样算法
采样次数
尺寸

Liblibai：

定主题
选择 Checkpoint
选择 lora
设置 VAE
CLIP 跳过层（设为 2）
Prompt 提示词
负向提示词 Negative Prompt
采样方法
迭代步数
尺寸
生成批次（默认 1 批）

Content generated by AI large model, please carefully verify (powered by aily)

References

Tusiart简易上手教程

定主题：你需要生成一张什么主题、什么风格、表达什么信息的图。选择基础模型Checkpoint：按照你需要的主题，找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型，比如说麦橘写实、麦橘男团、墨幽人造人等等，效果拔群。选择lora：在你想要生成的内容基础上，寻找内容重叠的lora，帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面，他们都在用什么lora。ControlNet：控制图片中一些特定的图像，可以用于控制人物姿态，或者是生成特定文字、艺术化二维码等等。也是高阶技能，后面再学不迟。局部重绘：下篇再教，这里不急。设置VAE：无脑选择前面提到的840000这个即可。Prompt提示词：用英文写你想要AI生成的内容，不用管语法也不要写长句，仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。负向提示词Negative Prompt：用英文写你想要AI避免产生的内容，也是一样不用管语法，只需单词和短语组合，中间用英文半角逗号隔开。采样算法：这玩意儿还挺复杂的，现在我一般选DPM++2M Karras比较多。当然，最稳妥的是留意checkpoint的详情页上，模型作者是否有推荐采样器，使用他们推荐的采样器会更有保障。采样次数：要根据你采样器的特征来，一般我选了DPM++2M Karras之后，采样次数在30~40之间，多了意义不大还慢，少了出图效果差。尺寸：看你喜欢，看你需求。

Liblibai简易上手教程

定主题：你需要生成一张什么主题、什么风格、表达什么信息的图。（没错我是喜欢看plmm多点）选择Checkpoint：按照你需要的主题，找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型，比如说麦橘写实、麦橘男团、墨幽人造人等等，效果拔群。选择lora：在你想要生成的内容基础上，寻找内容重叠的lora，帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面，他们都在用什么lora。设置VAE：无脑选840000那一串就行。CLIP跳过层：设成2就行。Prompt提示词：用英文写你想要AI生成的内容，不用管语法也不要写长句，仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。负向提示词Negative Prompt：用英文写你想要AI避免产生的内容，也是一样不用管语法，只需单词和短语组合，中间用英文半角逗号隔开。采样方法：这玩意儿还挺复杂的，现在一般选DPM++2M Karras比较多。当然，最稳妥的是留意checkpoint的详情页上，模型作者是否有推荐采样器，使用他们推荐的采样器会更有保障迭代步数：要根据你采样器的特征来，一般我选了DPM++2M Karras之后，迭代步数在30~40之间，多了意义不大还慢，少了出图效果差。尺寸：看你喜欢，看你需求。生成批次：默认1批。

【Tec-Creative】帮助手册

[heading1]创意工具箱[heading2]文生图[content]仅需输入文本描述，即可一键生成图片素材，海量创意灵感信手拈来！操作指引：输入文本描述（关键词或场景描述等）——选择模型（注意FLUX模型不可商用）————开始生成——下载[heading2]AI翻译[content]支持多语种文本翻译，翻译结果实时准确，助力海外投放无语言障碍!操作指引：输入原始文本——选择翻译的目标语言——开始生成[heading2]TikTok风格数字人[content]适配Tiktok媒体平台的数字人形象上线，100+数字人模板可供选择，助力Tiktok营销素材生产无难度！操作指引：输入口播文案——选择数字人角色——点击开始生成*视频默认输出语言和输入文案语言保持一致，默认尺寸为9:16竖版。[heading2]多场景数字人口播配音[content]支持生成不同场景下（室内、户外、站姿、坐姿等）的数字人口播视频，一键满足多场景投放需求！操作指引：输入口播文案——选择数字人角色和场景——选择输出类型——点击开始生成*视频默认输出语言和输入文案语言保持一致[heading2]音频驱动多场景数字人[content]支持音频和场景数字人一键合成，快速生成数字人口播视频！操作指引：上传音频链接——选择数字人角色和场景——选择输出类型——点击开始生成*音频文件支持MP3和WAV格式，文件大小上限5M