以下是关于文生图的详细教程:
定主题:确定您需要生成的图片的主题、风格和要表达的信息。
选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。
选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上优秀帖子中使用的 lora。
ControlNet:可控制图片中特定图像,如人物姿态、特定文字、艺术化二维码等,属于高阶技能。
局部重绘:下篇再教。
设置 VAE:无脑选择 840000 即可。
Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需管语法,用英文半角逗号隔开。
负向提示词 Negative Prompt:用英文书写想要 AI 避免产生的内容,同样是单词和短语组合,用英文半角逗号隔开。
采样算法:一般选择 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。
采样次数:选择 DPM++2M Karras 时,采样次数通常在 30 - 40 之间。
尺寸:根据个人喜好和需求选择。
在不同的工具中,如 Tusiart 和 Liblibai,操作流程大致相同,但在一些细节上可能有所差异:
Tusiart:
Liblibai:
定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。选择基础模型Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。局部重绘:下篇再教,这里不急。设置VAE:无脑选择前面提到的840000这个即可。Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。负向提示词Negative Prompt:用英文写你想要AI避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。采样算法:这玩意儿还挺复杂的,现在我一般选DPM++2M Karras比较多。当然,最稳妥的是留意checkpoint的详情页上,模型作者是否有推荐采样器,使用他们推荐的采样器会更有保障。采样次数:要根据你采样器的特征来,一般我选了DPM++2M Karras之后,采样次数在30~40之间,多了意义不大还慢,少了出图效果差。尺寸:看你喜欢,看你需求。
定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。(没错我是喜欢看plmm多点)选择Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。设置VAE:无脑选840000那一串就行。CLIP跳过层:设成2就行。Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。负向提示词Negative Prompt:用英文写你想要AI避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。采样方法:这玩意儿还挺复杂的,现在一般选DPM++2M Karras比较多。当然,最稳妥的是留意checkpoint的详情页上,模型作者是否有推荐采样器,使用他们推荐的采样器会更有保障迭代步数:要根据你采样器的特征来,一般我选了DPM++2M Karras之后,迭代步数在30~40之间,多了意义不大还慢,少了出图效果差。尺寸:看你喜欢,看你需求。生成批次:默认1批。
[heading1]创意工具箱[heading2]文生图[content]仅需输入文本描述,即可一键生成图片素材,海量创意灵感信手拈来!操作指引:输入文本描述(关键词或场景描述等)——选择模型(注意FLUX模型不可商用)————开始生成——下载[heading2]AI翻译[content]支持多语种文本翻译,翻译结果实时准确,助力海外投放无语言障碍!操作指引:输入原始文本——选择翻译的目标语言——开始生成[heading2]TikTok风格数字人[content]适配Tiktok媒体平台的数字人形象上线,100+数字人模板可供选择,助力Tiktok营销素材生产无难度!操作指引:输入口播文案——选择数字人角色——点击开始生成*视频默认输出语言和输入文案语言保持一致,默认尺寸为9:16竖版。[heading2]多场景数字人口播配音[content]支持生成不同场景下(室内、户外、站姿、坐姿等)的数字人口播视频,一键满足多场景投放需求!操作指引:输入口播文案——选择数字人角色和场景——选择输出类型——点击开始生成*视频默认输出语言和输入文案语言保持一致[heading2]音频驱动多场景数字人[content]支持音频和场景数字人一键合成,快速生成数字人口播视频!操作指引:上传音频链接——选择数字人角色和场景——选择输出类型——点击开始生成*音频文件支持MP3和WAV格式,文件大小上限5M