Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何让文生图片保持形象一致

Answer

要让文生图片保持形象一致,可以参考以下方法:

  1. 首先进入文生图,填写提示词,例如“(杰作,最好的质量),一头白发的女孩坐在绿植和鲜花的田野里,温暖的灯光,模糊的前景”,设置常规参数生成一张图。
  2. 若想以该人物为主角生成一系列其他图,将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,先将保真度数值设置为 1。
  3. 在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装可能产生随机变化。
  4. 可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,比如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。
  5. 像制作典籍类作品时,可对主要人物先出一版形象照,后续所有画面用“cref”做人物一致性的操作。

通过以上一系列操作和测试,可以发现这些功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况做实时的调整,若后期再配合 lora,潜力非常大。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】最强控制插件ControlNet(5)参考风格reference

首先我们进入文生图,填写一段提示词。如下:(杰作,最好的质量),一头白发的女孩坐在绿植和鲜花的田野里,温暖的灯光,模糊的前景。设置一下常规参数,先生成一张图。接下来,我们想用这个人物作为主角生成一系列其他的图。将图片拖入到ControlNet中,预处理器选择reference only,控制模型一定要选择“均衡”。保真度数值越高,对图片的参考就越强,我们先设置为1看看。可以看到,在没有明确指向性提示词的情况下,人物形象保持了一致,但是她的表情、动作、服装产生了随机的不同程度的变化。我们可以试着通过添加关键词的方式来给人物换装,比如添加“红裙子”。同时更改服装和表情,比如添加“黑色校服、哭泣”。同时更改动作和表情,比如添加“抱手、生气”。同时更改姿态,环境和表情,比如添加“在花丛中奔跑、开心”。添加“红色棒球帽,时尚卫衣,在商场逛街”。通过一系列测试,可以发现这个功能可以让我们在绘制系列插画、漫画、小说插图等等工作时,能保持主角形象的统一,也能根据情况做实时的调整,如果后期再配合lora,潜力可以想象是非常大的。

心 Heart 创作分享

分镜部分我就是完全根据感觉来,因为这条片子本身希望强调的是梦境,那么我希望它的主色调是蓝色,又因为需要真实感,所以我基本上都会在提示词末尾加上胶片拍摄,蓝色等关键词。整个短片的分镜我都没有设置特别复杂的元素和构图或需要实现人物一致性等,因为只有我一个人制作,时间上我也不能投入太多。我挑图基本上大感觉对了就可以,最多会用一下局部修改或扩图,不会再去PS里进行调整。[heading2]4.视频化部分[content]分两个部分,Ai图生视频部分,Runway+DreaminaRunway完成动态感要求不高但质感更趋向于实拍的画面Dreamina实现一些高动态幅度画面比如:电视机里气球漂浮、心形候鸟飞走等另外有一个部分实现时间流逝和穿越感,使用dreamina通过首尾帧来叠加剪辑[heading2]5.特效制作[content]为了呈现出不一样的效果,这一次我在视频中增加了一部分特效点云的画面。制作流程上是我通过meshy先简单做出一个3D的心形,然后同事将其导入Houdini中进行粒子化效果。非常感谢同事的协作,让我想象的画面具像化,把找到心的这个过程非常立体又酷炫地呈现了出来。[heading2]6.后期剪辑[content]剪辑部分也比较简单,我是在剪映中完成的,基本上只使用了一些转场效果,其他没有什么特殊或复杂的部分。

大狐:全国节约粮食日AI短片《爷爷,我会好好吃饭》 - 历经30多天全流程复盘

文生图用到的是midjourney,在画面和艺术的呈现上MJ的确展现出很优秀的效果,由于是典籍类的作品,在名人的形象上不能随意创作,我们一开始就给主要的人物出了一版形象照,所有的形象都来自于一些有记载的文献、照片、画像和雕像,后续所有的画面也都用"cref"做了人物一致性的操作。

Others are asking
文生图在线工具
以下是一些常见的文生图在线工具: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104),可以查看更多文生图工具。 Stability AI 推出的基于 Discord 的媒体生成和编辑工具的文生图使用方法: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,和 MJ 类似。 5. 可选参数有五类: prompt(提示词):正常文字输入,必填项。 negative_prompt(负面提示词):填写负面提示词,选填项。 seed(种子值):可以自己填,选填项。 aspect(长宽比):选填项。 model(模型选择):SD3,Core 两种可选,选填项。 Images(张数):1 4 张,选填项。 Tusiart 文生图的简易上手教程: 1. 定主题:确定需要生成的图片的主题、风格和表达的信息。 2. 选择基础模型 Checkpoint:按照主题找内容贴近的 checkpoint,如麦橘写实、麦橘男团、墨幽人造人等效果较好。 3. 选择 lora:寻找内容重叠的 lora 帮助控制图片效果及质量。 4. ControlNet:控制图片中一些特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,用英文半角逗号隔开,不用管语法和长句。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开,不用管语法。 9. 采样算法:一般选 DPM++2M Karras,也可留意 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。
2025-03-03
有哪些平台提供文生图API
以下是一些提供文生图 API 的平台: Coze:在国内低代码 Agent 平台中体验较好,即使即将收费但仍具性价比。其 API 更新开放了多模态对话和知识库修改能力,可玩性增强。通过 API 可在微信中实现多种图片功能,如重绘风格、微调内容等。使用时需在 chatgptonwechat 中的 config.json 中配置自己的 Coze API Key 和 Coze Bot ID。 Stability AI:发布了 Stable Diffusion 3 和 Stable Diffusion 3 Turbo,可通过其开发者平台 API 使用。ComfyUI 中的 Stable Diffusion 3 API 已更新,目前支持多种比例的 SD3 文生图,使用时先申请 API 再填入 config.json 文件,每账户有 25 免费积分,SD3 每张图 6.5 积分。项目地址:https://github.com/ZHOZHOZHO/ComfyUIStableDiffusion3API 。需注意 SD3 图生图模式不支持选择比例,SD3 Turbo 模型不支持负面提示词。
2025-03-02
文生视频怎么使用?
以下是关于文生视频使用的相关信息: Vidu: Web 端访问:https://www.vidu.studio/ 极速生成,实测 30 秒最快推理速度 动漫风格,万物皆可二次元 角色可控,任意场景、任何动作,角色保持一致 精准理解,镜头、文字、动作,理解更准、生成更稳 大片质感,影视级画面和特效一键直出 Vidu 提示词指南: 如何使用“文生视频”: 如何使用“图生视频(用作起始帧)”: 如何使用“参考人物角色生成视频”: PixVerse V2: 单个视频生成(8s):8s 的视频生成需要花费 30Credits,5s 的视频生成需要花费 15Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 文字生成视频的 AI 产品: Pika:一款非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,不过是收费的。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里: 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-02
文生音乐的app
以下是一些关于文生音乐的 App 相关信息: 目前龙头的文生音乐软件如 Suno、Uido 等,对于简单的广告 BGM、游戏配乐等使用场景有较大价值,但在音乐创作上仍有不足。例如 Suno 除歌词部分外,音乐风格提示词只有 120 个字符,能描述和理解的关键词有限,创作丰富度也有限,旋律较单调。 Colab 上有一个增强音质的脚本,但不如现有的音频处理工具,调参较难。 一些相关工具和网站: Audiobox:https://audiobox.metademolab.com/ ,是 Meta 的新音频生成基础研究模型,可结合语音输入和自然语言文本提示生成语音和声音效果。 Stable Audio:https://www.stableaudio.com/ ,可使用对应的 GPTs 生成提示词:https://chat.openai.com/g/gjAr0hpLsLstableaudiogpt 。 图像生成配乐模型(MAGNet,AudioLDM,audiogen):https://huggingface.co/spaces/fffiloni/Image2SFXcomparison ,audiogen 可文生音乐、文生拟音,在 discord 上使用但效果不稳定:https://discord.gg/wUuF5Uh2pR 。 音乐生成使用的文生音乐模型 Suno 相关教程: 在自定义模式(Custom Mode)下,有音乐风格(Style of Music)与歌词(Lyrics)两个主要输入窗口,音乐风格需填写多个描述整首音乐风格和感觉的 tag 进行分隔,可识别的 tag 包括音乐类型/流派、人声/乐器、情绪/氛围、节奏、场景、混响、其他和声/音效等。
2025-03-01
强大好用的文生视频AI
以下是一些强大好用的文生视频 AI 工具: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 这些工具适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 基于 MiniMax 海螺 AI 优质的 Prompt 响应能力,可以使用文生进行特定性外形保持。通过测试外形描述 Prompt 的保持情况,确定响应较为稳定的外形要素,反复使用以保持一定程度的稳定性。外形要素包括发型、年龄性别、衣物颜色、环境等。发型和衣物能基本稳定角色头部形象,年龄能生成相近年龄角色,相同的环境空间,尤其是光环境,可以增加观众对于形象认识的“一致性”认知,例如较大明暗对比的环境,保留较少的角色面部信息,有助于角色“一致性”。 文生视频具有制作便捷高效、提供多元创作思路的优势,但较难保证主体/风画面格的稳定性。实际使用场景更多是作为空镜头/非叙事性镜头/大场面特效镜头的制作。例如: 1. 《科幻预告片》:传统科幻类型影像具有相近的视觉元素,通过对于同类型视觉元素的空镜头制作,构成具有类似场景和美学风格的画面,利用“爆破”等优质表现的画面作为主要节奏点,制作出充满紧张感的科幻电影伪预告片。 2. 《雪崩灾难片预告》:根据“雪崩”这一主题,设计多组空镜头/大场面镜头组合,最大程度利用海螺 AI 文生视频的优异表现力,通过节奏感较强的剪辑,制作出一个以简单的故事线串联而成的预告片。
2025-02-28
国内文生视频
以下是一些国内的文生视频工具及相关信息: Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频。提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps,文生视频支持中文,时空理解。 以下是一些文字生成视频的 AI 产品推荐: Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 以下是一些文生视频模型的排序及特点(从高到低): |排序|模型|特点(优缺)| |||| |1|海螺|语意遵循不错,模型解析有待提高,自带电影滤镜,但有些用力过猛,得益于海量的影视数据| |2|可灵 1.5|颜色失真,缺少质感,偏科严重,物理规律和提示词遵循较强| |3|智谱|语意遵循,质感较差,画质一言难尽| |4|mochi|动态丰富,想象力丰富,美学质感较好| |5|pd 2.0 pro|PPT 效果,训练数据较少,但是联想启发性很好| |6|runway|空间感强,语意遵循较差,流体效果一绝| |7|Seaweed 2.0 pro|质感略弱于可灵 1.5,整体感觉师出同门| |8|sora|运镜丰富,物理逻辑混乱| |9|Pixverse v3|动态稳,丝滑,整体美学强于可灵 1.5| |10|luma 1.6|语意遵循差,提示词随便,动起来算我输| 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-27
如何控制图生图的形象和动作呢
要控制图生图的形象和动作,可以参考以下方法: 1. 使用 ControlNet 插件: 姿态约束类预处理器:包含了所有人物信息的预处理器,可将图片发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再次发送到图生图使用 ControlNet 中 tile 模型细化,最后使用 SD 放大插件。 自定义动作骨架:在【扩展】【加载扩展列表】中搜索【posex】安装插件,或将插件文件夹拷贝至指定目录,确保软件是最新版本并重启。重启后点击“将图片发送至 ControlNet”,可通过拖动鼠标左键旋转视角、中键缩放视角、右键拖动视角,玩坏了可点击重置镜头和动作。 2. 参考风格 reference:首先进入文生图,填写提示词生成一张图。然后将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高对图片的参考越强。可以通过添加关键词的方式来改变人物的服装、表情、动作等。 3. 利用 ControlNet 控制姿势:大模型和关键词正常填写生成想要的小姐姐照片,接着鼠标滑到最下面点击“ControlNet”,上传指定姿势的照片并点击“启用”,在“预处理器”和“模型”里选择“openpose”,点击“预览预处理结果”,最后点击生成照片。
2025-02-28
Ai 换脸形象照怎么换
以下是关于 AI 换脸形象照的相关信息: 法律风险: AI 换脸技术存在民事侵权风险。《民法典》规定,未经肖像权人同意,使用他人肖像的行为侵犯肖像权。 在刑事犯罪方面,使用他人肖像进行 AI 换脸旨在侮辱、诽谤、恶意丑化他人,并在网络上肆意传播,可能涉嫌侮辱、诽谤罪。此外,还存在利用该技术进行诈骗罪和制作、复制、出版、贩卖、传播淫秽物品牟利罪或传播淫秽物品罪等违法犯罪活动的情况。 制作方法: 可以通过某些工具生成数字人,在显示区域调整背景图和数字人的位置,增加字幕,完成后导出备用。若要换脸,需使用其他工具。 例如星流一站式 AI 设计工具,选中图像进入扩展功能界面,自动提取面部信息,上传想要替换的图片,选择重绘风格等参数即可。
2025-02-27
Ai 换脸形象照
以下是关于 AI 换脸的相关信息: 应用场景:包括 ai 写真换脸、工作流、自媒体、设计、电商、修复老照片等。在节目单中,也有 AI 换脸在视频与影视方面的应用,如春晚开头、AI 这一年等节目。 法律风险:民事方面,未经肖像权人同意使用其肖像可能侵犯肖像权。刑事方面,使用他人肖像进行 AI 换脸旨在侮辱、诽谤、恶意丑化他人并在网络上肆意传播,可能涉嫌侮辱、诽谤罪,此外还存在利用该技术进行诈骗罪和制作、复制、出版、贩卖、传播淫秽物品牟利罪或传播淫秽物品罪等违法犯罪活动的风险。
2025-02-27
图生图, 如何保持幻想生物形象一致性
要在图生图中保持幻想生物形象的一致性,可以参考以下方法: 1. 对于 Midjourney ,可以采用特定的名人或有特殊属性的人物形象,先确定好影片风格,比如皮克斯动画风格,然后确定好人物形象,如角色的发型、穿着等细节。 2. 利用 Midjourney 的新功能 Cref ,先跑一张主角的定妆照,在需要出现主角人物的地方扔进去 Cref ,以保持发型、人脸、衣服等的一致性。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,尤其是亚洲老人的一致性效果相对较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以原则上能不用就不用,比如只有背影时,简单描述即可。 3. 生成动物形象,动物相对更容易保持一致性。
2025-02-14
图生图, 如何保持生物形象一致性
在图生图中保持生物形象一致性,有以下几种方法: 1. 对于人物和场景一致性问题,可以采用生成动物的方式,动物相对容易保持一致性。 2. 选择特定的名人或具有特殊属性的人物。 3. 确定好影片风格,如皮克斯动画风格。 4. 先确定好人物形象,如明确角色的发型、穿着等特征。 5. 使用 Midjourney 的新功能 Cref,在需要出现主角人物的地方,保持发型、人脸、衣服等特征。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性效果相对较差,尤其对于亚洲老人,而且 Cref 在画面的审美和构图上有一定破坏性,原则上能不用则不用。例如只有背影时,简单描述特征即可。
2025-02-14
基于参考图片人物形象生成指定迪士尼风格的图片
以下是关于基于参考图片人物形象生成指定迪士尼风格图片的相关内容: 在 Midjourney 中,生成指定迪士尼风格的图片可以通过以下方式: 1. 角色参考(cref):cref 的功能是保持图像角色的一致性。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果想引用一张图,但只是把它作为新图的一部分,可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 生成一张 Disney 风格的头像的具体步骤如下: 1. 选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,然后在聊天框发送(记得点击回车或发送按钮)。 2. 图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,复制下来。 3. 使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图。 此外,在生成 3D 效果图时,如生成可爱的拟人小鹿角色,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择 图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片。
2025-02-12
如何用AI按照描述制作一张图片
以下是关于如何用 AI 按照描述制作一张图片的相关内容: 一、关键词和主题描述 1. 图片内容通常分为二维插画和三维立体两种表现形式。 2. 描述场景、故事、元素、物体或人物细节时,要清晰明确。对于场景中的人物,应独立描述,避免长串文字,以便 AI 识别。 3. 大场景中多个角色的细节较难通过关键词生成。 二、设计风格 1. 设计师难以直接表达设计风格时,可参考风格类关键词或垫图/喂图,让 AI 结合主题描述生成相应风格的图片。 2. 某些材质的关键词运用有较多门道,需针对特定风格进行“咒语测试”。 三、使用 Midjourney 生成图片 1. 图片描述可理解为以图生图,将设计参考图上传到 Midjourney 中,通过“参考图链接+文本描述”的方式生成图像。 2. 例如生成带有交互流程的 UI 界面图,先上传素材图,再用“参考图链接+node UI”等文字提示生成类似设计图,还可通过调整文字提示获得不同效果,如纯正面、扁平、手绘、黑白等风格。 3. 生成不同比例的图,需在文字描述中加入特定参数,如“aspect”或“ar”。 4. Midjourney 还可生成设计组件,探索多种设计风格的可能性,如扁平组件系统,关键词为“UI kit,flat design,outline,ar 16:9”。 四、AI 生成图片的著作权 1. 如 Stable Diffusion 模型根据文本指令生成图片,其生成的样子取决于使用者输入的提示词,非排列组合工作模式下难有相同图片。 2. 人工智能无自由意志,使用者通过增删提示词、修改参数得出不同图片并选定,体现使用者的创作,生成的具有独创性和智力投入的图片受著作权保护。 3. 相关法律适用包括《中华人民共和国著作权法》第三条和《中华人民共和国著作权法实施条例》第四条。案例中人工智能软件生成的图片著作权由使用者享有。
2025-03-03
AI 把logo 合成到图片里
以下是关于将 AI 把 logo 合成到图片里的相关内容: 试运行抠图操作,将抠图结果合到海报上,包括进入画板、添加画板、调整元素等操作。 为锅的海报添加背景及调整图片显示,处理品牌 LOGO 相关操作,如抠图、添加、调整位置和大小。 用 LLM 生成图像提示词,将提示词和 Logo 图片放到 Comfyui 工作流。 整个流程分为获取 Logo 图片的描述、生成图片提示词、将图片和提示词输入 Comfyui 工作生成。
2025-03-03
我是一名自媒体创作者,想用AI工具文字生图,图片内容如下:一个穿着发光衣服的美女在室内。请你给我提示词
以下是为您生成的提示词,用于生成一个穿着发光衣服的美女在室内的图片: 人物及主体特征:一位美丽的女性,身着发光的衣服,精致的五官,迷人的微笑,优雅的动作 场景特征:室内环境,装饰精美,有柔和的灯光 环境光照:温暖的灯光,营造出温馨的氛围 画幅视角:适中的距离,展现人物的全貌,正常的人物比例,平视的观察视角 画质:高画质,高分辨率 画风:写实 英文提示词为:, drawing, paintbrush, a beautiful woman wearing shining clothes, in an indoor environment with soft lights, delicate features, charming smile, elegant movement, decorated interior, warm lighting, moderate distance, normal proportion,平视视角, high quality, high resolution, realistic 。 同时,您还可以添加反向提示词来排除不想要的效果,例如:NSFw, 。 对于新手而言,您可以通过以下功能型辅助网站来帮助书写提示词: http://www.atoolbox.net/ ,它可以通过选项卡的方式快速地填写关键词信息。 https://ai.dawnmark.cn/ ,它的每种参数都有缩略图可以参考,可以方便更加直观地选择提示词。 您还可以去 C 站(https://civitai.com/)里面抄作业,每一张图都有详细的参数,点击下面的复制数据按钮,然后直接粘贴到正向提示词栏里,点击生成按钮下的第一个按键,Stable Diffusion 就可以将所有的参数自动匹配。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会截然不同。您也可以只取其中比较好的一些描述词使用,比如人物描写、背景描述、一些小元素或者是画面质感之类的。
2025-03-02
检测图片造假
以下是关于检测图片造假的相关内容: 胶囊网络(CapsNets)能够有效检测图片造假,减少过拟合,提高检测精度,对不良数据适应力更强,还能适应输入数据的仿射变换,但在大数据集和背景复杂的输入图像等领域运作不太理想,需要进一步研究和改进。 对于判断一张图片是否为 AI 生成,可通过以下方式: 培养自己的鉴赏能力,训练大脑模型。 利用专门的网站,如 ILLUMINARTY(https://app.illuminarty.ai/),但此类网站的鉴定逻辑算法可能存在不足,如将结构严谨的真实摄影作品误判为 AI 作图。 依赖艺术知识储备,了解名画风格、画质与笔触表现力等。 注重细节,如人物肢体是否异常、背景花纹和底纹文字信息等。
2025-03-01
图片识别
图片识别是一个复杂但重要的领域,以下是一些相关知识: 1. 对于印刷体图片的识别,通常会先将图片变为黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比得出结论。但实际情况中,存在多种字体、不同拍摄角度等多种例外情况,通过不断添加规则的方法来解决不可行。神经网络专门处理未知规则的情况,其发展得益于生物学研究的支持,在数学上提供了方向,能够处理如手写体识别等未知情况。推荐阅读《这就是 ChatGPT》一书,作者被称为“在世的最聪明的人”,美团技术学院院长刘江老师的导读序回顾了整个 AI 技术发展的历史,对了解 AI 和大语言模型计算路线的发展有重要作用。 2. 受大脑神经元网络的启发,罗森布拉特提出应用感知机网络执行视觉任务,如人脸和物体识别。以识别手写数字为例,将感知机设计为“8”探测器,需先将图像转换为一组数值输入,确定感知机的权重分配和阈值,使其能产生正确输出。感知机有多个输入,每个输入对应像素强度且有自己的权重,通过类似行为心理学中的训练方式,在样本上进行监督学习来设定正确的权重和阈值。 3. 对于判断一张图片是否为 AI 生成,现在有不少网站通过对大量图片数据的抓取和分析来给出画作属性的判断可能性,例如 ILLUMINARTY 网站。但在测试中存在一些问题,如结构严谨的真实摄影作品可能被误判为 AI 作图,这反映出鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。
2025-03-01
生成品牌宣传图片
以下是使用即梦 AI 生成用于微信小程序的商家奶茶宣传图的详细步骤: 1. 成品图:这是一组用在奶茶小程序门店上的奶茶宣传图。 2. 制作步骤: 第 1 步:找参考图。 第 2 步:用即梦文生图,生成场景底片。 第 3 步:用画布模式融合产品、logo、文字图片(利用了多种控制能力),然后替换杯子,植入品牌 logo。 第 4 步:用画布模式“局部重绘”等功能做细节的图片美化,用 CapCut Web 版进行文字排版。 生图关键提示词:平面插画,国风,留白,新中式,特写镜头,画面正中间房放着一杯纸杯奶茶,周围摆放着白色茉莉,假山石和青色苔藓,干净背景,具有细腻的笔触。您可以通过即梦 AI 官网(https://jimeng.jianying.com/)了解更多相关信息。
2025-03-01
风格一致性
以下是关于风格一致性的相关内容: Midjourney 中的风格一致性: Midjourney v6 版本提供“风格一致性”功能,用户给 Midjourney 输入一幅图像,它会根据这幅图像的风格进行创作,如素描风、油画风等。(可参考) 使用指令:垫图链接(可选择)+关键词+“sref”+图片链接+风格化参数+“v 6.0” sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。适用模型为 V6 和 Niji V6。 sref 与垫图的比较: sref 主要模仿图片风格,垫图主要模仿图片结构、元素。 音乐风格中的风格提示词: Equitable:公平和公正的音乐风格,通常具有平等和均衡的特质,用于表现公平和公正情感的音乐作品,示例为公益歌曲和社会正义主题的音乐,关联流派为 Folk、Protest Music、Rock。 Equivalent:等同和相似的音乐风格,通常具有相似和可互换的特质,用于表现相似和可互换情感的音乐作品,示例为翻唱歌曲和不同版本的音乐,关联流派为 Pop、Rock、Cover。 Erudite:博学和有学问的音乐风格,通常具有复杂和深奥的表现,用于表现学术和知识情感的音乐作品,示例为 Bach 的《赋格的艺术》,关联流派为 Classical、Baroque、Modern Classical。 Escalating:逐步增强和上升的音乐风格,通常具有递增和累积的特质,用于表现逐步增强和累积情感的音乐作品,示例为 Led Zeppelin 的《Stairway to Heaven》,关联流派为 Rock、Progressive Rock、Classical。 Esoteric:深奥和神秘的音乐风格,通常具有复杂和不易理解的特质,用于表现神秘和深奥情感的音乐作品,示例为 King Crimson 的《In the Court of the Crimson King》,关联流派为 Progressive Rock、Experimental、Avantgarde。 此外还有: Congenial:友好和谐的音乐风格,带有温暖和愉快的情感,用于表现友好和轻松氛围的音乐作品,示例为 Jack Johnson 的《Banana Pancakes》,关联流派为 Acoustic、Folk、Pop。 Consequential:重要和有影响力的音乐风格,具有深远的意义和影响力,用于表现重要事件和深刻主题的音乐作品,示例为 Bob Dylan 的《The Times They Are AChangin'》,关联流派为 Folk、Protest Music、Rock。 Considerate:体贴和细腻的音乐风格,带有温柔和关怀的情感,用于表现温柔和关怀的音乐作品,示例为 Norah Jones 的《Don't Know Why》,关联流派为 Jazz、Folk、SingerSongwriter。 Consistent:一致和连贯的音乐风格,具有稳定的结构和风格,用于表现连贯和一致性的音乐作品,示例为 AC/DC 的专辑《Back in Black》,关联流派为 Rock、Pop、Indie。 Consonant:和谐和悦耳的音乐风格,具有愉快和协调的和声,用于表现和谐和愉快的音乐作品,示例为莫扎特的《Eine kleine Nachtmusik》。
2025-02-24
给我5个midjourney确保场景一致性的Sample提示词
以下是 5 个 Midjourney 确保场景一致性的 Sample 提示词: 1. Scifi movie scene. In the silverwhite space environment, from the overtheshoulder lens on the right side of the man with short hair and navy blue jumpsuit, a transparent virtual screen appeared on the wall in front of him. Behind there is the silhouette of another female employee with long blue hair, operating another screen. Rendered in a C4D style inspired by Unreal Engine, with high resolution and rich detail. sref url cref url ar 16:9 style raw sw 30 cw 100 2. In a magical forest, a fairy with colorful wings is sitting on a huge mushroom. The sunlight filters through the leaves, creating dappled patterns on the ground. cref https://my.image.host/fairy.jpg s 800 3. On a sandy beach at sunset, a couple is walking hand in hand, leaving footprints in the sand. The ocean waves crash gently in the background. cref https://my.image.host/couple.jpg ar 9:16 4. In a medieval castle courtyard, a knight in shining armor is training with a sword. The flags are fluttering in the wind. cref https://my.image.host/knight.jpg s 700 5. At a busy city street corner, a street musician is playing a guitar, surrounded by a crowd of people. The buildings are towering in the background. cref https://my.image.host/musician.jpg ar 4:3
2025-02-14
文生图人物一致性
以下是关于文生图人物一致性的相关内容: 在使用 ControlNet 进行文生图时,首先进入文生图界面填写提示词生成一张图。然后将图片拖入 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高对图片的参考越强。在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装会有随机不同程度的变化。可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,例如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。通过一系列测试,这个功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况实时调整,后期配合 lora 潜力巨大。 另外,在 PIKA1.0 新模型中,人的一致性已经逆天,再加上其强大的语义理解和大幅度的动作,在文生图方面表现出色。
2025-02-11
多人物场景,人物一致性如何保证
在多人物场景中保证人物一致性可以参考以下方法: 1. 在使用 Midjourney 出图时,多角色情况下,放弃参考角色(cref 提示),只用参考风格(sref 提示)。这样的好处是不会出现奇怪的组合,坏处是出图较随机。 2. 多用局部重绘,虽然具有随机性,但多试几次能得到一致性较好的图。 3. 出图时先只出一个主要角色和场景。当出现多角色场景时,把其他角色抠图粘贴过来。比如老虎向兔子认错的场景,若兔子和老虎不一致,可先出稳定的老虎,再粘贴兔子以保证一致性。 4. 按照“三个确定”的 SOP 处理: 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 确定图片角色一致性:在保证构图风格没问题的基础上,保证人物一致性。先保证构图再确认角色一致性,因为 MJ 在重绘时,将角色在镜头中的位置挪动处理较难,固定位置重绘局部内容相对容易,若先保证人物内容,会很依赖 MJ 抽卡,随机性大。
2025-02-10