Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

mj如何保持人物一致性

Answer

在 MJ 中保持人物一致性可以按照以下步骤进行:

  1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。
  2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。
    • iw 取值范围为[0.5,2],不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。
  3. 确定图片角色一致性:
    • 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 --cref --cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。
    • 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。

需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。

在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 --iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(--iw 2),mj 重新生图。

Content generated by AI large model, please carefully verify (powered by aily)

References

Jerry:MJ多张图保证构图、人物一致性实战教学

[title]Jerry:MJ多张图保证构图、人物一致性实战教学[heading1]三、不同画面构图、人物一致性保证由于MJ不可控因素,如果需要前后两张图画风、构图等都保持一致,这里总结了一个SOP,可以按照三个确定来处理。1.确定画面元素优先出一张图,保证风格、构图样式及人物角色2.确定前后图的构图风格出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw参数)3.确定图片角色一致性在第二步得到构图风格没有问题的基础上,在保证人物一致性即可。WHY先保证构图再确认角色一致性?因为MJ在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个MJ出图基本也是靠降噪重绘,那相较于把整个画面结构都变了,固定位置重绘局部内容会容易很多,如果整个画面结构变了先保证人物内容的话,会很依赖MJ抽卡(因为你不知道何时才能出到与你之前相同的构图样式)。这就好比美术课画画一样,给你一张参考图,一个是把背景风格都做好了,让你在固定位置添加内容,另外一个是让你将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。

MJ应用篇 儿童绘本制作、人物一致性解

确定人物形象:a little girl wearing a yellow floral skirt+人物动作+风格词,在mj中生成直到得到一张满意的人物图像垫图URL+In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,--s 400 --ar 3:4 --niji 5 --style expressive --iw 2--iw取值范围[0.5,2],不填写默认iw = 1,iw值越大越接近垫的图像,反之更接近提示词。为了确保人物一致性,取-- iw 2[heading1]合成人物和场景,垫图并重新生成[content]使用PS或者Canva将人物和场景合成到一张图,但是在色调上不太和谐:(如果这里画面和谐/ps技术足够,也可以不用图生图)将合成后的图作为垫图(--iw 2),mj重新生图如下。prompt:垫图url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,--s 400 --ar 3:4 --niji 5 --style expressive --iw 2[heading1]绘本展示

Jerry:MJ多张图保证构图、人物一致性实战教学

在得到构图相同后,基本就离成功不远啦。可以看到MJ没有办法记住上一张图的角色样子,所以面孔差别非常大,所以我们需要在生成的图里,对画面里的角色重绘,保证图片一致性。[heading3]3.3.1角色一致性[content]利用MJ重绘功能(上文讲过),对画面进行局部重绘,在重绘提示词里输入--cref --cw来保证角色一致性。cref所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物重绘关键词如下,需要注意的是cref的垫图可以将链接放在文末,和iw不同,它需同时配合cw参数来确定人物一致性:[heading3]3.3.2黑边处理[content]到这里基本上就大功告成了,但是发现每张图上会有黑边,那这个怎么处理呢?答案还是重绘。将黑边部分框住,重绘输入关键词:background就能去除黑边,保证背景一致了欢迎来尝试下~

Others are asking
mj如何指定生成16:9的图
要在 Midjourney(MJ)中指定生成 16:9 的图,可以按照以下步骤操作: 1. 首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt”。 2. 回到官网,复制图像的提示词,再回到 discord 粘贴到刚才拷贝的网址后面,注意空一格。 3. 生成图像后,放大觉得还不错的一张,点击“Custom Zoom”。 4. 此时可以改变拉伸镜头后的画面比例,将“ar”这个参数后面的数值改成 16:9(默认的方形构图这里是 1:1),“zoom”参数设置为 1.5。“zoom”参数是镜头拉伸的倍数,1.5 1.7 比较靠谱,太大(比如 2)会有更大几率生成一些莫名其妙的东西。 5. 选一张比较好的放大一下,就可以放进 PPT 调整构图。如果构图还是不太好,可以在当前这张图的基础上再用一次“Zoom Out 1.5x”。 另外,在 Pika 中使用 MJ 生成图片时,默认的照片幅度是 16:9。在使用 MJ 进行图生图功能时,要注意截图的对标比例未必是标准的 9:16,可以手动修改一下比例,以省去一些返工的情况。
2024-12-17
请问我该在知识库的 哪里找到MJ的提示词库
以下是关于 MJ 提示词库的相关信息: MidJourney 200 条风格词汇: 《》 @TheMouseCrypto 发表了一份 200 条风格词汇整理,页数是 77 页,很全的宝典。 Prompt 网站精选(图像类 Prompt 网站): MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择, MJ 的随机种子库收集: 使用方法: 输入提示词 + sref random ar 1:1,可获得随机风格种子和图片。 测试风格种子的泛用性:{a girl,a boy,animals,plants,environment}sref 同一个风格种子
2024-12-08
照片使用mj做风格转化
以下是利用 Midjourney 进行照片风格转化的详细教程: 一、角色一致性 1. 得益于 cref,Midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。 2. 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,因为 cref 会帮完成这件事情。 3. 风格复制和服装的替换,应当用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 二、解决“形似而神不似”问题 1. 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好。如果用醒图,建议关注【人像>面部重塑>面部>比例】,调整上庭、中庭、下庭。 2. 对于照片转绘为 Minecraft 这种风格幅度变化很大的情况,如果发现 sw 风格权重拉满仍复制不了像素小人风格,可能是 cw 太高,调低 cw 可能成功复制。 三、其他补充 1. cref 和 sref 还可以同时参考多张 url,但上传同一个人不同角度的照片,容易导致形状畸形。 2. 如果 MJ 直出的皮肤缺乏质感(过于光滑),可以打开醒图【人像>手动美颜>皮肤肌理】。 3. 如果想快速调整光源但又不想学 PS,可以试试 Luminar。 四、sref 相关 1. Midjourney v6 版本提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作。 2. 使用指令:垫图链接+关键词+ “sref” +图片链接+风格化参数+ “v 6.0”。指令:url +关键词+ “sref” + url + “sw” + “v 6.0”。sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。 3. sref 模仿图片风格,垫图模仿图片结构、元素。 生成 url 时,准备一张照片(可以使用 AI 生成一张人物图像代替真人)和想要的写真风格参考图片。Prompt:垫图 url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism niji 6 ar 3:4 sw 200 sref url
2024-12-05
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14
我想使用MJ设计班牌 应该注意什么问题
使用 MJ 设计班牌时,需要注意以下问题: 1. 选择最新的 6.0 model。 2. 利用图生图功能时,命令为 /describe,选择 image 上传本地图片可获取四条提示词,点击下方标签可生成对应提示词的四张图。但要注意截图的对标比例未必是标准的 9:16,可手动修改比例以省去返工。 3. 自行对比反推的词和对标的相似程度并微调,describe 根据对标图反推的效果可能不太好,可根据推出的词自行修改,也可直接用给定的提示词,如“Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,highend design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera ar 9:16 style raw”。 4. 对于某些难以画出的形象,如拟人形态的龙,可能是描述不够准确,需要加强描述词,如将“一条亚洲龙站在时尚秀场上”这样连成一句话,以便 MJ 正确理解。 5. 确定主体形象时,包括画风、是否 Q 版、配色风格、构图比例、细节量设定等,可以找参考案例。 6. 通用的肖像生产咒语如“Cartoon style character,original character,character design. Mysterious painter and artist,an intellectually mature girl(人物基本形象(必要内容比如性别和身份) Gold and dark red.(配色部分(一个系列里尽量不要改改了容易画风对不上) 2d,solid and clean background,white background. The figure is in the middle of the frame,sideways.(侧身) Art Nouveau,in the style of Alphonse Mucha. no decorative background elements,no flower.Clean background. niji 5 ar 9:14 s 400 style expressive / style cute(二者任选尝试)”,注意咒语中的内容可随意换,多尝试。 7. 利用一致性时,得益于cref,默认值 100,越高越接近参考图像的风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些有用的 prompt。解决“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有细微差距的问题。
2024-10-09
可灵ai如何保持人物一致性
要保持可灵 AI 中人物的一致性,可以参考以下方法: 1. 人物设定: 明确主角、配角等人物的性格特点、外貌特征等,如主角是一位 40 岁的中年男探险家,性格特点是面对挑战从不轻言放弃,外貌特征是健壮、棕色头发、常穿探险服。 2. MJcref 控制人物一致性: 先根据人物设定,在 MJ 里筛选适合的人物形象,选中后右键复制图片链接。 在尾缀加入【cref 图片链接】控制人物一致性,【cw 数值】控制权重。 对于镜头较多的角色,建议炼个人物模型出来控制,不然 MJ 容易不稳定。 3. 控制多人物场景统一: 先控制一个角色再进行重绘。 选一张合适的图片后,点击 Vary进行局部重绘,并把尾缀机器人的 cref 链接改成主角的 cref 链接。 4. 通过 prompt 格式实现“角色一致性”: 公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。 发型/衣物:构造尽可能多的角色非面部视觉元素,产生观众对角色的“一致性观感”。 年龄:约束角色年龄特征。 环境:约束能够产生相同观感的环境空间,尤其是光环境,增加观众对于形象认识的“一致性”认知。例如: 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。
2024-12-21
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
sd角色一致性
在 Stable Diffusion(SD)中实现角色一致性多角度头像绘制的方法如下: 1. 准备工作: 准备一张人物的多角度图片,共有 15 个不同视图,尺寸设置为 1328×800px,放大两倍后保证每张小图为 512×512px。 加上网格图,通过 lineart 分割不同块面。 设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区。 增加 ADetailer 的脸部修复插件防止小图模式下人脸崩坏。 2. 开始生图: 大模型:majicmixRealistic_v6.safetensors 正向提示词:,auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography 负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w 参数设置:迭代步数 50,采样方法 DPM++ 2M Karras,尺寸 1328×800px。 3. 细节放大: 发送到图生图,重绘幅度设置为 0.55,使用 controlnet 的 teil 模型增加细节,控制模式选择“更倾向 controlnet”。 使用 Ultimate SD upscale 脚本放大为 2 倍,采用 4xUltraSharp 放大算法。 4. 尝试不同风格: 例如使用 AnythingV5 大模型绘制浅绿色侧马尾女孩形象,使用 revAnimated 大模型绘制粉色头发的长发公主形象。 需要注意的是,由于 AI 绘画的随机性存在,15 个角度的画面不可能完美,controlnet 的控制能让我们更大程度接近想要的效果,想要好的结果需要多刷图。如需 stable diffusion 相关资料,可关注公众号【白马与少年】发送【sd】获取链接。
2024-11-25
请问现在好用的AI图片生产工具有哪些,对人物一致性要求高
以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高: 1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。 另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。
2024-11-23
图片的前后一致性,如何实现
要实现图片的前后一致性,可以参考以下步骤: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,描述其内容并在提示词中加入第一张图的构图风格(使用 iw 参数)。需注意,输入 ar、iw 等参数时,要与前面的提示词用空格隔开,否则会报错。例如:“a dog 空格 ar 16:9 空格 iw 1”。将生成的多张图中选择一张图作为垫图,通过右键图片获取其地址。按照格式将提示词、垫图关键词写入。通过微调提示词,得出满意图。 3. 确定图片角色一致性:在得到构图相同后,利用 MJ 重绘功能对画面里的角色重绘。在重绘提示词里输入 cref cw 来保证角色一致性,cref 所垫图还是用之前的图,因为它包含构图和人物两个内容。如果出现黑边,可将黑边部分框住,重绘输入关键词“background”去除黑边,保证背景一致。 由于 MJ 存在不可控因素,如果要保证前后两张图画风、构图等都保持一致,可以按照上述三个确定来处理。需要注意的是,MJ 在重绘时,相较于改变整个画面结构,固定位置重绘局部内容会容易很多。先保证构图再确认角色一致性,就好比美术课画画,把背景风格做好了在固定位置添加内容,比将整个页面内容全部重绘且保证画面主题内容与参考图一样要容易,后者随机性更大。
2024-10-10
stable diffusion 绘本一致性
Stable Diffusion 绘本一致性相关知识如下: 工作原理: Stable Diffusion 生成随机噪声,并逐步更改噪声以努力获得与提示一致的图像。其基本结构包括 encoder + diffusion + decoder 的流程。Checkpoint 记录某个训练周期整个 diffusion 及可能的 encoder decoder 的参数,VAE 是 encoder decoder 的参数,在 SDXL 等大型模型中需配对以避免花屏现象。LoRA 模型训练时先冻结 SD 模型权重,然后在 UNet 结构中注入 LoRA 模块并与 CrossAttention 模块结合,只对部分参数微调。 相关论文: AnyDoor: MixofShow: LyCORIS: 影响生成结果的因素: 影响生成的图与他人不同的因素包括随机数种子(Seed)。随机数种子控制最底层形状,决定照片基础轮廓,如人物外形轮廓、姿势和站位等。当随机数为“1”时,SD 会随机生成种子。可在点击生成的照片下面的一大串英文中查看 seed 值。只有所有参数包括随机数种子都与他人相同时,才能生成相似的照片。
2024-09-30
Changer软件能实现视频中人物的无缝换头吗
Changer 软件可以实现视频中人物的无缝换头。以下是一些相关的操作指引和注意事项: 上传原始视频和换脸图片,点击生成,即可自动识别视频中的人脸并进行替换。 在 TecCreative 创意工具箱中,操作指引为:上传原始视频——上传换脸图片——点击生成。 实战中,通过 JupyterLab 工具中的终端输入相关命令启动 facefusion 程序,在 facefusion 软件界面上传准备好的图片、视频,可看到预览效果,点击开始按钮执行换脸处理,完成后可下载处理后的视频。 此外,还有其他与图片和视频处理相关的方法和技巧,例如利用 MJ 画图、InsightFaceSwap 插件等进行处理。
2024-12-17
国内大模型领域关键人物、关键院校
以下是国内大模型领域的关键人物、关键院校及相关信息: 8 月正式上线的国内大模型: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 目前不能进行自然语言交流的:昇思、书生 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 特色功能:昇思——生图,MiniMax——语音合成 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 中文大模型评测收集与调研: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:地址:https://github.com/OpenLMLab/GAOKAOBench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现 中国大模型面临的真实问题: OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
2024-12-16
gpt是否可以识别图片中的人脸、人物
GPT 可以在一定程度上对图片中的人物进行识别和描述。例如,可以利用 GPT 的识图功能对人物照片的内容进行细致描述,包括人物的年龄、发型、肤色、五官、穿着、表情等方面,还能对人物所处的背景进行分析。但需要注意的是,其识别和描述的准确性可能会受到多种因素的影响,如图片的质量、清晰度、复杂程度等。同时,对于 GPT 是否能准确识别所有人脸和人物,还存在一定的不确定性和局限性。
2024-11-24
编写一个python代码其中附件是一个名为data.csv的CSV格式文件,提取表格中数据,行列保持一致进行如下格式转换:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬ (1)按行进行倒序排列;‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫
以下是一个使用 Python 实现读取 CSV 文件并按行倒序排列的代码示例: ```python import pandas as pd 读取 CSV 文件 data = pd.read_csv 按行倒序排列 reversed_data = data.iloc 打印结果 print ``` 在上述代码中,首先使用 `pandas` 库的 `read_csv` 函数读取 `data.csv` 文件,然后使用 `iloc` 索引和切片操作 `` 实现按行倒序排列。
2024-12-12
设定好程序,在没有人工干预的情况下,AI能保持多久的工作效率。
AI 在没有人工干预的情况下能保持的工作效率时长难以给出确切的固定值,其受到多种因素的影响。 一方面,AI 系统的设计和训练质量会对其持续工作效率产生重要影响。如果系统经过良好的设计和充分的训练,具备应对各种情况的能力,可能在较长时间内保持较高的工作效率。 另一方面,运行环境和所处理任务的复杂性也起着关键作用。例如,处理简单、重复性高且规则明确的任务时,AI 可能在较长时间内保持稳定的效率。但对于复杂多变、需要不断适应新情况的任务,其效率可能会随着时间有所波动。 在实际应用中,一些案例显示,如产品经理使用 GPT 解决性能问题,SQL 执行时间大幅缩短,效率显著提升。但也有观点认为,对于某些工作场景,AI 带来的效率提升有限。 此外,政策层面,如拜登签署的 AI 行政命令中,也强调了在医疗、教育等领域推进 AI 的合理使用,并关注其对劳动力市场的影响,采取措施支持工人等。 总之,AI 无人工干预下的工作效率保持时间因多种因素而异,需要综合考虑系统本身、任务特点等多方面因素。
2024-11-13
相同的参数下,用SD comfyui出图可以和SD webui出图保持图片效果一模一样么?
理论上,在应用完全相同参数(如 Step、CFG、Seed、prompts)的情况下,SD ComfyUI 出图和 SD WebUI 出图应当能保持图片效果一模一样。但在实际操作中可能会存在一些差异,比如: 提示词的多个条件下,SD 生成的图像可能无法全部满足,这与提示词引导系数有关,该系数关系到出图与文字的相关程度。 不同的模型和配置也可能影响出图效果,例如 SDXL 的大模型分为 base、refiner 以及配套的 VAE 模型,用于调节图片的画面效果和色彩。 需要注意的是,相同参数下要达到完全一致的出图效果并非绝对,还会受到多种因素的综合影响。
2024-10-14
怎么让mj生成的图片色调保持一致
要让 MJ 生成的图片色调保持一致,可以参考以下方法: 1. 在关键词中限制颜色时,同一种情绪最好多生成几张不同色系的图片,这样可以减少后续训练中模型把情绪和颜色做挂钩。但如果您需要将情绪和颜色关联,也可以反其道而行之。 2. 注意数据集中正面情绪与负面情绪的比例应差不多。如果都是正面积极的,在生成一些负面情绪(如 sad、cry)的图片时,可能会出现奇怪的问题(如训练的是兔子形象,但 AI 认知的 sad 可能是人的形象,可能会出现人物特征)。 3. 为保证人物一致性,在生成人物图片时,可确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 MJ 中生成直到得到满意的人物图像,并取 iw 2。 4. 为保证画面的一致性,可以使用 MJ 的 cref 参数。
2024-10-06