直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

ipadapter的作用是什么,能实现人物的一致性吗?比如参考人物的脸部特征

回答

IP Adapter 即图像提示词适配器,其作用包括:

  • 能够“复刻图像”,用户输入图像可直接生成内容或风格相似的图像。
  • 注重图像风格和语义的复刻,兼容性强,可与结构控制插件一起使用,既控制结构,也控制图像的语义和风格。
  • 是解决角色和风格一致性的优雅方法,能够非常精准地提取风格参考图中的角色和风格特征。

在处理人物一致性方面,IP Adapter 有一定的应用,例如在相关的图生图操作中会用到。关于其使用,之前有文章介绍。同时,Midjourney 也有类似的人物一致性相关功能。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

EP.3 - IP Adapter 对话阿文:一图定风格,我和 AI 的契约

Jojo:接下来的话题是,咱们怎么向听众解释什么是IP Adapter?两位如果用一句话来描述这个工作,它是什么,有什么用?对SD意味着什么?叶虎:如果用一句话说,IPA就是“复刻图像”。我稍微展开一下,IP Adapter的全名是“图像提示词适配器”。图像提示词和文本提示词是类似的概念。对于文本提示词,用户输入文本生成图像;而对于图像提示词,用户输入图像,就可以直接生成内容或风格相似的图像。以前的插件,比如ControlNet,主要关注结构的可控性,但IP Adapter更注重图像风格和语义的复刻,IPA的兼容性很强,可以和结构控制插件一起使用,既控制结构,也控制图像的语义和风格。阿文:对我来说,IP Adapter是解决角色和风格一致性的优雅方法。一句话来说,它能够非常精准地提取风格参考图中的角色和风格特征,这在过去可能需要训练专门的模型来完成,但现在一张图就能解决许多问题。我觉得这个方法非常优雅,也非常方便。

第三期 黏土自由

需要用到的插件如果提示缺失节点,就通过管理器安装一下.1.提示词反推WD14-Taggerhttps://github.com/pythongosss/ComfyUl-WD14-Tagger首次使用会自动下载模型(需要网络环境)1.处理人物一致性IPAdapter:https://github.com/cubiq/ComfyUI_IPAdapter_plus也可以用instantID,这里我们使用的是IPadpter,后续很多地方也会用到,建议大家也可以先用起来关于IPAdapter的使用,之前有写了一篇文章介绍,不熟悉的小伙伴可以先看下.[ComfyUI IPAdapter](https://waytoagi.feishu.cn/wiki/XrKwwYZcxixalykFpyfcMU2rnph)因为作者新版本重写了代码,所以新版一定注意模型的放置位置,这样后续使用统一加载,会方便不少.

Midjourney 人物一致性已上线

翻译版本DavidH:嘿@大家@这里我们今天正在测试一个新的“角色参考”功能这类似于“样式d引用”功能,只是它不是匹配引用样式,而是尝试使字符匹配“字符引用”图像。它是如何工作的在提示后键入--crefURL,并URL字符图像您可以使用--cw将引用“强度”从100修改为0强度100(--cw 100)是默认值,使用脸部、头发和衣服在强度0(--cw 0)时,它只关注面部(适合换衣服/头发等)它的意义是什么此功能在使用由Midjourney图像制作的角色时效果最佳。它不是为真实人物/照片设计的(并且可能会像常规图像提示一样扭曲它们)Cref与常规图像提示类似,只是它“专注”于角色特征这种技术的精确度有限,无法复制精确的酒窝/雀斑/或T恤标志。Cref适用于Niji和普通MJ模型,也可以与--sref组合高级功能您可以使用多个URL来混合从多个图像/characters的信息,如下所示--cref URL1 URL2(这类似于多个图像或样式提示)它在网络alpha上是如何工作的?

其他人在问
Error occurred when executing IPAdapterAdvanced: insightface model is required for FaceID models File "D:\AI\comfyui_20240421\execution.py", line 151, in recursive_execute output_data, output_ui = get_output_data(obj, input_data_all) File "D:\AI\co
以下是针对您所遇到的报错问题的一些解决建议: 1. 对于 ipadater 部分报错说 model 不存在的情况,将文中画圈部分修改调整到不报错。Pulid 部分,除了下载好对应的节点以及参考官方网站最下面的安装对应要求外,还要注意上图中的第二要点,对应安装一些内容,具体要求可查看云盘中命名为“pulid 插件模型位置.png”的文件及对应的云盘链接:PulID 全套模型,链接:https://pan.baidu.com/s/1ami4FA4w9mjuAsPK49kMAw?pwd=y6hb,提取码:y6hb。否则将会遇到报错:Error occurred when executing PulidEvaClipLoader。 2. 对于 Ollama 大模型部分,为了应对没下载大模型带来的报错,需要下载大模型。首先,下载 ollama,网站: 。 3. 如果缺少 ipadapter 的模型,可去这个网址下载:https://github.com/cubiq/ComfyUI_IPAdapter_plus 。如果遇到“Error occurred when executing IPAdapterUnifiedLoader:ClipVision model not found.......”类似的报错,可在这个网址里找到多个关于 IPAdapter 报错的解决办法:https://github.com/cubiq/ComfyUI_IPAdapter_plus/issues/313 。 另外,换脸工作流的核心组件是 Apply InstantID Advanced 节点,这个节点的作用就是将源人脸替换到目标图像中。其中,instantID 模型擅长提取图片的高层次特征,包括面部的纹理信息、几何结构、风格特征等,在图中例子是 IPAdpater,用于识别和保留目标图像 image_kps 的风格并迁移到生成图像中。instantID Face Analysis 节点用于提取人脸五官的特征向量,作用是使生成图像时,人脸的眼睛、鼻子、嘴巴等样子仍然符合源人脸 image 的特征。controlnet 模型的作用是识别目标图像 image_kps 的低层次特征,包括骨架、姿势、边缘、结构。controlnet 模型和 instantID 模型起到不同的控制作用,结合使用可以达到将源人脸的五官替换目标图像中五官的效果。
2024-09-03
人工智能发展的流程图上面有相关人物与重要时间节点或重大事件
以下是人工智能发展的流程图相关内容,包含重要人物与重要时间节点或重大事件: 二十世纪中叶,人工智能领域开启。最初符号推理流行,带来专家系统等重要进展,但因提取知识成本高等问题,20 世纪 70 年代出现“人工智能寒冬”。 近现代,计算机科学发展为人工智能研究奠定基础,人们尝试用机器模拟人类思维。 1950 年,英国数学家阿兰·图灵提出著名的“图灵测试”。 1956 年,人工智能一词被提出,达特茅斯会议举行。 1997 年,深蓝在国际象棋比赛中击败卡斯帕罗夫。 2016 年,AlphaGo 在围棋比赛中战胜李世石。 2020 年,GPT3 发布。 2022 年,DALLE 发布。 2023 年,GPT4 发布。 2024 年,预计发布 GPT5 。 随着时间推移,计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中“人工智能”常被用作“神经网络”的同义词。
2024-09-16
怎么才能让FLUX生成的人物更像真人的照片
以下是一些可能有助于让 FLUX 生成的人物更像真人照片的建议: 1. 尝试使用特定的提示词,例如“abstract network out of glass made of holographic liquid crystal, dark background, blue light reflections, symmetrical composition, centered in the frame, highly detailed, hyperrealistic, cinematic lighting, in the style of Octane Rende ar 16:9 style raw personalize v 6.1”。 2. 可以训练 FLUX Lora 模型,如褪色胶片风格,推荐权重 0.6 0.8,人像会偏向复古褪色的胶片风格。 3. 对于生成人物,还可以参考 XLabsAI 发布的不同 Lora,如 mjv6_lora(Midjourney 风格)、realism_lora(写实风格)等,并使用相应的示例进行参考和调整。 4. 您还可以从以下地址下载相关的 Lora:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs
2024-09-13
在COMFYUI中使用FLUX大模型时,怎么才能让多次生成的人物一致
在 ComfyUI 中使用 FLUX 大模型让多次生成的人物一致的方法如下: 控制人物在多场景、多个姿势下的一致性有很多方法,课程后期会介绍。 对于多张图输出的显示问题,一次产出多张图在预览窗口目前不能并排显示。 Lora 的刷新:将 Lora 丢到文件夹后,多点几次刷新即可,Web UI 中 Lora 库有刷新按钮。 另外,在 Midjourney 中,人物一致性已上线,其操作如下: DavidH 介绍:Hey @everyone @here we're testing a new "Character Reference" feature today This is similar to the "Style Reference" feature, except instead of matching a reference style it tries to make the character match a "Character Reference" image. 具体操作:Type cref URL after your prompt with a URL to an image of a character. You can use cw to modify reference 'strength' from 100 to 0. strength 100 . 适用范围:This feature works best when using characters made from Midjourney images. It's not designed for real people / photos . 网页端操作:How does it work on the web alpha? Drag or paste an image into the imagine bar, it now has three icons. Selecting these sets whether it is an image prompt, a style reference, or a character reference. Shift + select an option to use an image for multiple categories. 在 ComfyUI 中处理模型连接和提示词相关问题,如让两个模型同时起作用的操作: 加入一个新节点,右键点击 【新建节点】 【实用工具】 【Primitive 元节点】。 在文本节点上单击右键,选择【转换文本为输入】,此时文本节点上就多了一个文本的连接点。 将元节点与文本节点相连接,元节点就变成了正向提示词的输入框。同理,可以将负向提示词框也用元节点代替。 再复制出一套正负提示词节点,一套给 base 模型,一套给 refiner 模型。然后,base 模型的那一套输出给第一个采样器节点,refiner 模型的那一套输出给第二个采样器节点。
2024-09-13
MJ人物姿势
以下是关于 MJ 人物姿势的相关信息: MewXAI 中的 MJ 绘画创意度和想象力极高,在摄影照片、海报、logo 设计、3D 模型、表情包制作等方面表现出色,并且通过姿态识别能够实现对人物动作的精准控制,不仅可以生成单人的姿势,还可以生成多人的姿势,实现对 AI 画图的完美控制。 Midjourney V6 更新了角色一致性命令“cref”。在 MJ 网页社区里随机选一张图片,点击箭头下方的图片 icon 按钮(图 1),在上方输入栏里选择三个按钮(图 2 红框里第一个就是角色参考,点击一下图标),加上描述词,调整设置(图 3),回车即可实现人物面部不变,场景变化(图 4)。同时,按住 Shift 键选择一个选项可将图像用于多个类别。需要注意的是,虽然 MJ V6 还处于 alpha 测试阶段,此功能及其他功能可能会突然更改,但 V6 官方 beta 版本即将推出。
2024-09-10
用哪个ai工具可以做双图,人物没变化
以下是一些可以用于生成双图且人物没变化的 AI 工具及相关信息: 1. Controlnet:正式绘画目前有两种出图方式,包括图生图和 controlnet。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后等待图片生成。 2. Midjourney:在网页版中,传一张图片,右下角有小 icon,鼠标 hover 上去会出现 3 个 icon,最左边小人的 icon 可把图片当做角色参考。官方对于角色一致性也给了一些简单的小 Tips。用在 2D 和 3D 角色上效果较好。 您可以根据自己的需求选择适合的工具。
2024-09-10
AI绘画人物头像图生图
以下是关于 AI 绘画人物头像图生图的相关内容: 在使用图生图功能时,每次生成都会重新调整整个画面,局部重绘则可以只改变涂抹的部分。例如,将人物头部涂抹掉,修改提示词为“一个粉色头发的女孩的脸”进行生成,可换掉头部。还可以使用局部重绘修改帽子部分,增加提示词“猫耳”再次生成。此外,将图片再次放入以图生图中,通过 DeepBooru 反推关键词,并使用新的大模型和 LORA 进行重新生成,能改成特定的人物风格。但目前的图可能存在细节瑕疵,需要不断调整参数,后期借助 PS 修补。同时,在独立游戏开发中运用 AI 绘画也有一些经验。比如在《玩具帝国》中,最初使用 AI 画画存在风格不合适、缺乏叙事性、图生图不可行、训练泛化性差等问题。经过尝试不同的方法,如 Embedding、CKPT、Lora 等,最终达到了较好的效果,甚至能从特定的训练集中生成原本没有的内容。另外,还有一些关于汉服系的 AI 绘画提示词示例,如“Pixar Style,Tiny cute and adorable Cute little mouse wearing hanfu,Delicate face,fluffy hair,anthropomorphic,cinematic lighting,baptiste monge,Chinese culture,super clear details,super clear material,closeup,complex texture,octane rendering,zbrush,8k,portrait testp ar 9:16 upbeta upbeta upbeta upbeta upbeta upbeta”等。
2024-09-09
lora训练的数据集没有闭眼,如何保证人物一致性前提让角色闭眼
在训练 Lora 模型以保证人物一致性的前提下让角色闭眼,以下是一些可能的方法和参考信息: 得益于对 AI 大模型微调 finetuning 技术的研究,摸索出的训练特定画风 Lora 和特定角色 Lora 的方法,对角色一致性的锁定有决定性帮助。比如完善哪吒短褂、小短裤、额前火焰印记、流苏耳饰等细微之处的统一,最终针对不同主要角色分别训练角色 Lora,保障多人同框镜头的一致性。 实现角色一致性最好的方法是使用 Lora。训练 Lora 时,至少要有 15 到 20 张图片的训练集。对于固定形象,面部五官最重要,其次是体型、服装、配饰等。收集训练集时,收集形象的头部图片很重要。对于现实人物可通过照片训练,虚构角色则要能稳定输出多张不同角度的图片以达到训练集要求。 在预处理生成 tags 打标文件后,对文件中的标签进行优化。保留全部标签适用于训练画风或省事快速训练人物模型,优点是省时省力、过拟合出现情况低,缺点是风格变化大、训练时间长。删除部分特征标签适用于训练特定角色,将特征与 Lora 做绑定,优点是调用方便、更精准还原特征,缺点是容易过拟合、泛化性降低。需要删掉如人物特征 long hair、blue eyes 这类标签,不需要删掉如人物动作 stand、run,人物表情 smile、open mouth,背景 simple background、white background,画幅位置 full body、upper body、close up 这类标签。过拟合会导致画面细节丢失、模糊、发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。
2024-08-12
生成橘猫图片怎么保持一致性
要生成橘猫图片并保持一致性,可以参考以下方法: 1. 采用 InstantStyle 技术,通过内容与风格分离以及只往特定的风格块注入特征这两个关键方法,来实现生成图片风格的一致性。 2. 在 runway 分镜选图中,对于橘猫的描绘要注意保持角色一致性,比如胖瘦统一、衣服统一、造型统一等。 3. 利用 DALL·E 和 Custom Instrctions 的组合,将解决 DallE 生成图一致性问题的 prompt 进行优化并添加到 Custom Instrctions 中。添加之后,正常打开 DallE 会话,生成的图片会有唯一 ID。有了唯一 ID,可以进行微调图形细节和多图融合时,可以指定两张不同图片的 ID 让它们进行融合,例如“please blend image 00X and 00Y”。 希望以上信息对您有所帮助,让您能够更有效地生成具有一致性的橘猫图片。
2024-07-15
关于seed值 和风格一致性cref sref的文章
关于 seed 值和风格一致性 cref sref 的文章 在 Midjourney 中,cref 和 sref 都是用于引用图片的功能,但它们的作用和使用方式有所不同。 1. 角色参考(cref): cref 的功能是保持图像角色的一致性。根据你提供的现有角色图像的 URL,生成与之相似的角色。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。例如:/imagine prompt beautiful girl cref\。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref): sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girl sref\。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果你想引用一张图,但只是把它作为新图的一部分,你可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 例如,如果你想引用一张图的风格,但只希望它占新图的一部分,你可以这样写提示:/imagine prompt beautiful girl sref\sw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格¹。 希望这些信息对您有所帮助!
2024-05-08