直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

midjourney中如何结合A图片的人物和B图片的动作和内容

回答

在 Midjourney 中结合 A 图片的人物和 B 图片的动作和内容,可以使用新上线的“Character Reference”(--cref)功能。以下是一些关键方法和示例:

  1. 锚定细节:您可以掌控姿势、表情、情感、服装、道具、场景、动作等细节。例如:“Jo is a young woman with blue curly hair, pink sunglasses, and a colorful scarf around her neck. She waits in line at the bank. --cref https://my.image.host/jo-is-standing.jpg”。
  2. 让 --cref 处理大部分工作:提示无需加强标志性细节,只是“操纵”或“定位”角色。例如:“有人正在银行排队等候。 --cref https://my.image.host/jo-is-standing.jpg”。
  3. 只提供场景:如果您的 cref 图像已包含想要的姿势和其他细节,您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。但可能会出现不连贯的结果,此时可尝试使用更高值的样式化,如“--s 800”。

需要注意的是,此功能在使用 Midjourney 生成的图像人物时效果最佳,不太适用于真实人物或照片。同时,在 Midjourney V6 的 Web Alpha 版本中,您可以通过拖放或粘贴图像到想象栏,并选择相应图标来设置图像为图像提示、风格参考或角色参考。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Midjourney 人物一致性已上线

DavidH:Hey @everyone @here we're testing a new"Character Reference"feature today This is similar to the"Style Reference"feature,except instead of matching a reference style it tries to make the character match a"Character Reference"image.How it worksType --cref URL after your prompt with a URL to an image of a characterYou can use --cw to modify reference 'strength' from 100 to 0strength 100(--cw 100)is default and uses the face,hair,and clothesAt strength 0(--cw 0)it'll just focus on face(good for changing outfits / hair etc)What it's meant forThis feature works best when using characters made from Midjourney images.It's not designed for real people / photos(and will likely distort them as regular image prompts do)Cref works similarly to regular image prompts except it 'focuses' on the character traitsThe precision of this technique is limited,it won't copy exact dimples / freckles / or tshirt logos.Cref works for both Niji and normal MJ models and also can be combined with --srefAdvanced FeaturesYou can use more than one URL to blend the information /characters from multiple images like this --cref URL1 URL2(this is similar to multiple image or style prompts)How does it work on the web alpha?Drag or paste an image into the imagine bar,it now has three icons.selecting these sets whether it is an image prompt,a style reference,or a character reference.Shift+select an option to use an image for multiple categoriesRemember,while MJ V6 is in alpha this and other features may change suddenly,but V6 official beta is coming soon.We'd love everyone's thoughts in ⁠ideas-and-features We hope you enjoy this early release and hope it helps you play with building stories and worlds

Midjourney V6 更新角色一致性命令 "--cref "

处理使用--cref进行提示有三种关键方法。您可以锚定细节(姿势、表情、情感、服装、道具、场景、动作),这样您就能掌控它们;您可以轻轻一触,让--cref处理大部分工作;或者您可以只提供场景给角色,让--cref完全处理所有工作。在这三种情况下,提示将与Midjourney能够从您提供的cref图像中识别的任何角色属性混合在一起。您的提示可以用于锚定角色的重要细节,也可以让cref图像自行贡献所有内容。·锚定重要角色细节的提示示例:注意提示如何强调出现在参考图像中的标志性角色属性。它还“操纵”或“定位”角色。例子:Jo is a young woman with blue curly hair,pink sunglasses,and a colorful scarf around her neck.She waits in line at the bank.--cref https://my.image.host/jo-is-standing.jpg翻译:乔(Jo)是一位年轻女子,头发蓝色卷曲,戴着粉红色太阳镜,脖子上系着一条五颜六色的围巾。她正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·不需要重复标志性细节的无干扰提示示例:注意到这个提示没有尝试加强参考图像中的任何标志性细节,它只是“操纵”或“定位”角色。有人正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·如果您的cref图像已经包含您想要的姿势和其他细节,则还有第三种方式可用:您可以仅描述环境、周围环境、背景或情境。Midjourney将努力将角色融入场景中。如果您选择这种方式,可能会看到一些不连贯的结果。如果是这样,请尝试使用更高值的样式化(--s),例如--s 800。

Midjourney V6 更新角色一致性命令 "--cref "

处理使用--cref进行提示有三种关键方法。您可以锚定细节(姿势、表情、情感、服装、道具、场景、动作),这样您就能掌控它们;您可以轻轻一触,让--cref处理大部分工作;或者您可以只提供场景给角色,让--cref完全处理所有工作。在这三种情况下,提示将与Midjourney能够从您提供的cref图像中识别的任何角色属性混合在一起。您的提示可以用于锚定角色的重要细节,也可以让cref图像自行贡献所有内容。·锚定重要角色细节的提示示例:注意提示如何强调出现在参考图像中的标志性角色属性。它还“操纵”或“定位”角色。例子:Jo is a young woman with blue curly hair,pink sunglasses,and a colorful scarf around her neck.She waits in line at the bank.--cref https://my.image.host/jo-is-standing.jpg翻译:乔(Jo)是一位年轻女子,头发蓝色卷曲,戴着粉红色太阳镜,脖子上系着一条五颜六色的围巾。她正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·不需要重复标志性细节的无干扰提示示例:注意到这个提示没有尝试加强参考图像中的任何标志性细节,它只是“操纵”或“定位”角色。有人正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·如果您的cref图像已经包含您想要的姿势和其他细节,则还有第三种方式可用:您可以仅描述环境、周围环境、背景或情境。Midjourney将努力将角色融入场景中。如果您选择这种方式,可能会看到一些不连贯的结果。如果是这样,请尝试使用更高值的样式化(--s),例如--s 800。

其他人在问
图片 视频处理 应用推荐
以下是为您推荐的一些图片和视频处理应用: Runway:具有文生视频、Prompt+图像生成视频、无 Prompt 直接图片转视频等功能。支持 motion 控制和运镜调节,还提供 30 多项图片、视频处理能力,如 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。近期控制台上线了 Watch 模块,可查看官方精选的创意案例。 AiLogoArt:将您的 Logo 融入 AI 生成的图象中,能在几分钟内获得专业品牌图片。 PlainScribe:可将大文件转录为完美的文本,上传文件处理完成后可搜索文本或下载 CSV 文件,适用于各种大文件,有灵活的按需付费模式。 RIX:面向开发者的人工智能搜索引擎,可使用 Web 搜索模式查找最新信息或切换到 GPTknowledge 模式获得预先训练的知识即时答案,还能通过流行网站快捷方式简化搜索。 Magic Clips:能让人工智能挑选出录制的最佳时刻,并转化为适合媒体的短视频片段,可添加字幕。 以下是一些从事相关工作的人员: yangzec:学习多模态 AI 的使用和开发应用 凯叔 AI:插画设计 清墨.SALEX:日常工作 above:批量作图 ehhe:绘画,视频,人像,电商背景图 kone:AI 商业应用 xman:自媒体创作 Alan:绘画和视频处理 在野:视频创作 tang:照片处理等 阿鲁:生产 大大大松树:视频工作流 BigPeng:好玩 冻奶味:工作+娱乐休闲 Lily:视频和电商,写真 tim:能用在生产中 木兰:广告推广素材制作 吴:电商 马化腾:Ai 绘画 蔡徐坤:Ai 视频,Ai 绘画,Ai 音乐 吴林林:爱好,家人做写真 初尘:文生视频,做自媒体 ning:工作流
2024-11-16
图片去除水印
以下是一些 AI 去水印的工具和方法: 1. AVAide Watermark Remover:这是一个在线工具,使用 AI 技术从图片中去除水印。它支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,只需上传图片,选择水印区域,然后保存并下载处理后的图片即可。这个工具还提供了其他功能,如去除文本、对象、人物、日期和贴纸等。 2. Vmake:同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片,AI 会自动检测并移除图片上的水印。处理完成后,用户可以选择保存生成的文件。适合需要快速去除水印的用户,尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印的功能,可以一键去除图片中的多余物体、人物或水印,不留任何痕迹。支持直接粘贴图像或上传手机图像,操作简单方便。 此外,如果想去掉图片中特定的物体,如右手的手串,除了 PS,还可以选择以下工具: Adobe Firefly 的 AI 版,SD 局部重绘。 Firefly、Canva、Google Photo 都有局部重绘功能。 微软 Designer 也免费。 还可以使用工具 https://clipdrop.co/cleanup 进行图片去水印。 这些工具各有特点,可以根据您的具体需求选择最适合您的去水印工具。内容由 AI 大模型生成,请仔细甄别。
2024-11-15
我想要让ai生成svg图片,如何保证其生成质量
要保证 AI 生成 SVG 图片的质量,您可以参考以下方法: 在使用 AI 生成图片时,可能会遇到即使输入相同关键词,生成的图片仍有很强随机性的情况。为了让生成的图片更加可控,可以利用 seed 参数进行反向生成。 首先,从官方文档中了解 seed 参数的作用:Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。种子号为每张图随机生成,但可以使用 Seed 或 same eseed 参数指定。使用相同的种子号和提示符将产生类似的结尾图片。详细参数可查看官方文档: 默认情况下,种子是随机给定的。若想要获得比较相似的图,需要将 seed 固定下来。简单来说,使用时在关键词后添加 seed 参数即可,具体数字在 0–4294967295 范围内均可。例如:caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k seed 8888 这样就能保证每次生成的都是相同的图。此外,还可以反向利用这个特性对已经确定的效果图进行微调。比如当发现有一张图已比较接近目标,还需要一些微调时,可以利用确定图片的 seed,在此基础上添加新的关键词来实现。
2024-11-15
生成logo图片的AI工具
以下是一些生成 logo 图片的 AI 工具: 1. Looka:是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据用户输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 另外,即梦 AI 也有相关功能。制作步骤如下: 1. 在即梦左侧点击「智能画布」,「上传图片」上传一张 logo 图,点击「图生图」输入描述词,参考程度为 55 ,选择「轮廓边缘」,点击立即生成。 2. 右侧图层可看到 4 张图,选择喜欢的图;若不喜欢,可用局部重绘、消除笔等功能调整或重新生成。 还有第六期的活动“一起做个 LOGO 吧”,活动时间为 2024 年 6 月 9 日至 2024 年 6 月 16 日。参与方式为使用 SD 等 AI 工具出图,作品直接发送至 SD 学社微信群。更多 SD 教程可参考: ,并开启本地 sd 客户端。
2024-11-15
能将图片转成线稿的软件
以下是一些能够将图片转成线稿的软件及相关方法: 1. SDXL Prompt Styler:可以把图片转化成近百种风格。在转绘成折纸风时,最好不要加入线稿边缘(canny)的 ControlNet 控制,或者需要把 canny 的控制强度(strength)调到比较小。原始图像是手绘风格时,手绘线条和折纸风格本身互斥。若想转成漫画风格并较好保留人物外轮廓,加入 canny 控制能更好还原人物原本造型。有时内置预设提示词组合不一定能达到想要效果,需自行添加更多相关关键词。此工作流结合 Vid2Vid Style Transfer with IPA & Hotshot XL 工作流,可实现视频不同风格的稳定转绘。 2. Midjourney + Stable Diffusion:在上色时,正关键词主要前面添加增加照片质感常用的+mj 生成线稿的关键词调整等,负关键词根据效果添加。在 ControlNet 设置中,上传自己的草图到 ControlNet 并启用,预处理器需生效。 3. IPA 工作流:基于黑白线条的图案及背景风格重绘,首先创建节点加载图片,其次读取所需风格的参考图,通过 cn 的深度学习模型(SDxl 版本)进行处理,对要生成的图片填写提示词,如正向提示词:illustration,bushes,calm,executable,high quality ,然后生成。 具体五种不同的处理器对比,可以参考我的飞书文档:
2024-11-15
在生成刺绣图片上表现优秀的AI工具
以下是在生成刺绣图片方面可能表现优秀的 AI 工具,以及一些相关的图生图 AI 工具供您参考: 图生图 AI 工具: Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 不过目前尚未有专门针对生成刺绣图片的特定 AI 工具。这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出,但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-11-15
midjourney怎么使用
Midjourney 的使用方法如下: 1. 模型个性化(Personalization 或 'p'): 工作原理:模型个性化会学习您的喜好,以更符合您的口味生成图像。 要求:目前从成对排名中的投票和您喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效。您可以在排名页面查看评分数量,或在 Discord 上输入 /info。 使用方法:在提示后输入 p,或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”,您可以分享此代码让他人使用应用于该图像的个性化效果。还可以使用 s 100 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。 注意事项:个性化目前不是稳定功能,会随您进行更多成对排名而变化,且可能会有算法更新。 2. 角色一致性功能: 如何使用:在您的提示后输入 `cref URL` 并附上一个人物图像的 URL。注意一定要在提示词后面,您可以使用 `cw` 来修改参考“强度”从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;在强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 3. 喂图: 意义:从第一张起,可反复上传优化图片,以达到想要的图片。 喂图过程:上传单张或者一组(4 到 5 张,目前没有限制,但一般 4 张刚好)到 Midjourney 输入框里。上传有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+您所描述的关键词。 常见问题: 新手找不到输入框频道。答:找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。可在官方白色图标频道或社区频道添加 Midjourney 机器人,然后搜索并选择第一个,添加到自己服务器,点击授权即可。
2024-11-18
midjourney 人物正面
以下是关于 Midjourney 人物相关的内容: 关于人物正面的描述:可以描述人物第一次出现的场景,如在一个水草丰美的地方,一身白色长裙的部落少女。 群像人物一致性保持及空间深度控制: 针对构图有空间深度场景的需求,共分七步。 第一步,优先生成“构图”为主的画面,再进行细化修改。 第二步,利用风格参考图让 Midjourney 理解空间关系。 第三步,垫图加 prompt 抽图。 第四步,重绘面部及侧身幅度。 Midjourney V6 更新角色一致性命令“cref”: Midjourney 努力在 cref 起作用时保留面部,无论 cw 的值如何。 当 cw 设置为 0 时,Midjourney 只转移面部到新图像中,会始终保留面部标志性属性。 若要改变面部,可按以下步骤操作: 使用 /settings 确保处于 模式且 Remix 设置为打开。 选择带有要更改面部的图像,使用 分离,选择 。 开启 Remix 后编辑提示,删除 cref 和 cw 后修改提示以对面部进行更改。 对更改满意时,确保不再添加 cref 到提示中。 某些部分看起来怪异或破碎时,可尝试将 stylize增加到 800 1000,或将 cw 降低到低于 100 的值。
2024-11-17
Midjourney提示词 中文分析器
以下是一些与 Midjourney 提示词相关的网站和提示词基本格式的介绍: 相关网站: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,网址: MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分,网址: OPS 可视化提示词:有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词,网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,网址: Prompt Hero:好用的 Prompt 搜索,适用于 Stable Diffusion、ChatGPT 和 Midjourney,网址: OpenArt:AI 人工智能图像生成器,网址: img2prompt:根据图片提取 Prompt,网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,网址: AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供广泛的不同风格供选择,网址: 提示词基本格式: 可以总结为“形容词+主语+环境+行为+构图+参考风格+渲染程度+后缀”。首先对人物进行详细描述,包括情绪、发型、穿着等;然后描写环境,如天气、地理位置等;接着描述摄影、灯光和成像质量;最后用后缀词规定绘图比例。遵循这样的逻辑输入提示词,有助于生成更符合期望的高质量绘图。
2024-11-10
midjourney Prompt 编写指南
以下是关于 Midjourney Prompt 编写的指南: 1. 基本结构 与 Niji·journey 5 相似,Midjourney Prompt 结构为:<产出属性要求+设计主体描述+风格要求+效果要求> 2. 产出属性要求 例如:Anime, AAA character concept art, many details, full body view 等,需首先明确属性要求。 3. 设计主体描述 如:a blonde twintail short little Girl wear inside cyberpunk latex tiny tight Pilot suit, wear outside an ultra detailed Futuristic fashion oversized cyberpunk short coat with big wide sleeves, big cyberpunk boots 。可以参考相关特征进行描述,注意规避屏蔽词汇,通过描述年龄控制角色年龄段。 4. 风格要求 可以使用各种风格描述词汇,或直接写上参考游戏设计的名字,出于知识产权尊重,不建议写设计师名字。 5. 效果要求 包括:lineart, beautiful linework, high contrast, frisky, gradient, manga, hd 等。还可以写上 Midjourney 三视图关键词、背景颜色、不要生成文字 logo 等具体要求。 6. 其他相关 若公共频道消息刷太快,可在私信 Midjourney Bot 使用 /imagine 命令,私信创建的图像仍受内容和管理规则限制,且可在 Midjourney 网站查看。 Prompts 是 Midjourney Bot 中的指令,可简单或详细,Bot 会根据 Prompt 生成图像网格,可选择并修改操作。了解编写基础提示信息可参考 https://docs.midjourney.com/prompts ,探索通过艺术媒介、地点和时期描述改变图像可参考 https://docs.midjourney.com/exploreprompting 。 /blend 命令允许使用 Midjourney 的 AI 图像生成将多个图像混合,需上传至少两张图像,输入命令加上图像 ID 和选项,可调整混合设置,生成新图像。学习上传和混合自己的图片可参考 https://docs.midjourney.com/v1/docs/blend 。
2024-11-07
如何安装MIDJOURNEY
安装 Midjourney 可以参考以下步骤: 1. 接入模式选择: 有两种接入模式,分别是:https://github.com/mouxangithub/midjourneyproxyonwechat ;https://github.com/zhayujie/chatgptonwechat/tree/master/plugins/linkai 。选用第二种相对简单且便宜。 2. 实操准备: 在此之前需要安装 chatgptonwechat 和 sum4all 的插件。接入 Midjourney 也是将插件安装在 chatgptonwechat 的 plugins 库中,通过填写模型、key 来实现调用,此次还多了一个 code,操作可能较麻烦,但请相信不难。 3. 注册 Linkai: 打开 https://linkai.tech/home?share=iaPC2x ,在应用接入中创建您的 API Key 。 打开应用市场选择 Midjourney 右上角分享中有 code 地址。 4. 修改相关配置文件: 修改/root/chatgptonwechat/plugins/linkai 中的 config.j 。 修改/root/chatgptonwechat/plugins 中的 config.json 。 修改/root/chatgptonwechat 中的 config.json 。 调试好以上步骤后,即可进入微信对话页面开启插件。
2024-11-03
Midjourney生成知名动漫或卡通形象受限制了么?
Midjourney 在生成知名动漫或卡通形象时存在一定的限制。例如,在生成角色方面,最好不要生成过多角色,过多甚至可能指 2 个。做人、做动物的情况还好,但对于有拟人角色需求的情况,可能难以生成满意的结果。比如小龙喷火到小兔子举着的礼物盒这种看似简单的需求,可能无法达到满意效果,可能出现动物不拟人或龙的体型超大等情况。对于像中国龙这种数据样本较少的形象,生成符合要求的图很有挑战性。 在视频生成方面,如果想让角色做出一些较大的动作,比如转头、掉眼泪、抬手或更生动的表情变化,现有的技术还不够成熟,还需要更先进的技术、更丰富的数据和更强大的计算能力。此时的策略是尽量规避制作需要大动作表现的视频,如果实在避免不了,可以尝试制作一些只涉及小动作的场景,然后通过加入台词和场景描述来补充细节和深度,帮助观众更好地理解场景背景和角色心理,以弥补视觉上的不足。
2024-10-29
视频导出动作的AI
以下是关于视频导出动作的 AI 相关信息: AI 视频导出方面:普通社交媒体分享选 1080P,需放大选 720P,码率越高越好,可自定义最高 5 万。 Move AI 推出的 Move API 能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据,相关链接为 https://move.ai/api 。
2024-11-05
动作姿态生成的网站
以下为一些关于动作姿态生成的网站相关信息: 在 Stable Diffusion 中,ControlNet 是一个强大的控制插件。对于姿态约束,您可以通过以下方式操作: 1. 国风 3 模型点击生成姿势,但 AI 识别可能不准确,需耐心刷图和调整参数。 2. 若要细化图片,可使用扩展图片的方法,将图发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再用 ControlNet 中的 tile 模型细化,最后使用 SD 放大插件。 3. 当找不到满足需求的动作图片时,可以自定义动作骨架。在【扩展】【加载扩展列表】中搜索【posex】安装插件(若安装不了,可将分享的插件文件夹拷贝至...\\sdwebuiakiv4\\extensions 目录,确保软件为最新版本后重启)。重启后来到首页,点击“将图片发送至 ControlNet”,可通过鼠标操作调整视角。如调一个玛丽琳梦露的经典动作,右边可调整出图尺寸,启用 ControlNet 时,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型即可。 另外,公众号【白马与少年】有不同 pose 的骨架图可供参考,回复【SD】获取。该公众号还分享 Stable Diffusion、Blender 等学习心得,有 139 篇原创内容持续更新。
2024-11-01
动作姿态生成
以下是关于动作姿态生成的相关内容: 在使用 Stable Diffusion 进行动作姿态生成时,可采用以下方法: 1. 利用 ControlNet 中的姿态约束功能,如国风 3 模型,点击生成姿态,但可能存在骨骼错位等问题,需要耐心刷图和调整参数。同时,还收集了不同 pose 的骨架图,可通过添加公众号【白马与少年】回复【SD】获取参考。 2. 对于人物绘制,先确定人物动作,可在草图基础上用 Clip Studio Pro 中的 3D 人物模型进行姿态调整,或使用其他 3D Pose 类软件生成人物姿态,然后使用 ControlNet 的 Openpose 功能生成人物姿态。为控制人物色彩,可采用合适图片放入 img2img 中调整 Denoising strength,或使用 ControlNet Color 等插件,过程中需进行 img2img 反复迭代,并适时加入背景元素,人物大致确定后用 photoshop 融合,再继续生成和调整。 3. 对于特殊物品如天狗面具,若 Stable Diffusion 没有合适模型和 Lora,可自行训练专用 Lora,使用时用 inpainting sketch 重绘或在 Photoshop 处理后进入 img2img 重绘,注意重绘区域要小。 4. 对图片进行细化时,可使用扩展图片方法,将图发送到图生图,用 ControlNet 中 tile 模型细化,再使用 SD 放大插件。若找不到满足需求的动作图片,可在【扩展】【加载扩展列表】中搜索【posex】插件,安装或拷贝至指定目录,重启软件后在首页点击“将图片发送至 ControlNet”进行操作,可通过鼠标操作调整视角,调动作时启用 ControlNet,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型。
2024-11-01
会自动作美女跳舞视频的AI
以下是为您提供的关于能自动制作美女跳舞视频的 AI 相关信息: XLabsAI 发布了 6 个不同的 Lora,分别是: 1. mjv6_lora Midjourney 风格,示例为:A fullprofile portrait of a Chinese dancer poised on a moonlit stone bridge, surrounded by the delicate blooms of a cherry orchard. Her silk garments ripple with her movement, her eyes are focused and intense, with skin details on her face. She's part of a scene inspired by classical poetry, her fluid motions a dance of elegance. The luminance is delicate and dreamlike, bestowing a soft ambience. 2. realism_lora 写实风格,示例为:In a conference room setting, a beauty women dressed in business attire are attending a meeting,random expressions, postures, and physical characteristics. A RAW ultrarealistic photo, UHD, 8k. 3. anime_lora 动漫风格,示例为:1girl. 4. disney_lora 迪斯尼风格,示例为:1cat, cartoon, disney. 5. scenery_lora 风景风格,示例为:A breathtaking view of the Himalayas mountain range, showcasing its majestic and serene beauty. The mountains are covered in snow, with their peaks reaching towards the sky, creating a stunning contrast with the blue horizon. The range is vast and imposing, with numerous towering peaks, including Mount Everest, the highest point on Earth. The scene captures the grandeur and tranquility of the Himalayas, with sunlight casting a soft glow on the snowcovered slopes. The foreground shows the rugged terrain and lush greenery of the lower elevations, adding to the diverse and spectacular landscape. 6. art_lora 艺术风格,示例为:Cat, European street, exploration, cozy, mysterious, colorful buildings, sunlight through leaves, cobblestone path, high definition, watercolor painting, warm tones, bright lighting effects, paper texture. Lora 下载地址:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs
2024-09-21
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
两个人物图合成一张图片,有什么好工具?
以下是一些可以将两个人物图合成一张图片的工具和方法: 1. Midjourney(MJ): 确定人物形象,通过相关提示词生成人物图像。 利用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图在 MJ 中重新生图。 2. Stable Diffusion(SD): 可使用 Roop 插件进行多人物脸部替换。例如生成一张包含两个古风人物的图片,通过图生图调整重绘幅度,并在 Roop 插件中载入相应人物照片形象进行脸部替换,最后使用 PS 扩图。 3. 其他方法: 利用 MJ 画图制作底图,使用 InsightFaceSwap 插件处理脸部,分割裁剪图片、处理后缝合,再用相关软件让图片动起来。 直接在网上寻找能够融合两张照片的软件或项目,若没有则进行纯 P 图,然后利用图生视频的项目完成。
2024-10-28
照片人物与虚拟人合成
以下是关于照片人物与虚拟人合成的相关内容: 使用 Midjourney(MJ)生成人物图片: 确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。可使用垫图 URL 及相关提示词,如“In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,其中“iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为了确保人物一致性,取 iw 2”。 合成人物和场景: 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),在 MJ 中重新生图,提示词如“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 在 StableDiffusion(SD)中绘制一致性多角度头像: 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图都是 512×512px。加上网格图,通过 lineart 来分割不同的块面。设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区,为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-10-28
怎么用AI绘制一个我指定的动漫人物原型的各类图片,例如日漫《好想告诉你》中的黒沼爽子
要使用 AI 绘制指定的动漫人物原型,如日漫《好想告诉你》中的黑沼爽子,您可以按照以下步骤进行: 1. 选择合适的 AI 绘画工具:目前有许多在线的 AI 绘画平台和软件可供选择,例如 DALL·E2、StableDiffusion 等。 2. 明确描述特征:在输入描述时,尽可能详细地描述黑沼爽子的外貌特征,包括发型(如黑色的长直发)、眼睛(如大而明亮的眼睛)、服装(如校服的款式和颜色)、表情(如羞涩的微笑)等。 3. 参考相关图片:如果可能,找到黑沼爽子的官方图片或其他粉丝绘制的作品,作为参考提供给 AI 绘画工具,以帮助其更好地理解您的需求。 4. 不断调整和优化:根据生成的初步结果,对描述进行调整和优化,例如修改某些特征的描述、增加更多细节等,以获得更符合您期望的图片。 需要注意的是,AI 绘画的结果可能会受到多种因素的影响,不一定能完全符合您的预期,但通过不断尝试和优化,您有机会获得较为满意的作品。
2024-10-17
生成人物图像哪个AI最好
以下为一些生成人物图像较好的 AI 工具及相关信息: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。网址:https://photomaker.github.io 。 在人物构图的视角选择方面,有以下几种常见视角: 正视角:拍摄对象正对着相机的姿态,使人像呈现出正面的视角。咒语关键词:Front view 。生成思路:正视角的年轻女孩。生成咒语:young girl,front view,ar 16:9 。 后视角:从被摄对象的背后拍摄的视角,以被摄对象的背部为主要构图元素。咒语关键词:Back view angle & Back angle 。生成思路:后视角的年轻女孩。生成咒语:young girl,back view angle,ar 16:9 。 侧视角:观察或拍摄物体或场景时从侧面的角度观察,可用于展示物体的形状和轮廓,或创造深度和距离的感觉。咒语关键词:Side view & Shoulder level view 。生成思路:侧视角的年轻女孩。生成咒语:young girl,Side view,ar 16:9 。 仰视角:观察或拍摄物体或场景时从底部的角度观察,通常会让物体看起来更为庞大和高大,具有一定的视觉冲击力和震撼效果。咒语关键词:Bottom view & Low angle view 。生成思路:仰视角的年轻女孩。生成咒语:young girl,low angle view,ar 16:9 。 俯视角。 此外,还有 Sam Altman 与 Bill Gates 关于 GPT 的未来讨论,以及 Portkey AI 网关这一连接多种 AI 模型的工具。
2024-10-12