Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何在midjourney中只进行照片背景修改,而不修改人物姿态和表情

Answer

在 Midjourney 中只修改照片背景而不修改人物姿态和表情,您可以参考以下方法:

  1. 得益于--cref[image url]和--cw[0~100],midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果您只想关注人脸,请调低到 0。您不需要对角色原图使用/describe 来贴近目标生成角色的形象,因为--cref 会帮您完成这件事情。
  2. 风格复制和服装的替换,则应当用提示词(prompt)和--sref[image url]来解决。顾名思义,--sref 代表 style reference,权重参数为--sw[0~1000],默认值 100,越高越接近参考图像的风格。
  3. 如果遇到“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距,您可以按照以下步骤操作:
    • 使用/settings 确保您处于[Low Variation /低变异]模式并且 Remix 设置为打开。
    • 选择带有您想要更改的面部的图像。使用(U )将其从网格中分离出来,然后选择[Vary Region]。
    • 由于您已经开启了 Remix,您将能够编辑提示。
    • 从提示中删除--cref 和--cw。一旦删除了它们,修改提示以对面部进行更改。例如,您可以慷慨地选择面部的下半部分,并添加“清洁剃须”来除去胡须。您可以尝试使用小的负权重,例如 tattoos::-0.5 来移除纹身。
    • 注意:当您对更改满意时,请确保不要再次添加--cref 到提示中!一旦添加回来,“面部交换”将再次发生,那些不需要的属性将重新出现。
  4. 有时,Midjourney 在正确将角色放置在背景中时会遇到一些困难。如果结果不连贯(例如,您看到头部朝后或图像被奇怪地裁剪),请尝试将 stylize(--s)增加到 800 - 1000。您也可以尝试将--cw 同时降低到低于 100 的值,视情况而定。
Content generated by AI large model, please carefully verify (powered by aily)

References

莱森:利用一致性MJ 出海马体写真的教程来啦

[title]莱森:利用一致性MJ出海马体写真的教程来啦[heading2]视频教程:Midjourney cref海马体写真教程来啦!10分钟不到出写真~视频在下面(记得mark看文字笔记)超低学习成本,你只要会用任意手机修图软件...就能解决Midjourney Cref角色一致性直出之后的「形似而神不似」的问题。简而言之,文字笔记:得益于--cref[image url]和--cw[0~100],midjourney能够迅速达成角色一致性的目的而无需Lora。其中,cref代表character reference(角色参考);cw则代表character weight(参考权重),默认为100,会参考角色的人脸和服装特点。如果你只想关注人脸,请调低到0。你不需要对角色原图使用/describe来贴近目标生成角色的形象,因为--cref会帮你完成这件事情。于是,风格复制和服装的替换,则应当用提示词(prompt)和--sref[image url]来解决。顾名思义,--sref代表style reference,权重参数为--sw[0~1000],默认值100,越高越接近参考图像的风格举个例子,现在我们要海马体这张图像,我们先用/describe指令反推海马体的提示词,再配合--sref[海马体图像的url],就可以轻松复制图像风格。在回车之前,检查你的提示词,不要出现和sref风格差异过大的prompt;也可以增加一些你之前学过的有用的prompt。Upscale最满意的那一张。接下来解决大家最关心的「形似而神不似」的问题。其实非常简单,这个问题其实是:MJ直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距。

Midjourney V6 更新角色一致性命令 "--cref "

[title]Midjourney V6更新角色一致性命令"--cref"[heading1]CREF故障排除提示Midjourney努力在cref起作用时保留面部,无论--cw的值如何。事实上,当您将--cw设置为0时,您是在要求Midjourney将只转移面部到新图像中。Midjourney将始终保留面部的标志性属性,如胡须和眼镜。如果您想要改变面部,请在另一个工具中进行。如果这不可行,您可以尝试使用此过程。按照以下步骤操作:·使用/settings确保您处于[Low Variation /低变异]模式并且Remix设置为打开。·选择带有您想要更改的面部的图像。使用(U )将其从网格中分离出来,然后选择[Vary Region]。·由于您已经开启了Remix,您将能够编辑提示。·从提示中删除--cref和--cw。一旦删除了它们,修改提示以对面部进行更改。例如,您可以慷慨地选择面部的下半部分,并添加“清洁剃须”来除去胡须。您可以尝试使用小的负权重,例如tattoos::-0.5来移除纹身。这是一个供您探索和发现的领域,根据您的目标来决定。注意:当您对更改满意时,请确保不要再次添加--cref到提示中!一旦添加回来,"面部交换"将再次发生,那些不需要的属性将重新出现。3.某些部分看起来有些怪异或破碎有时,Midjourney在正确将角色放置在背景中时会遇到一些困难。如果结果不连贯(例如,您看到头部朝后或图像被奇怪地裁剪),请尝试将stylize(--s)增加到800-1000。您也可以尝试将--cw同时降低到低于100的值,视情况而定。4.你需要知道的问题

Midjourney V6 更新角色一致性命令 "--cref "

[title]Midjourney V6更新角色一致性命令"--cref"[heading1]CREF故障排除提示Midjourney努力在cref起作用时保留面部,无论--cw的值如何。事实上,当您将--cw设置为0时,您是在要求Midjourney将只转移面部到新图像中。Midjourney将始终保留面部的标志性属性,如胡须和眼镜。如果您想要改变面部,请在另一个工具中进行。如果这不可行,您可以尝试使用此过程。按照以下步骤操作:·使用/settings确保您处于[Low Variation /低变异]模式并且Remix设置为打开。·选择带有您想要更改的面部的图像。使用(U )将其从网格中分离出来,然后选择[Vary Region]。·由于您已经开启了Remix,您将能够编辑提示。·从提示中删除--cref和--cw。一旦删除了它们,修改提示以对面部进行更改。例如,您可以慷慨地选择面部的下半部分,并添加“清洁剃须”来除去胡须。您可以尝试使用小的负权重,例如tattoos::-0.5来移除纹身。这是一个供您探索和发现的领域,根据您的目标来决定。注意:当您对更改满意时,请确保不要再次添加--cref到提示中!一旦添加回来,"面部交换"将再次发生,那些不需要的属性将重新出现。3.某些部分看起来有些怪异或破碎有时,Midjourney在正确将角色放置在背景中时会遇到一些困难。如果结果不连贯(例如,您看到头部朝后或图像被奇怪地裁剪),请尝试将stylize(--s)增加到800-1000。您也可以尝试将--cw同时降低到低于100的值,视情况而定。4.你需要知道的问题

Others are asking
图生图 / img2img:上传一张图片,然后系统会在这个图片的基础上生成一张新图片,修改一些提示词(Prompt)来改变新图片的效果 , 给我推荐这类大模型
以下为您推荐可用于图生图(img2img)的大模型: 1. Stable Diffusion(SD)模型:由 Stability AI 和 LAION 等公司共同开发,参数量约 1B,可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。在图生图任务中,SD 模型会根据输入的文本提示,对输入图片进行重绘以更符合文本描述。输入的文本信息通过 CLIP Text Encoder 模型编码成机器能理解的数学信息,用于控制图像生成。 2. Adobe Firefly image 2 模型:上周发布了 Beta 测试版本,增加了众多功能,模型质量提升。默认图片分辨率为 20482048,对图片的控制能力增强,具有更高质量的图像和插图生成、自定义选项和改进的动态范围。支持生成匹配(img2img),应用预先选择的图像集中的风格或上传自己的风格参考图像以创建相似图像,还有照片设置、提示建议、提示链接共享、反向提示词等功能。
2025-02-12
怎么用ai完成淘宝模特图片的批量修改,风格都是一致的
以下是使用 AI 完成淘宝模特图片批量修改且风格一致的方法: 1. 利用 Stable Diffusion 进行局部重绘: 真人穿衣服拍照,获取真实质感的照片。若身材方面有问题,可借助美图秀秀或 PS 处理。 选好真人照片风格的底模,如 majicmixRealistic_v7。 根据不同平台需求换头,如面向海外市场换白女头。 在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置好 prompts 和 parameters。 2. 大淘宝设计部的实践: 对于定制化真人模特实景素材的主题活动,通过 AI 可将策划、搭建、拍摄、设计融为一个闭环流程,短时间内完成页面所有素材的生产和输出。 在 UI 设计场景中,采用 AI 能力可快速定制多种视觉效果,通过 SD 中 controlnet 的有效控制,生成指定范围内的 ICON、界面皮肤等内容。 通过对 AI 大模型的训练和应用,算法从模特姿态、背景风格、装饰元素等多个维度进行效果升级,结合用户数据提供定制化的线上真人化模特体验。 一张商品图,结合用户的自定义输入,可生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。 此外,字节发布的新模型 SeedEdit 也可用于图片编辑,每次编辑尽量使用单指令,多指令最好少于 3 种变化。为保证效果,局部编辑时下指令要精准,参考图要清晰、分辨率高。若编辑效果不明显或变化过多,可调整编辑强度。
2025-01-21
现在有哪些好用的图片生成,或者是修改美化的人工智能,尽量少要一些国内的
目前比较成熟的国外图片生成或修改美化的 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格可选,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果很好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可根据文本或参考图像生成有创意且质量不错的相似图像输出,但仍存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2025-01-20
有哪些设计小学生手抄报比较好用的ai?要求能按照主题或具体要求生成图片,并根据意见修改生成的图片
以下是一些设计小学生手抄报比较好用的 AI 工具及相关流程: 国内的 AIGC 绘图平台无界 AI 可以帮助您快速制作海报底图并完成主题海报排版。虽然其他 AIGC 绘图软件在操作步骤上不完全相同,但思路基本一致。 需求场景: 当您想在朋友圈、微博、Twitter 等平台发布内容时,纯文字可能点赞较少。 百度图片质量差、易撞图。 相册中的照片可能不太理想。 大致流程: 1. 主题与文案:确定海报主题后,可借助 ChatGPT 等文本类 AI 工具协助完成文案。 2. 风格与布局:选择想要的风格意向,背景不必空白,根据文案和风格灵活调整画面布局。 3. 生成与筛选:使用无界 AI,输入关键词,生成并挑选一张满意的海报底图。 4. 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。
2025-01-15
电商用最好的产品图片修改工具
以下是一些适用于电商的产品图片修改工具及相关应用: 1. Midjourney: 产品海报设计:将产品图片导入编辑器,通过简单操作和提示词生成不同风格的海报。 家具材质变化:利用图像重纹理化模式快速为家具换上各种材质。 艺术字体海报:通过白底字体图和图像重纹理化模式变换成各种炫酷的字体海报风格。 2. Stable Diffusion: 对于运营网店的女装店主,可通过真人穿衣服拍照,选好底模(如 realisitic 的真人照片风格底模),根据不同平台换头,使用图生图下的局部重绘选项卡涂抹替换部分等步骤,初步制作展示商品。 3. 其他工具: 像 Flair、Booth 和 Bloom 这样的工具帮助品牌创建引人注目的产品照片。 AdCreative 和 Pencil 可以制作用于电子邮件或社交媒体的营销材料。 Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。 未来,我们有望仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店及用于市场营销的材料。
2025-01-15
我想要一个能修改图片的ai
以下为您介绍一些能修改图片的 AI 工具及相关知识: 1. DALL·E 推出了编辑功能,支持对生成图片进行二次编辑,包括替换、删除、添加对象等。编辑界面提供了一系列选项,如选择工具、可拖动的大小调整工具、“撤销、恢复”按钮和“Clear Selection”选项等。使用时,例如通过突出显示图像部分并添加提示,如“添加樱花”,或选择对象并使用提示“删除鸟类”“将猫的表情更改为快乐”等进行编辑,完成后记得点击保存。帮助文档:https://help.openai.com/en/articles/9055440editingyourimageswithdalle 。 2. 关于 AI 去水印工具,目前市面上有一些不错的选项: AVAide Watermark Remover:在线工具,使用 AI 技术从图片中去除水印,支持多种图片格式,操作简单,还提供其他功能。 Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,适合快速去除水印及社交媒体分享图片的用户。 AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中的多余物体、人物或水印,支持直接粘贴图像或上传手机图像,操作方便。 此外,如果想让生成的图片更加可控,可以利用 seed 参数反向生成。Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。默认情况下种子是随机的,若想要相似的图,可固定 seed。例如“caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8kseed 8888”,就能保证每次生成相同的图。还可基于确定图片的 seed 加上新的关键词对效果图进行微调。
2025-01-02
给我5个midjourney确保场景一致性的Sample提示词
以下是 5 个 Midjourney 确保场景一致性的 Sample 提示词: 1. Scifi movie scene. In the silverwhite space environment, from the overtheshoulder lens on the right side of the man with short hair and navy blue jumpsuit, a transparent virtual screen appeared on the wall in front of him. Behind there is the silhouette of another female employee with long blue hair, operating another screen. Rendered in a C4D style inspired by Unreal Engine, with high resolution and rich detail. sref url cref url ar 16:9 style raw sw 30 cw 100 2. In a magical forest, a fairy with colorful wings is sitting on a huge mushroom. The sunlight filters through the leaves, creating dappled patterns on the ground. cref https://my.image.host/fairy.jpg s 800 3. On a sandy beach at sunset, a couple is walking hand in hand, leaving footprints in the sand. The ocean waves crash gently in the background. cref https://my.image.host/couple.jpg ar 9:16 4. In a medieval castle courtyard, a knight in shining armor is training with a sword. The flags are fluttering in the wind. cref https://my.image.host/knight.jpg s 700 5. At a busy city street corner, a street musician is playing a guitar, surrounded by a crowd of people. The buildings are towering in the background. cref https://my.image.host/musician.jpg ar 4:3
2025-02-14
MidJourney
以下是关于 Midjourney 的相关信息: 隐私政策: 适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。 个人数据指与个人相关、可用于识别个人身份的任何信息。 适用性包括通过服务、训练算法、网站及第三方来源收集的数据,但不适用于 Midjourney 员工等的个人数据。 可能会更新政策,用户应定期查看,不接受更改应停止互动。 定义了“您”和“使用数据”等概念。 收集的数据类型包括个人数据。 图像提示: 可将图像 URL 添加到提示中,通过/imagine 输入,可拖入或粘贴图片链接。 使用 Midjourney Bot 私信上传图像可防止被其他用户看到,除非用户有隐身模式,否则图像提示在网站上可见。 给出了起始图像、中途模型版本 4 和 5 等的例子,以及纵横比提示。 社区准则: Midjourney 是默认开放的社区。 要友善尊重彼此和员工,禁止不尊重、攻击性或辱骂性内容,禁止成人和血腥内容。 未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-02-13
Midjourney怎么用
以下是关于 Midjourney 的使用方法: 使用 Vary Region 编辑器选择并重新生成放大图像的特定部分: 1. 生成图像:使用命令 /imagine 创建图像。 2. 升级图像:使用 U 按钮放大所选图像。 3. 选择不同区域:点击🖌️Vary按钮,打开编辑界面。 选择编辑器左下角的手绘或矩形选择工具。 选择要重新生成的图像区域。注意选择的大小会影响结果,更大的选择会为 Midjourney 机器人提供更多空间生成新的创意细节,较小的选择则导致更小、更微妙的变化。无法编辑现有选择,但可以使用右上角的撤消按钮撤消多个步骤。 4. 提交您的工作:单击 Submit→按钮将请求发送到 Midjourney Bot。 5. 查看结果:Midjourney 机器人将处理作业并在选择的区域内生成新的变化图像网格。 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 喂图过程: 1. 上传单张或者一组(4 到 5 张,目前没有限制多少张,但一般 4 张刚刚好,太多会给 AI 带来困扰)到 Midjourney 输入框里,上传有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+您所描述的关键词。 常见问题: 1. 小白新手找不到输入框频道。 答:找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 Seed 种子: Midjourney 机器人使用种子号来创建视觉噪声场(例如电视静电),作为生成初始图像网格的起点。seed 接受 0–4294967295 的整数。seed 值仅影响初始图像网格。使用不同模型版本的相同 seed 值,生成的图像效果不同。 种子参数: 如果未指定种子,Midjourney 将使用随机生成的种子编号,每次使用提示时都会生成多种选项。 查找工作的种子号: 1. 通过对作业使用✉️信封表情符号进行反应。 2. 使用 Show 命令恢复旧作业,复制作业 ID 并使用/show<Job ID>命令来恢复作业,然后使用✉️信封表情符号对新生成的作业做出反应。 更改种子数量:添加seed<value>到提示的末尾。
2025-02-12
midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。 个人数据指与个人相关、可用于识别个人身份的信息。 适用性包括通过服务、训练机器学习算法、网站及第三方来源收集的数据,但不适用于 Midjourney 员工等的个人数据。 可能会更新政策,用户应定期查看,不接受更改应停止互动。 定义了“您”和“使用数据”等概念。 收集的数据类型包括个人数据。 图像提示: 可将图像 URL 添加到提示中,通过/imagine 输入,可拖入或粘贴图片链接。 使用 Midjourney Bot 在私信中上传图像可防止被其他用户看到,除非用户有隐身模式,否则图像提示在网站上可见。 给出了起始图像、中途模型版本 4 和 5 等的例子,以及纵横比提示。 社区准则: Midjourney 是默认开放的社区。 要友善尊重彼此和员工,禁止不尊重、攻击性或辱骂性内容,禁止成人和血腥内容。 未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-02-08
如何访问midjourney社区
要访问 Midjourney 社区,您可以按照以下步骤进行: 1. 拥有一个 Discord 账号:如果没有,可参考进行验证。 2. 订阅 Midjourney 计划:访问了解有关定价和各层可用功能的信息。 3. 加入 Midjourney 服务器: 打开 Discord 并找到左侧边栏上的服务器列表。 按服务器列表底部的“+”按钮。 在弹出窗口中,单击“Join a Server”按钮。 粘贴或输入以下 URL:。 4. 转到任何“General”或“Newbie”频道:加入 Midjourney 服务器后,您会在侧边栏中看到列出的几个频道。 此外,您的 Midjourney 订阅使您可以访问 Niji 社区。要为 Niji 模型版本创建风格调谐器或代码,请加入并以与 Midjourney Bot 交互的方式与 Niji 机器人交互。
2025-01-14
midjourney 教程
以下是关于 Midjourney 的一些教程: 1. 利用一致性 MJ 出海马体写真: 超低学习成本,会用任意手机修图软件即可。 得益于 cref,能迅速达成角色一致性目的,无需 Lora。cref 代表 character reference(角色参考),cw 代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。若只想关注人脸,可调低到 0。 风格复制和服装替换,用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 用 /describe 指令反推海马体的提示词,配合 sref复制图像风格。回车前检查提示词,避免出现和 sref 风格差异过大的 prompt,也可增加有用的 prompt。 对最满意的图进行 Upscale,解决“形似而神不似”的问题,即 MJ 直出和原人物在五官等地方的细微差距。 2. 线稿上色 Midjourney + Stable Diffusion: 用 Midjourney 生成线稿,PS 修正错误,再用 ControlNet 控制,Stable Diffusion 上色,多套 AI 组合提高出图质量和效率。 例如生成可爱猫卡通 IP 角色的线稿,mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white backgroundniji 5style expressive。 3. 小白 30min 加入离谱村: 选工具,如 SD 或 Midjourney。 抄 prompt,从教程和导航中找喜欢的风格,摘取提示词。 找 ChatGPT 改写提示词。 把提示词喂给 Midjourney 机器人,初学者可多按 VU 让其自由修改,先弄出满意的图,如 V1V4 基于某图修改出 4 张,U1U4 选定某图细节调整。
2025-01-08
我想知道目前最新、效果最好、代码和模型开源的动作捕捉算法,也叫做人体姿态估计,是哪篇文章
目前最新、效果较好且代码和模型开源的人体姿态估计(动作捕捉算法)相关的研究有以下两篇: 1. 【SD】最强手部识别,controlnet 新预处理器 dw openpose 作者:白马少年|公众号:【白马与少年】 发布时间:20230813 20:00 原文网址:https://mp.weixin.qq.com/s/_RiKxWy9MXt4DUJIKH5w 介绍:在 controlnet 中,手部识别一直使用的是 openpose 预处理器,但复杂手势有时无法识别。新的 dw openpose 预处理器能完美解决手部识别问题,将其放入特定目录即可使用。但需说明的是,目前这个 DW Pose 只是更精确的 openpose 预处理器,未对 ControlNet 的 openpose 模型做改动。 2. YOLONAS Pose:一个开源的实时人体姿态估计模型 应用场景:基于骨骼标记为基础,适用于智慧体育等场景,可对训练过程的姿态、数据、状态等进行统计和管理。 技术类型:视频、AI 学习模型 简介:主要功能是识别图片和视频中人的姿势,能快速处理图像并实时返回姿态数据,适应不同场景和设备。 主要特点: 实时性能:旨在提供实时的姿态估计,适用于需要即时反馈的应用。 高精度:利用神经网络架构搜索(NAS)提高姿态估计的准确性。 优化的网络结构:NAS 自动测试不同网络结构,找到最优模型。
2024-12-31
动作姿态生成的网站
以下为一些关于动作姿态生成的网站相关信息: 在 Stable Diffusion 中,ControlNet 是一个强大的控制插件。对于姿态约束,您可以通过以下方式操作: 1. 国风 3 模型点击生成姿势,但 AI 识别可能不准确,需耐心刷图和调整参数。 2. 若要细化图片,可使用扩展图片的方法,将图发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再用 ControlNet 中的 tile 模型细化,最后使用 SD 放大插件。 3. 当找不到满足需求的动作图片时,可以自定义动作骨架。在【扩展】【加载扩展列表】中搜索【posex】安装插件(若安装不了,可将分享的插件文件夹拷贝至...\\sdwebuiakiv4\\extensions 目录,确保软件为最新版本后重启)。重启后来到首页,点击“将图片发送至 ControlNet”,可通过鼠标操作调整视角。如调一个玛丽琳梦露的经典动作,右边可调整出图尺寸,启用 ControlNet 时,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型即可。 另外,公众号【白马与少年】有不同 pose 的骨架图可供参考,回复【SD】获取。该公众号还分享 Stable Diffusion、Blender 等学习心得,有 139 篇原创内容持续更新。
2024-11-01
动作姿态生成
以下是关于动作姿态生成的相关内容: 在使用 Stable Diffusion 进行动作姿态生成时,可采用以下方法: 1. 利用 ControlNet 中的姿态约束功能,如国风 3 模型,点击生成姿态,但可能存在骨骼错位等问题,需要耐心刷图和调整参数。同时,还收集了不同 pose 的骨架图,可通过添加公众号【白马与少年】回复【SD】获取参考。 2. 对于人物绘制,先确定人物动作,可在草图基础上用 Clip Studio Pro 中的 3D 人物模型进行姿态调整,或使用其他 3D Pose 类软件生成人物姿态,然后使用 ControlNet 的 Openpose 功能生成人物姿态。为控制人物色彩,可采用合适图片放入 img2img 中调整 Denoising strength,或使用 ControlNet Color 等插件,过程中需进行 img2img 反复迭代,并适时加入背景元素,人物大致确定后用 photoshop 融合,再继续生成和调整。 3. 对于特殊物品如天狗面具,若 Stable Diffusion 没有合适模型和 Lora,可自行训练专用 Lora,使用时用 inpainting sketch 重绘或在 Photoshop 处理后进入 img2img 重绘,注意重绘区域要小。 4. 对图片进行细化时,可使用扩展图片方法,将图发送到图生图,用 ControlNet 中 tile 模型细化,再使用 SD 放大插件。若找不到满足需求的动作图片,可在【扩展】【加载扩展列表】中搜索【posex】插件,安装或拷贝至指定目录,重启软件后在首页点击“将图片发送至 ControlNet”进行操作,可通过鼠标操作调整视角,调动作时启用 ControlNet,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型。
2024-11-01
老照片修复用什么
以下是一些用于老照片修复的方法和工具: 1. 使用 SD 中的 ControlNet 模型,特别是其中的 Recolor 新模型,可对黑白老照片进行重新上色。在处理人物照片还原时,可选择 realisian 的写实大模型,提示词直接描述颜色和对应的内容。ControlNet 选择 Recolor 时,预处理器选择“recolor_luminance”效果较好。 2. 超清无损放大器 StableSR:需要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入指定文件夹,同时安装 StableSR 模块和 VQVAE。通过不同的放大方法测试,如“Ultimate SD upscale”脚本、“后期处理”的放大方法和 StableSR 的放大,StableSR 对原图还原较为精准,重绘效果较好。 3. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰,但无法使头发、衣服等元素变清晰。之后可将图片发送到图生图中,打开 stableSR 脚本进行放大修复。 相关参考文章: 1. 【SD】用 AI 给老照片上色,岁月不改它模样:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 2. 【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21wechat_redirect 3. 【Stable Diffusion】超清无损放大器 StableSR:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21wechat_redirect
2025-02-18
如何让老照片动起来
以下是一些让老照片动起来的方法和相关信息: 1. 参加“时光印记”AI 公益挑战赛:该挑战赛采集了杨浦 20 位老一辈建设者老照片与故事,期望用 AIGC 技术创作影视频、AIMV、动图。作品要求任选百年主题,创作视频短片、音乐 AIMV 或动态老照片,AI 制作内容不低于 70%,视频短片时长 60 秒以上,音乐 AIMV 至少 30 秒,图片组让老照片动起来 5 10s。报名及创作时间为即日起至 2024 年 11 月 20 日。参赛方式为填写报名问卷和进群获取素材。 2. 使用 Dreamina 即梦工具:不需要🪜,每天有免费额度。注册可用抖音号或手机号,上传照片即可尝试让老照片动起来。 3. 使用 Sora 工具:优点是发布的成果好,集成在 openai 一套里可用,但需要🪜,需要 gmail 注册,需要订阅后才能使用。
2025-02-14
照片变清晰
以下是将照片变清晰的方法: 1. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。您可以参考文章——。但此步骤无法将照片中的头发、衣服等其他元素变清晰。 2. 接着将图片发送到图生图当中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 3. 对于修复,需要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。还有一个 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 4. 在使用清影工具时,输入一张图片和相应的提示词,清影大模型会根据提示将图片转变为视频画面。也可以只输入一张图片,清影大模型将自行发挥想象力把图片扩展为一段有故事的视频。选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),清影支持上传 png 和 jpeg 图像。如果原图不够清晰,可采用分辨率提升工具将图片变清晰。提示词要简单清晰,可选择不写 prompt 让模型自己操控图片动起来,或者明确想动起来的主体并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词。如果不明确大模型如何理解图片,推荐将照片发送到清言对话框进行识图,明确主体的描述。
2025-02-14
想在手机上通过宠物照片给宠物建模,是宠物可以有一些动态性,需要怎么做?利用 AIGC 能快速的实现吗?
在手机上通过宠物照片给宠物建模并实现一定的动态性,可以考虑以下几种方式: 1. 利用 3D 引擎:目前有一些公司提供通过手机摄像头快速创建虚拟人身体的服务,例如 NextHuman。不过,3D 引擎在拟真程度高的同时,定制化成本也较高。 2. 借助 AIGC:虽然 AIGC 省去了建模流程,能直接生成数字人的展示图片,但可能存在数字人难以保持 ID 一致性、帧与帧连贯性不佳等问题。典型的相关项目有 wav2lip等。但需要注意的是,如果对模型真实度要求较高,AIGC 方式可能不太理想,因为算法发展很快,未来可能会有更好的连贯度生成方式。 目前利用 AIGC 来快速实现可能存在一些挑战,但随着技术的发展,未来有可能更便捷高效地达成您的需求。
2025-02-13
有没有上传8张照片一键生成短视频的ai
以下是一些可以实现上传 8 张照片一键生成短视频的 AI 工具及相关操作: 1. PixVerse: 网址:https://app.pixverse.ai 操作:涂抹选区,给出相应的运动方向,最后加入配音,剪辑一下即可。 2. 出门问问 Mobvoi: 网址:https://openapi.mobvoi.com/pages/videointroduce 操作: 第一步:api 申请,打开网址,找到视频生成>开始体验>登录>创建应用>查看详情,获取自己的 APP key。 第二步:启动 ComfyUI,打开 json 文件。 第三步:在 api 节点输入第一步获取的 key 进行适配,获取 key 后查看详情找到账号和密码进行输入。 第四步:上传一张照片即可。 3. 即梦: 操作:将图片上传至视频生成模块,用简单提示词描绘画面中的动态内容,可生成时长为 3 秒钟的画面。运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度可选择慢速。
2025-02-09
想通过照片抠图,有没有好用的、免费的、无水印的工具?
以下是一些好用、免费且无水印的照片抠图工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术去除水印,支持多种图片格式,操作简单,可上传图片选择水印区域并保存下载处理后的图片,还提供去除文本、对象等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,适合快速去除水印及社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除多余物体、人物或水印,支持粘贴或上传手机图像,操作方便。 此外,还可以使用以下方式进行抠图: 1. Iphone 手机自带的抠图功能、美图秀秀或一些网站,如 https://www.remove.bg/zh ,直接上传图片即可。 希望这些工具能满足您的需求。
2025-02-09