直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

midjourney中如何结合A图片的人物和B图片的动作和内容

回答

在 Midjourney 中结合 A 图片的人物和 B 图片的动作和内容,可以使用新上线的“Character Reference”(--cref)功能。以下是一些关键方法和示例:

  1. 锚定细节:您可以掌控姿势、表情、情感、服装、道具、场景、动作等细节。例如:“Jo is a young woman with blue curly hair, pink sunglasses, and a colorful scarf around her neck. She waits in line at the bank. --cref https://my.image.host/jo-is-standing.jpg”。
  2. 让 --cref 处理大部分工作:提示无需加强标志性细节,只是“操纵”或“定位”角色。例如:“有人正在银行排队等候。 --cref https://my.image.host/jo-is-standing.jpg”。
  3. 只提供场景:如果您的 cref 图像已包含想要的姿势和其他细节,您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。但可能会出现不连贯的结果,此时可尝试使用更高值的样式化,如“--s 800”。

需要注意的是,此功能在使用 Midjourney 生成的图像人物时效果最佳,不太适用于真实人物或照片。同时,在 Midjourney V6 的 Web Alpha 版本中,您可以通过拖放或粘贴图像到想象栏,并选择相应图标来设置图像为图像提示、风格参考或角色参考。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Midjourney 人物一致性已上线

DavidH:Hey @everyone @here we're testing a new"Character Reference"feature today This is similar to the"Style Reference"feature,except instead of matching a reference style it tries to make the character match a"Character Reference"image.How it worksType --cref URL after your prompt with a URL to an image of a characterYou can use --cw to modify reference 'strength' from 100 to 0strength 100(--cw 100)is default and uses the face,hair,and clothesAt strength 0(--cw 0)it'll just focus on face(good for changing outfits / hair etc)What it's meant forThis feature works best when using characters made from Midjourney images.It's not designed for real people / photos(and will likely distort them as regular image prompts do)Cref works similarly to regular image prompts except it 'focuses' on the character traitsThe precision of this technique is limited,it won't copy exact dimples / freckles / or tshirt logos.Cref works for both Niji and normal MJ models and also can be combined with --srefAdvanced FeaturesYou can use more than one URL to blend the information /characters from multiple images like this --cref URL1 URL2(this is similar to multiple image or style prompts)How does it work on the web alpha?Drag or paste an image into the imagine bar,it now has three icons.selecting these sets whether it is an image prompt,a style reference,or a character reference.Shift+select an option to use an image for multiple categoriesRemember,while MJ V6 is in alpha this and other features may change suddenly,but V6 official beta is coming soon.We'd love everyone's thoughts in ⁠ideas-and-features We hope you enjoy this early release and hope it helps you play with building stories and worlds

Midjourney V6 更新角色一致性命令 "--cref "

处理使用--cref进行提示有三种关键方法。您可以锚定细节(姿势、表情、情感、服装、道具、场景、动作),这样您就能掌控它们;您可以轻轻一触,让--cref处理大部分工作;或者您可以只提供场景给角色,让--cref完全处理所有工作。在这三种情况下,提示将与Midjourney能够从您提供的cref图像中识别的任何角色属性混合在一起。您的提示可以用于锚定角色的重要细节,也可以让cref图像自行贡献所有内容。·锚定重要角色细节的提示示例:注意提示如何强调出现在参考图像中的标志性角色属性。它还“操纵”或“定位”角色。例子:Jo is a young woman with blue curly hair,pink sunglasses,and a colorful scarf around her neck.She waits in line at the bank.--cref https://my.image.host/jo-is-standing.jpg翻译:乔(Jo)是一位年轻女子,头发蓝色卷曲,戴着粉红色太阳镜,脖子上系着一条五颜六色的围巾。她正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·不需要重复标志性细节的无干扰提示示例:注意到这个提示没有尝试加强参考图像中的任何标志性细节,它只是“操纵”或“定位”角色。有人正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·如果您的cref图像已经包含您想要的姿势和其他细节,则还有第三种方式可用:您可以仅描述环境、周围环境、背景或情境。Midjourney将努力将角色融入场景中。如果您选择这种方式,可能会看到一些不连贯的结果。如果是这样,请尝试使用更高值的样式化(--s),例如--s 800。

Midjourney V6 更新角色一致性命令 "--cref "

处理使用--cref进行提示有三种关键方法。您可以锚定细节(姿势、表情、情感、服装、道具、场景、动作),这样您就能掌控它们;您可以轻轻一触,让--cref处理大部分工作;或者您可以只提供场景给角色,让--cref完全处理所有工作。在这三种情况下,提示将与Midjourney能够从您提供的cref图像中识别的任何角色属性混合在一起。您的提示可以用于锚定角色的重要细节,也可以让cref图像自行贡献所有内容。·锚定重要角色细节的提示示例:注意提示如何强调出现在参考图像中的标志性角色属性。它还“操纵”或“定位”角色。例子:Jo is a young woman with blue curly hair,pink sunglasses,and a colorful scarf around her neck.She waits in line at the bank.--cref https://my.image.host/jo-is-standing.jpg翻译:乔(Jo)是一位年轻女子,头发蓝色卷曲,戴着粉红色太阳镜,脖子上系着一条五颜六色的围巾。她正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·不需要重复标志性细节的无干扰提示示例:注意到这个提示没有尝试加强参考图像中的任何标志性细节,它只是“操纵”或“定位”角色。有人正在银行排队等候。--cref https://my.image.host/jo-is-standing.jpg·如果您的cref图像已经包含您想要的姿势和其他细节,则还有第三种方式可用:您可以仅描述环境、周围环境、背景或情境。Midjourney将努力将角色融入场景中。如果您选择这种方式,可能会看到一些不连贯的结果。如果是这样,请尝试使用更高值的样式化(--s),例如--s 800。

其他人在问
生成图片的选项U和V是什么意思
在 Midjourney 中,生成图片后出现的 U 和 V 按钮具有以下含义: U 按钮(Upscale):代表放大图像提升细节。数字代表对应的图像,如 U1、U2、U3、U4。点击 U 按钮可以生成选定图像的较大尺寸版本,并优化更多细节呈现。 V 按钮(Variation):代表在基础上发生变化。数字表示对应的图像,如 V1、V2、V3、V4。选择觉得效果不错的某张图,如第 2 张图,点击 V2,会再生成四个和第 2 张图相似的图像。
2024-12-21
AI图片社区
以下是关于 AI 图片社区的相关信息: 如何判断一张图片是否 AI 生成:要培养鉴别 AI 图片的技能需要训练大脑模型。对于不擅长的朋友,可通过一些网站来判断,如 ILLUMINARTY(https://app.illuminarty.ai/),但测试中可能存在误判,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种表现。 100 个 AI 应用中的相关社区:500px 摄影社区是 AI 摄影比赛平台,利用图像识别、数据分析技术,举办摄影比赛,展示优秀摄影作品;雪球财经 APP 是 AI 金融投资教育平台,利用数据分析、自然语言处理技术,为用户提供个性化的金融投资教育服务。
2024-12-21
图片放大
以下是关于图片放大的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强: https://magnific.ai/ https://www.krea.ai/apps/image/enhancer https://imageupscaler.com/ https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 https://imglarger.com/ https://letsenhance.io/ http://waifu2x.udp.jp/ 在 SD 中进行图片放大: 使用过插件、脚本和后期处理,原理相同,好坏需尝试,因为 AI 生图有随机性。 在 Tiled Diffusion 中,MultiDiffusion 方案适合图像重绘、风格迁移和放大等功能。 四个滑块代表分块大小、分块之间的重叠像素和同时处理的分块数量,数值越大效果越好、速度越快,数值越小占用显存越小,一般保持默认,重叠像素大小建议使用 MultiDiffusion 时选择 32 或 48,使用 Mixture of Diffusers 选择 16 或 32。 Tiled VAE 可极大程度降低 VAE 编解码大图所需的显存字节,分块大小根据电脑情况调节,数值越小占用显存越低。 生成 512x512 的图片,发送到图生图进行重绘,选择熟悉的放大算法和所需的放大倍数,重绘幅度设置为 0.35,放大算法下面的噪声反转可在重绘前对原图像进行噪声图反推,让放大的图片更接近原图。 在 SD 中文生图的相关提示词: Stable Diffusion 的生成方式主要分为文生图和图生图两种,文生图仅通过正反向词汇描述发送指令,图生图除文字外还可给 AI 参考图进行模仿(垫图)。 文本描述分为内容型提示词和标准化提示词,内容型提示词用于描述想要的画面,例如:1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面(使用翻译软件翻译成英文)。 采样迭代步数通常控制在 20 40 之间,采样方法常用的有:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。 比例设置为 800:400,高宽比尽量在 512x512 数值附近,太大的数值会使 AI 构图奇怪,可同时点选高清修复来放大图像倍率。
2024-12-20
你可以根据问题说生成PPT或者图片吗
以下是关于生成 PPT 或图片的相关内容: 增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成,包括图片、PPT、PDF 等。例如,在对话框输入诉求“生成常见的系统架构风格架构设计图”即可生成相应图片,输入“帮我生成一篇包含以上架构风格的完整 PPT”可生成 PPT 幻灯片内容及相关模板选择,输入“根据上面的架构风格,制作一篇常见系统架构风格的 PDF 文件”可生成相应的可选模板。 在 MJ 应用中,为 PPT 配图可通过复制图像链接和提示词,在 discord 中输入相应命令生成图像。生成后可改变比例和镜头拉远,检查构图,选择合适的图放入 PPT 调整构图。 在制作课程时,可通过一系列提问模板让 ChatGPT 协助创作章节内容,并将其转换成 PPT 格式,还可加入学员案例、参考范例让其进行改写或续写。
2024-12-19
如何通过图片素材,自动剪辑视频
以下是通过图片素材自动剪辑视频的步骤: 1. 访问 Adobe Firefly 网站(https://firefly.adobe.com/),选择“生成视频”。 2. 在“生成视频”页面的“提示”字段中输入文本提示,您还可以使用“上传”选项在“图像”部分使用图像作为第一帧,并为视频剪辑提供方向参考。添加图像以提供清晰的视觉引导,使生成的视频更紧密地与您的愿景对齐。 3. 在“常规设置”部分,确定“宽高比”和“每秒帧数”。 4. 在“高级”部分,您可以使用“种子”选项添加种子编号,以帮助启动流程并控制 AI 创建内容的随机性。如果使用相同的种子、提示和控制设置,可以重新生成类似的视频剪辑。 5. 选择“生成”。 此外,关于生成视频的常见问题解答: 视频模型可能需要裁剪您的图像以适应所需的图像大小,这是从中心完成的,可能会丢失边缘部分图像。要自己裁剪图像,可以使用 Adobe Express 等 Adobe 应用程序。 种子是帮助启动流程的数字,控制 AI 创建内容的随机性。如果使用相同的种子、提示和控制设置,可以重新生成类似的资源。如果更改了提示、上传的图像和控制等属性,则使用相同的种子。如果属性保持不变,则会生成新的种子。 当更改任何设置或提示时,种子将保持不变,这可能导致生成的人物在种族、民族或肤色方面看起来相似。在“高级设置”下更改种子编号可能会改变人物的种族、民族或肤色。
2024-12-19
我想用AI把图片生成营销视频
以下是关于用 AI 把图片生成营销视频的相关信息: 生成式人工智能在营销中的应用:DALLE 2 和其他图像生成工具已被用于广告,如亨氏使用番茄酱瓶的图像和类似标签论证“这就是人工智能眼中‘番茄酱’的样子”;雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌;Stitch Fix 服装公司使用 DALLE 2 根据客户偏好创建服装可视化;美泰使用该技术生成玩具设计和营销的图像。 判断图片是否为 AI 生成:AI 作画的画质画风偶尔会波动,不像人类画师作品质量大多稳定向上发展,AI 就像皮下雇佣无数画技参差不齐画手的批皮营销号,画质质量胡乱。 制作商业级 AI 视频广告的出图方法:MJ 出图质量稳定,使用门槛低,暂时无其他替代工具。常规操作是登录 Discord 网站,打开 MJ 服务器出图,通过/imagine 命令输入提示词生成图片。若想提高效率,可使用 Autojourney 插件,它是电脑浏览器的一个插件,能批量发送提示词、自动下载图片、自动放大图片、生成提示词等,在浏览器拓展程序中下载安装,激活后将 MJ 出图提示词复制到插件中即可自动批量出图,一次可输入 10 组提示词。
2024-12-19
MidJourney的地址
Midjourney 的官网地址为:https://www.midjourney.com 。在官网上,已向生成 100 张以上图片的用户开放使用权限。登录后,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。
2024-12-17
midjourney的提示词
以下是关于 Midjourney 提示词的相关内容: Midjourney V6 更新风格参考命令 2.0 中,将 sref 和 URL添加到提示的末尾,可利用风格参考图像的视觉风格创建新图像。例如:“A young man stands at the edge of the forest cliff,looking over the ocean below.sref https://s.mj.run/9DFZsjKwkyEv 6.0”。使用“风格参考”图像的魔力在于 Midjourney 会努力捕捉参考图像的美学特质而非语义内容,新提示本身没有美学内容有助于 sref 的执行。 学习 Midjourney 可以采取以下步骤: 1. 注册 Discord 账号并加入 Midjourney 服务器,Midjourney 也有在线版本可直接使用。 2. 掌握 Midjourney 的提示词(Prompt)结构,了解其基本组成部分,如“主体”“媒介”“环境”等,学习构建有效的 Prompt 来生成理想图像。 3. 熟悉 Midjourney 的常用参数和命令,如放大、细节等参数设置,掌握常用命令如 /imagine、/test 等。 4. 针对不同应用场景练习创作,如插画、游戏、框架等,通过实践提高 Prompt 编写和图像生成技巧。 5. 学习他人的优秀作品并进行模仿,观察和学习其他用户的 Prompt 技巧,通过模仿练习提高创作水平。 如果您有疑问或者需要帮助,可以尝试使用以下命令: 1. /help 显示有关 Midjourney Bot 的有用基本信息和提示。 2. /ask 获取问题的答案。 如果需要更多帮助,可以访问 Midjourney Discord 上的 频道。Midjourney Bot 可以通过输入指令与其进行交互,指令可用于创建图像、更改默认设置、监视用户信息等。提示(Prompt)是 Midjourney Bot 解释为生成图像的短文本短语,Bot 将提示中的单词和短语分解成较小的片段作为标记,这些标记与其训练数据比较后用于生成图像,精心制作的提示可帮助生成独特和令人兴奋的图像。Bot 频道是 Midjourney Bot 被允许处理斜杠指令的 Discord 频道。 网站原文请查看:
2024-12-16
Midjourney 提示词工程
以下是一些关于 Midjourney 提示词工程的相关内容: 图像类 Prompt 网站: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,网址: MidJourney Prompt Tool:类型多样的 prompt 书写工具,点击按钮就能生成提示词修饰部分,网址: OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便您快速可视化生成自己的绘画提示词,网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney,网址: OpenArt:AI 人工智能图像生成器,网址: img2prompt:根据图片提取 Prompt,网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,网址: AiTuts Prompt:AiTuts Prompt 是一个精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供您选择,网址: Midjourney 最新编辑器更新,可上传图片重新绘制的相关问题与使用: 常见问题: 如果您提出极其不合适的请求,或者您要求修改一个非常小的区域,可能无法得到预期的结果。 如果您在场景中放了一个很小的头部并要求进行外绘,生成的身体可能会太大(所以请将头部放大一些)。 重纹理化:是一种通过使用另一张图像来引导图像结构或构图的方法。您将从构图引导图像开始(您在全功能编辑器中上传或链接的基础或母图像),然后使用提示词和参数来添加所需的细节。基础图像成为提示词的构图基础,或称为框架。事实上,在以前的 Midjourney 版本中,这种方法被称为“框架搭建”。在全新功能编辑器中,选择一个您喜欢的一些构图元素的基础图像。上传它或链接。然后编写控制该构图最终呈现的提示词。例如,如果你有一张三颗玻璃球的图片并提交提示词“三只刺猬”,那么这些玻璃球将“变成”刺猬。 右侧显示的缩略图:显示器右侧的缩略图显示的是您最近几次编辑会话的记录。左边稍大一点的缩略图是您的母图像,即您上传或链接的图像。其他四张缩略图是子图像,展示了 Midjourney 根据您的提示生成的四种不同表达方式。每次您在不改变选择区域的情况下对母图像进行编辑时,会生成一个新的缩略图行,这样您对该选择区域的所有编辑都会方便地聚在一起。不过,如果您更改了提示词,新提示词对应的图像会显示在子图像中,而不会显示在母图像所在的那一行。 按钮:(未给出具体解释)
2024-12-13
midjourney下载
Midjourney 下载方式如下: 从成本和小白理解力的角度,推荐先尝试悠船。最近新注册有免费的社区福利。下载网址为:www.youchuanai.com 。在悠船桌面端进行新用户注册,输入离谱村专用激活码(296976)即可完成注册。 Midjourney 中文版内测开放,下载网址为:www.youchuanai.com 。 悠船桌面端网页版登录:https://desktop.youchuanai.com//login 。 需要注意的是,现在 Midjourney 没有免费计划了,需要直接付费。试用用户可以免费使用大约 25 次 Jobs(操作次数)。Jobs 目前不会过期,但也不会自动续订。如需生成更多图像,请在任何机器人频道中使用/subscribe 指令来生成到 midjourney 账户页面的个人链接。请不要与他人共享此个人链接。获取价格和更多信息,请访问。同时,请确保您使用的是现有的 Discord 帐户进行登录。
2024-12-08
midjourney学习
学习 Midjourney 可以采取以下步骤: 1. 注册相关账号:注册 Discord 账号并加入 Midjourney 服务器,Midjourney 也有在线版本可直接使用。 2. 掌握提示词结构:了解 Prompt 的基本组成部分,如“主体”“媒介”“环境”等,学习构建有效的 Prompt 来生成理想图像。 3. 熟悉常用参数和命令:学习 Midjourney 的各种参数设置,如放大、细节等,掌握常用命令,如/imagine、/test 等。 4. 针对不同场景练习创作:尝试针对插画、游戏、框架等不同场景进行创作练习,通过实践提高 Prompt 编写和图像生成技巧。 5. 学习他人作品并模仿:观察和学习其他用户的优秀作品,了解他们的 Prompt 技巧,通过模仿练习提高创作水平。 训练 Midjourney 的 prompt 流程:可以把 mj 的官网的说明书喂给 gpt,让它根据说明一步步了解机制和结构,给出适合的提示词。如果 mj 的官网说明更新了,大家可以自主替换,也可以用这个方法去学习一些其他技能。 在 AI 绘图领域,Midjourney 家喻户晓。它有许多优点,模型强大,能生成高质量图像,可充分个性化设置。但使用过程不太便捷,需要通过 Discord 应用加入 Midjourney 频道或创建自己频道并邀请 Midjourney 机器人才能生成图片。从学习难度看,Midjourney 学习曲线陡峭,在用户体验和易用性方面有待改进。
2024-12-06
midjourney教程
以下是关于 Midjourney 的教程: 1. 利用一致性 MJ 出海马体写真: 超低学习成本,会用任意手机修图软件就能解决 Midjourney Cref 角色一致性直出之后“形似而神不似”的问题。 得益于 cref,midjourney 能够迅速达成角色一致性的目的而无需 Lora。cref 代表 character reference(角色参考),cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。若只想关注人脸,可将其调低到 0。 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,cref 会完成此事。 风格复制和服装的替换,应当用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 举例:要海马体这张图像,先用 /describe 指令反推海马体的提示词,再配合 sref,就可轻松复制图像风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些之前学过的有用的 prompt。 最后,Upscale 最满意的那一张。 2. 线稿上色 Midjourney + Stable Diffusion: 用 midjourney 生成线稿,PS 稍微做一些修正,再用 controlnet 控制,stable diffusion 上色,多套 AI 组合拳,可快速生成效果惊艳的图。 线稿产出的 mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white background niji 5 style expressive。 有些图出来没有阴影容易飘,可以自己画一个出来。 3. AI 线上绘画教程: 工作中需要大量图片时,AI 生图是高效的解决办法,主流工具如 midjourney 付费成本较高,stable diffusion 硬件门槛不低,但有像这样的免费在线 SD 工具网站。 本教程适用于入门玩家,计划让读者用半个小时就能自由上手创作绘图,若半个小时不足以理解工具如何使用,可联系作者。 教程内容会持续更新,欢迎关注和催更。
2024-12-06
视频导出动作的AI
以下是关于视频导出动作的 AI 相关信息: AI 视频导出方面:普通社交媒体分享选 1080P,需放大选 720P,码率越高越好,可自定义最高 5 万。 Move AI 推出的 Move API 能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据,相关链接为 https://move.ai/api 。
2024-11-05
动作姿态生成的网站
以下为一些关于动作姿态生成的网站相关信息: 在 Stable Diffusion 中,ControlNet 是一个强大的控制插件。对于姿态约束,您可以通过以下方式操作: 1. 国风 3 模型点击生成姿势,但 AI 识别可能不准确,需耐心刷图和调整参数。 2. 若要细化图片,可使用扩展图片的方法,将图发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再用 ControlNet 中的 tile 模型细化,最后使用 SD 放大插件。 3. 当找不到满足需求的动作图片时,可以自定义动作骨架。在【扩展】【加载扩展列表】中搜索【posex】安装插件(若安装不了,可将分享的插件文件夹拷贝至...\\sdwebuiakiv4\\extensions 目录,确保软件为最新版本后重启)。重启后来到首页,点击“将图片发送至 ControlNet”,可通过鼠标操作调整视角。如调一个玛丽琳梦露的经典动作,右边可调整出图尺寸,启用 ControlNet 时,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型即可。 另外,公众号【白马与少年】有不同 pose 的骨架图可供参考,回复【SD】获取。该公众号还分享 Stable Diffusion、Blender 等学习心得,有 139 篇原创内容持续更新。
2024-11-01
动作姿态生成
以下是关于动作姿态生成的相关内容: 在使用 Stable Diffusion 进行动作姿态生成时,可采用以下方法: 1. 利用 ControlNet 中的姿态约束功能,如国风 3 模型,点击生成姿态,但可能存在骨骼错位等问题,需要耐心刷图和调整参数。同时,还收集了不同 pose 的骨架图,可通过添加公众号【白马与少年】回复【SD】获取参考。 2. 对于人物绘制,先确定人物动作,可在草图基础上用 Clip Studio Pro 中的 3D 人物模型进行姿态调整,或使用其他 3D Pose 类软件生成人物姿态,然后使用 ControlNet 的 Openpose 功能生成人物姿态。为控制人物色彩,可采用合适图片放入 img2img 中调整 Denoising strength,或使用 ControlNet Color 等插件,过程中需进行 img2img 反复迭代,并适时加入背景元素,人物大致确定后用 photoshop 融合,再继续生成和调整。 3. 对于特殊物品如天狗面具,若 Stable Diffusion 没有合适模型和 Lora,可自行训练专用 Lora,使用时用 inpainting sketch 重绘或在 Photoshop 处理后进入 img2img 重绘,注意重绘区域要小。 4. 对图片进行细化时,可使用扩展图片方法,将图发送到图生图,用 ControlNet 中 tile 模型细化,再使用 SD 放大插件。若找不到满足需求的动作图片,可在【扩展】【加载扩展列表】中搜索【posex】插件,安装或拷贝至指定目录,重启软件后在首页点击“将图片发送至 ControlNet”进行操作,可通过鼠标操作调整视角,调动作时启用 ControlNet,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型。
2024-11-01
会自动作美女跳舞视频的AI
以下是为您提供的关于能自动制作美女跳舞视频的 AI 相关信息: XLabsAI 发布了 6 个不同的 Lora,分别是: 1. mjv6_lora Midjourney 风格,示例为:A fullprofile portrait of a Chinese dancer poised on a moonlit stone bridge, surrounded by the delicate blooms of a cherry orchard. Her silk garments ripple with her movement, her eyes are focused and intense, with skin details on her face. She's part of a scene inspired by classical poetry, her fluid motions a dance of elegance. The luminance is delicate and dreamlike, bestowing a soft ambience. 2. realism_lora 写实风格,示例为:In a conference room setting, a beauty women dressed in business attire are attending a meeting,random expressions, postures, and physical characteristics. A RAW ultrarealistic photo, UHD, 8k. 3. anime_lora 动漫风格,示例为:1girl. 4. disney_lora 迪斯尼风格,示例为:1cat, cartoon, disney. 5. scenery_lora 风景风格,示例为:A breathtaking view of the Himalayas mountain range, showcasing its majestic and serene beauty. The mountains are covered in snow, with their peaks reaching towards the sky, creating a stunning contrast with the blue horizon. The range is vast and imposing, with numerous towering peaks, including Mount Everest, the highest point on Earth. The scene captures the grandeur and tranquility of the Himalayas, with sunlight casting a soft glow on the snowcovered slopes. The foreground shows the rugged terrain and lush greenery of the lower elevations, adding to the diverse and spectacular landscape. 6. art_lora 艺术风格,示例为:Cat, European street, exploration, cozy, mysterious, colorful buildings, sunlight through leaves, cobblestone path, high definition, watercolor painting, warm tones, bright lighting effects, paper texture. Lora 下载地址:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs
2024-09-21
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
Changer软件能实现视频中人物的无缝换头吗
Changer 软件可以实现视频中人物的无缝换头。以下是一些相关的操作指引和注意事项: 上传原始视频和换脸图片,点击生成,即可自动识别视频中的人脸并进行替换。 在 TecCreative 创意工具箱中,操作指引为:上传原始视频——上传换脸图片——点击生成。 实战中,通过 JupyterLab 工具中的终端输入相关命令启动 facefusion 程序,在 facefusion 软件界面上传准备好的图片、视频,可看到预览效果,点击开始按钮执行换脸处理,完成后可下载处理后的视频。 此外,还有其他与图片和视频处理相关的方法和技巧,例如利用 MJ 画图、InsightFaceSwap 插件等进行处理。
2024-12-17
国内大模型领域关键人物、关键院校
以下是国内大模型领域的关键人物、关键院校及相关信息: 8 月正式上线的国内大模型: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 目前不能进行自然语言交流的:昇思、书生 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 特色功能:昇思——生图,MiniMax——语音合成 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 中文大模型评测收集与调研: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:地址:https://github.com/OpenLMLab/GAOKAOBench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现 中国大模型面临的真实问题: OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
2024-12-16
gpt是否可以识别图片中的人脸、人物
GPT 可以在一定程度上对图片中的人物进行识别和描述。例如,可以利用 GPT 的识图功能对人物照片的内容进行细致描述,包括人物的年龄、发型、肤色、五官、穿着、表情等方面,还能对人物所处的背景进行分析。但需要注意的是,其识别和描述的准确性可能会受到多种因素的影响,如图片的质量、清晰度、复杂程度等。同时,对于 GPT 是否能准确识别所有人脸和人物,还存在一定的不确定性和局限性。
2024-11-24
请问现在好用的AI图片生产工具有哪些,对人物一致性要求高
以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高: 1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。 另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。
2024-11-23
可以根据照片生成人物的AI软件
以下是一些可以根据照片生成人物的 AI 软件: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photomaker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20 HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
2024-11-22