Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?

Answer

在处理您提到的这种情况时,有以下一些建议和方法:

  1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。
  2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。

不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。

Content generated by AI large model, please carefully verify (powered by aily)

References

卡兹克:我们花了10天时间,给CCTV6做了一部AI短片 - 5000字全流程复盘拆解

我只能在此呼吁一下Dreamina:求求了,啥时候这个蠢问题,赶紧改了吧。。。Dreamina对Prompt的语义理解非常好,强烈推荐大家把运动速度设为慢速,我经常喜欢慢速+Prompt里面写轻微XX。会有很不错的效果。另一个Dreamina非常智障的一点是,只有8帧+720P,对比Runway这种24帧+4k的,基本约等于没法用。所以还是需要Topaz Video AI去增强到24帧+4K的。Topaz Video AI的教程我就不在这里细说了,给大家一个关键词:Topaz Video AI 4.2.1,拿着这个关键词,去B站搜教程,又好用又简单,非常方便。增强完以后,再扔到剪映里,裁成21:9,这一套就算是齐活了。AI视频的趴写了这么多,基本已经能处理大部分的效果了。但是,很多东西,依然是AI搞不定的。比如人物在水中下沉的时候,不管你用哪家AI视频,脸必糊,跟恐怖片一样。这种糊脸,在视频里,讲道理是无法接受的,太恐怖,也太让人出戏。于是,就只能上传统AE,自己做,反正就是个普通的下沉位移动画。跑了个静态图。

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

(这张双人关系的图我最后没用,因为四个工具都跑不出稳定的视频,我懒得Roll了)(角色一:扎马尾、穿白色T恤、穿牛仔裤的14岁女孩)(角色二:戴眼镜、灰色头发、穿灰色短衬衫的50岁男人)接着,确定了主场景,主场景是四面都是书柜的屋子,但是场景一致性太难保持了,所以我们取巧,用了穿书的方式,把场景分布到不同地区。在室内的镜头,因为AI对书房的理解也还比较相似,尽管有些穿帮的地方,还好主场景出现的时间不算长,倒也还能接受。解决了人物和场景一致性的问题,生图的障碍就还是双人关系镜头的部分。但这次要比上个视频做起来稍微容易一些,因为至少生成关系镜头没有那么麻烦了,MJ的语义理解好多了,部分镜头我们还比较喜欢,比如女孩能在镜子里看到妈妈这个镜头。但我们要自由地生成同场戏内不同角度的关系镜头,还是很难。比如女孩发现不对劲之后,回到书店,问阿叔怎么回事,阿叔没有说话,女孩生气离开这场戏,其实还需要一个两人在书店走廊里的中景或全景镜头,去展示两人的位置关系,但Roll得有点累了。

AI拍电影丨AI脚本+AI视频+AI配音

1.视觉风格:确保赛博朋克的视觉元素(如霓虹灯、高科技界面、未来感城市景观)与《山海经》中神兽的古典形象相协调。使用先进的特效技术来创造神兽的逼真和神秘外观。2.音效与配乐:使用融合传统东方乐器和现代电子音乐的配乐,以增强视频的神秘感和未来感。音效在塑造氛围和强化视觉元素上起着关键作用。3.叙事节奏:考虑到视频长度有限,叙事节奏需要紧凑而流畅。确保每个场景都能有效地推进故事,同时保持观众的兴趣。4.角色设计:主角的形象设计应与赛博朋克环境和神兽的神秘感相协调。他们的服装、装备应体现未来科技的特点,同时在与神兽的互动中显示出好奇和敬畏。5.文化元素的融合:在尊重《山海经》文化精髓的基础上,巧妙融入赛博朋克元素。例如,可以通过高科技设备来解读或与神兽交流。6.观众参与:考虑在视频中加入悬念或互动元素,如隐藏的线索或暗示,鼓励观众进行讨论和猜测。7.后期制作:精心调整色彩、光影和特效,以确保最终视频的视觉效果符合预期。不要忽视细节,因为它们对于营造一个引人入胜的世界至关重要。

Others are asking
我想用自己训练的卡通形象lora生成一张元宵节放孔明灯的海报,应该怎么制作
以下是用自己训练的卡通形象 lora 生成元宵节放孔明灯海报的制作方法: 1. 关键词: 模型:dreamshaper_8 正关键词:,white,white_background,CGposterrender bsw <lora:电商新年海报 2024_v1.0:0.4>,gold,<lora:新年红包封面_v1.0:0.6>,new year,<lora:gcbottle:0.3> 中文的关键词:(杰作,高分辨率,高品质,高分辨率)中国建筑,红色主题,剪纸,中国结,纸灯笼,中国图案,金色,中国元素,红色背景 2. ControlNet 设置: 预处理器:depth_leres 模型:control_v11f1p_sd15_depth 权重:0.75 预处理器:softedge_pidinet 模型:control_v11p_sd15_softedge 权重:0.3 3. lora 资源: https://www.liblib.ai/modelinfo/bddf824e232f4124991c05a26027504d https://www.liblib.ai/modelinfo/983703dd48134e43983b84abfcb44308 第三个东方瓷器 lora 已经下架(请至 AGI 之路百度云下载) 链接:https://pan.baidu.com/s/10hYM8i2y2Li9OlT2oD1qOQ 密码:asub 您可以参考以上步骤进行制作,同时您还可以访问以下链接获取更多相关信息: 作者小红书:https://www.xiaohongshu.com/user/profile/5cfd0e600000000016029764?wechatWid=803c253b00ed4224d3a2adcd80b46ed7&wechatOrigin=menu 通往 AGI 之路小红书教程:http://xhslink.com/OOeHsy AI 春晚阶段性纪实:https://waytoagi.feishu.cn/wiki/MI0UwhfXJiRH9ak4dwxcwqPVnIh
2025-02-08
如何用自己的形象做卡通数字人?
以下是用自己的形象做卡通数字人的方法: 1. 简单提示词方法: 在聊天窗口输入/imainge找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5是设置参考图片的权重,数值越高与参考的图片越接近,默认是0.5,最大是2,可选择中间的某个值并调整。 s 500设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为01000间任意整数。 v 5是指用midjourney的第5代版本,这一代的最真实,目前v5需要订阅付费,不想付费可以使用v 4。 no glasses是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以戴上这个设置,让它不戴眼镜。 完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的效果不满意,可以调整s和iw的值来进行多次尝试。 2. 剪映生成数字人方法: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。剪映App会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。 左下角会提示渲染何时完成,然后可点击预览按钮查看生成的数字人效果。 增加背景图片: 直接删除先前导入的文本内容,因为视频中的音频已包含文字内容。 鼠标点击下方代表文字的轨道,或点击软件中间文字内容,按删除键删去文字。 点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。 选择一张图片上传,点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。 书架图片所在的轨道会在视频轨道的下面添加一条新轨道。 点击轨道最右侧的竖线,向右拖拽,直到视频的最后,与视频对齐。 背景图片所在的轨道若没选中,鼠标点击一下这个轨道即可。 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口,并将数字人拖动到合适的位置。 3. 复杂提示词方法: 如果觉得简单提示词生成效果不好,可以选择更为复杂一点的提示词,比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5。 不同照片生成:如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。 其他调整:如果觉得Disney风格的头像太过卡通,可以把提示词里面的Disney都换成Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的boy换成girl。每次会生成4张图片,如果对某一张图片满意,点击下方的U1~U4生成大图,如果对风格满意但是需要调整,点击下方的V1~V4进行修改。
2025-02-07
如何把拍照头像生成一个卡通头像logo
以下是将拍照头像生成卡通头像 logo 的方法: 1. 复杂提示词: 如果觉得简单提示词不够好,可以使用更复杂的提示词,例如:“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 效果示例: 不同照片生成:如果对照片风格不满意,可以更换新照片并使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的“Disney”换成“Pixar”;如果是女孩,可以把“boy”换成“girl”。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 操作步骤: 准备工作:如果还没有 Midjourney 账号或不懂基础操作,可以参考之前的教程,如“”。 上传图片:在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。然后图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。 输入提示词:在聊天窗口输入“/imainge”找到“/imagine prompt”,把刚才的链接放进去,然后空格,加一些提示词(以英文逗号分隔),最后再加上设置参数。 设置参数: “iw 1.5”设置参考图片的权重,数值越高与参考图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 “s 500”设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 “v 5”指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可以使用“v 4”。 “no glasses”指不戴眼镜,如果不喜欢戴眼镜的图片,可以加上这个设置。 完整的提示词示例(替换您的 png 图片地址):“simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5”。如果对生成效果不满意,可以调整“s”和“iw”的值进行多次尝试。 您还可以参考“科技小飞哥”的通俗易懂的教程,原文链接:https://leftpocket.cn/post/ai/cartoon/
2025-02-06
请推荐一下你知道的人物头像转卡通图的平台,要求效果好,和原图相似度高,最好是免费的
以下为一些人物头像转卡通图效果好、与原图相似度高且可能免费的平台及相关操作技巧: 1. Stable Diffusion: 可以使用【X/Y/Z plot】脚本来做参数对比,将 X 轴设置为提示词相关性(取值范围 1 30,每次增加 5),Y 轴设置为重绘幅度(取值范围 0 1,每次增加 0.2)。 提示词相关性在 6 11 中间为最佳,重绘幅度 0.4 时和原图比较接近。 可使用绘图功能,如增加红色眼镜、去掉衣服图案等,局部重绘可只改变涂抹部分。 2. 复杂提示词: 如 Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 。 可根据需求调整提示词,如将 Disney 换成 Pixar,boy 换成 girl 等。 3. 通用人物模版: 用真人照片+照片描述+方法 1 的关键词来处理。 需要注意的是,不同平台的效果可能因图片和操作而有所差异,您可以自行尝试。
2025-02-06
设计卡通头像
以下是使用 Midjourney 设计卡通头像的方法: 1. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间的某个值并调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 Midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses 是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以加上这个设置,让它不戴眼镜。 完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的结果不满意,可以调整s 和iw 的值进行多次尝试。 2. 复杂提示词: 如果觉得简单提示词不够好,可以选择更复杂的提示词,比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5。 效果展示:不同照片生成,如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。 其他调整:如果觉得 Disney 风格的头像太过卡通,可以把提示词里面的 Disney 都换成 Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的 boy 换成 girl。 每次会生成 4 张图片,如果对某一张图片满意,点击下方的 U1 U4 生成大图,如果对风格满意但是需要调整,点击下方的 V1 V4 进行修改。 此外,做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/ 。之前制作了一篇视频,教大家怎么从零开始使用 Midjourney 并通过简单的提示词来生成图片。今天教点高级的知识,利用 Midjourney 的以图绘图功能来生成属于您的迪斯尼卡通风格的头像。要生成一张 Disney 风格的头像,先选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击+,然后点击上传文件,选取图片,然后在聊天框发送(记得这里一定要点击回车或发送按钮)。然后图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,这个链接就是这张图片的链接,复制下来。可以使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求来生成特定的图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程:
2025-01-26
照片生成卡通头像
以下是关于照片生成卡通头像的相关内容: 通用人物模版: 如果想用真人照片生成卡通头像,可以使用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在操作过程中,如果生成了满意的图,一定要记得存起来,下次想要同种类型的可以直接拿来喂图,效果更好。 个性操作: 1. 复杂提示词:例如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 2. 不同照片生成:如果对照片风格不满意,可以更换新照片使用上述提示词重新生成。 3. 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的 Disney 换成 Pixar;如果是女孩,可以把提示词里的 boy 换成 girl。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。 背景和基础操作: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的教程。今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格的头像。先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号或不懂基础操作,可以查看之前的教程,如“”。 做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/
2025-01-04
在midjourney一个画布中放置多个角色,使用pan功能添加了新的画布,怎样把新的人物描述和新人物的--cref添加到新的画布中?
在 Midjourney 中,要在一个画布中放置多个角色并将新人物描述和 cref 添加到新画布中,您可以按照以下步骤操作: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加它们。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 另外,语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,希望对大家有所帮助,地址:https://www.yuque.com/frannnk7/f7《AIGC Design 手册》
2025-03-06
基于--cref的多个人物角色出现在一个画布中,具体该如何操作?我想要详细的步骤
基于 cref 在一个画布中放置多个人物角色的操作步骤如下: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个箭头都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加。 设置画布以描绘两个人的开场提示。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,地址:https://www.yuque.com/frannnk7/aidesign?《AIGC Design 手册》
2025-03-06
用AI生成角色原画的现状
目前,用 AI 生成角色原画既有优势也存在一些问题。 优势方面: Niji·journey 5 作为表现优异的在线二次元角色设计 AI,能在各种类型的二次元设计中发挥重要作用。 对于游戏中的角色设计,AI 设计可以提供参考和辅助。 问题方面: Niji·journey 5 存在对流行二次元风格的偏好、风格相对固定以及版权风险等局限性。 AI 设计生成的角色往往需要进一步修饰和调整以符合游戏整体风格和要求,不能完全掌握角色设计的细节和规律。 AI 绘画生成的设计可能存在版权问题。 未来展望: Niji 有望通过改进算法和扩大数据样本来源,提升角色设计的创新性和独特性,满足不同用户和项目的需求。 随着技术进步,Midjourney 等 AI 不断升级,使用 AI 辅助游戏美术设计师工作将成为趋势。但美术设计师需不断学习新技能和知识,拓展多领域知识,以应对未来变化和挑战。游戏美术中各职业分类的界限可能会越来越模糊。
2025-03-03
角色指令设计入门
以下是关于角色指令设计入门的相关内容: SD 角色设计: 绘制一致性多角度头像: 大模型:majicmixRealistic_v6.safetensors 正向提示词:,auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography 负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w 参数设置:迭代步数 50,采样方法 DPM++2M Karras,尺寸 1328×800px MJ 手册·快速入门: 角色人物公式:人物姓名(命名)+描述词(重要描述词和人物特征描述词)+风格+官方命令词 3D 公式:主体+描述词(重要描述词和物体特征描述词)+风格+灯光+官方命令词 插画公式:主题描述词语+风格(风格名称或画家)+描述+颜色灯光+官方命令 特定公式: 连续场景变化公式: 1)角色/场景公式:上传图片(喂图)+人物描写(融入其他场景需要关键词 white background,结合场景后换成 walking in a futuristic cyberpunk city)+场景风格描写+官方命令 2)木偶公式:人物图片+场景+人物+动作+风格+官方命令 3)等距粘土公式: 1. 等距+物体+max emoji(表情符号),soft(柔和)lighting soft(柔和光线)pastel colors/pastel background(背景)+3Dicon+clay(粘土)+blender 3d+背景颜色=等距粘土物体 2. 安子布莱斯娃娃/也可以换成其他知道的娃娃名称+灯光/颜色/背景/材质+clay(粘土)+良奈吉友画风/或者其他名人风格=人 4)3D 图标公式(未测试,可用):喂图(1~3 张相似的风格)+描述的 icon(和喂图一致的关键词)+颜色(和喂图颜色一致的)+渲染词+官方命令 通用公式:角色/物体描述+背景描述+灯光风格+官方命令 Midjourney V6 更新角色一致性命令“cref”: 角色参考(或cref)将帮助您在不同图像中获得大致相同的角色,“角色”是指任何类人物形象。cref 参数允许我们根据我们通过 URL 提供的现有角色图像来创建大致相似的角色。 角色属性对于cref 参数效果良好的包括显著的标志性特征,如蓝绿色卷曲头发、粉红色太阳镜、及膝风衣、绿色背包;效果不佳的包括细小的细节,如一个银色吊坠项链,上面有八个小金字塔形宝石,一件左袖缺失的皮夹克,背后写着“ZOOM”,夹克是袖子缺失的设计,两侧夹克缘处有无限符号剃掉的发型。 准确的使用方法可参考频道说明,地址链接:https://discord.com/channels/662267976984297473/1216877089286787222
2025-02-27
如何制作动漫角色工作的AI视频
以下是制作动漫角色工作的 AI 视频的相关方法和建议: 一、准备工作 1. 想出点子 最佳免费选项: 付费选项:4.0,但由于与互联网连接,必应可能更好 2. 选择工具 用于在视频中为人脸制作动画的。 用于从文本创建视频的 最佳语音克隆: 二、制作流程 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 三、解决技术问题的策略 1. 面对一致性的挑战时,尽可能保持叙事性内容中角色的关键特征和外轮廓的一致。 2. 保持角色的位置一致性。 3. 减少故事中需要观众记住的角色数量。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。同时,深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。
2025-02-17
角色:你是一名房地产开发公司的总经理 背景:现在要在公司内部推广AI工具的使用,通过具体AI工具解决公司内部各部门具体问题,来提升工作效率。 任务:请你完成年度AI提升工作效率的工作策划, 要求:工作策划要有目标、行动计划、团队人员需求及分工、具体AI工具及对应解决的问题、需要费用明细及资源需求、有哪些风险点
由于您提供的内容中没有具体的相关信息,以下为您生成一份较为通用的房地产开发公司年度 AI 提升工作效率的工作策划示例,您可以根据实际情况进行调整和完善。 一、目标 通过在公司内部推广 AI 工具的使用,在本年度内实现各部门工作效率提升 30%以上,降低人力成本 15%左右,提高项目质量和客户满意度。 二、行动计划 1. 第一季度 进行市场调研,了解适合房地产开发行业的 AI 工具。 组织内部培训,让员工初步了解 AI 工具的应用。 2. 第二季度 针对各部门需求,选择并引入相应的 AI 工具进行试点应用。 建立数据收集和分析机制,为 AI 工具的优化提供支持。 3. 第三季度 对试点部门的应用效果进行评估和总结。 根据评估结果,对 AI 工具进行调整和优化。 4. 第四季度 在全公司范围内推广成熟的 AI 工具应用。 对全年的 AI 应用效果进行总结和评估。 三、团队人员需求及分工 1. 成立 AI 推广小组 组长:负责整体工作的规划和协调。 技术专家:负责 AI 工具的选型、配置和技术支持。 培训师:负责组织员工培训和指导使用。 数据分析师:负责收集和分析数据,为工具优化提供依据。 部门联络人:每个部门指定一名联络人,负责与推广小组沟通本部门的需求和问题。 四、具体 AI 工具及对应解决的问题 1. 智能客服系统 解决客户咨询响应不及时的问题,提高客户满意度。 2. 项目管理 AI 工具 优化项目进度安排和资源分配,提高项目管理效率。 3. 市场分析 AI 工具 精准分析市场趋势和客户需求,为项目定位提供依据。 五、需要费用明细及资源需求 1. 费用明细 AI 工具采购费用:万元。 培训费用:万元。 技术支持和维护费用:万元。 数据采集和分析费用:万元。 2. 资源需求 服务器和存储设备,以支持 AI 工具的运行和数据存储。 足够的网络带宽,确保数据传输的流畅性。 六、风险点 1. 员工对新技术的接受度和适应能力可能较低,需要加强培训和引导。 2. AI 工具的应用效果可能不如预期,需要及时调整和优化。 3. 数据安全和隐私保护可能存在风险,需要建立完善的防护机制。
2025-02-13
如果要用AI重绘一张已有的图片,给怎么做
要用 AI 重绘一张已有的图片,可以按照以下步骤进行: 1. 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。您可以参考文章——。此步骤可重绘五官,但头发、衣服等元素可能无法变清晰。 2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准、重绘效果最好的。不知道的朋友可以参考文章——。 3. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 此外,局部重绘的操作如下: 1. 使用大模型“lofi”绘制人物形象,在提示词中加入相关标准化提示词和负面 Embedding 以修复细节问题。 2. 将图片发送到图生图,点击“局部重绘”,用画笔将需要调整的部分涂上作为蒙版。 3. 在正向提示词里添加相应描述和权重,比如,适当增加重绘幅度并生成。 4. 还可以进入涂鸦重绘,用颜色画笔画任意想添加的东西。 在高清修复方面: 1. 文生图高清修复的原理是命令 AI 按照原来的内容重新画一幅,新生成的绘图和原图在细节上会有不同。若想更接近原图,可适当降低重绘幅度,比如 0.2 0.3。 2. 当抽到喜欢的图后,可用随机种子固定图片进行高清修复。由于高清修复渲染耗时较长,一般建议先采用低分辨率抽卡刷图。 3. 第二种放大方式是使用图生图的脚本功能,将文生图发送到图生图,点击脚本选择 SD 放大,重绘幅度设置 0.3,放大倍率为 2,图块重叠像素设置为 64。
2025-02-07
局部重绘
局部重绘是指针对图像或画面中的特定局部区域进行重新绘制、修改或调整,而不影响整体画面的其他部分。 使用局部重绘的方法如下: 1. 进入操作界面,滑动鼠标到图像区域后,可以选择智能选区与手动选区两种使用方法。 智能选区: 选中选区:滑动鼠标到图像区域,会自动框选图像区域,点击鼠标左键即可锁定。 增加选区:左键点击其他未选中区域,即可增加选区。 删除选区:选中后+键盘 dell 按键可以删除选区。智能选区中紫色区域即为重绘部分。 手动选区: 画笔工具:对图像涂抹进行选区。 橡皮工具:擦除不想要修改的区域。 索套选区:可以用它圈出任意形状的区域。 方框选区:方形选区。 2. 局部重绘成功后: 调整选区:返回选择选区界面,进行再一次调整。 保存图像:下载最终图像。 分享图像:生成图像分享链接。 信息查看:查看图像重绘信息,可将信息发送到生成器当中。 保留这张图:将图像保存到无限画布中。 对比:对比重绘前后的图像。 在顶部导航栏中: 退出:不保存最终图像,回到无限画布中。 新图:更换重绘的原图。 操作步骤为:选区>定义重绘内容>调整重绘幅度>点击重绘按钮>保存这张图。
2025-01-23
能到达图片重绘效果的软件
以下是一些能够实现图片重绘效果的软件及相关信息: Stable Diffusion: 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。可参考文章。 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 Midjourney: 最新编辑器更新,可上传图片重新绘制。允许从计算机上传图像,然后扩展、裁剪、重绘、添加或修改场景中的元素。还推出了“图像重纹理化模式”,会估算场景的形状,然后重新应用纹理,使得所有光照、材质和表面都发生变化。所有图像编辑操作都可以通过文本提示和区域选择来控制。编辑器兼容模型个性化、风格参考、角色参考和图像提示功能。 常见问题:如果提出极其不合适的请求,或者要求修改一个非常小的区域,可能无法得到预期的结果;如果在场景中放了一个很小的头部并要求进行外绘,生成的身体可能会太大(所以请将头部放大一些)。 重纹理化:是一种通过使用另一张图像来引导图像结构或构图的方法。从构图引导图像开始(在全功能编辑器中上传或链接的基础或母图像),然后使用提示词和参数来添加所需的细节。 右侧显示的缩略图:显示器右侧的缩略图显示的是最近几次编辑会话的记录。左边稍大一点的缩略图是上传或链接的图像。其他四张缩略图是子图像,展示了 Midjourney 根据提示生成的四种不同表达方式。 按钮:用于查看更多相关内容。 使用规则:由于这些功能非常新,Midjourney 希望给社区和人工审核团队一个缓慢适应的时间,因此在第一个发布阶段,将这些功能开放给以下社区群体:已生成至少 10,000 张图像的用户,年度会员可用;过去 12 个月内一直是月度订阅用户的用户(MJ 尝试做得更细致一些,但数据库处理起来有些复杂,抱歉!)
2024-12-05
识别图片中的形状和文字元素并在PPT中重绘图像的AI工具
以下为您推荐一些能够识别图片中的形状和文字元素并在 PPT 中重绘图像的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,简化设计流程,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 另外,如果您想从游戏截图升级到 KV 品质,正式绘画目前有图生图和 controlnet 两种出图方式。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后,等待图片生成。controlnet 包含的功能很多且在不断更新,如需更多了解可跳转 B 站深度学习:https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.searchcard.all.click
2024-08-29
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
视频局部重绘
以下是关于视频局部重绘的相关信息: Haiper 工具: 能进行视频重绘,包括轻松修改颜色、纹理和元素以改变原视频的视觉内容。 局部重绘可通过点选方式选中需重绘区域,再输入替换内容提示词,但大量背景重绘效果一般,视频易崩。 文生视频支持选择风格、秒数(2s 和 4s)、种子值等。 网址:https://haiper.ai/ 文生视频不同风格展示可参考: 图生视频只能写提示词、秒数(2s 和 4s)、种子值。 【SD】工具: 原理是将蒙住的部分重新画,也可将未蒙住的部分重新画,比如蒙住人物重画其背景。 更进阶的用法是进入涂鸦重绘,用颜色画笔画任意想添加的东西,如在头顶加小黄花。 可添加关键词生成相应内容。 如需扩展背景,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。 随着重绘幅度增大,人物细节可能改变,若想只改背景不改人物,可借助 PS 制作精确蒙版,进入“上传重绘蒙版”界面,上面放置需重绘的图像,下面放置 PS 中制作好的蒙版。 Video Battle AI 视频挑战: 本次大赛主题为首尾帧要求:视频首、尾、首的方式制作。 方法 1 为【MJ 出图+AI 视频软件】,使用 Midjourney 垫图➕描述出图,再去视频工具中转成视频。可下载项里的深度图,打开 MJ 官网上传深度图。Midjourney 官网:https://www.midjourney.com/ 。局部重绘有难度,最终方式为分开画再合成。
2024-08-15
老照片修复
以下是关于老照片修复的相关内容: ComfyUI 老照片修复 Flux Controlnet Upscale: 以前的高清放大工作流复杂,新模型结合工作流只需十几个基础节点就能实现更好效果。 参数调节方面,一般先确认放大倍数,再根据图片调整 ControlNet 强度。 ControlNetUpscaler 放大模型是 Jasper 研究团队为低分辨率图像开发的,可与 diffusers 库一起使用,采用多种方式对真实图像进行人工退化训练,训练方式类似 Wang,Xintao 等人发表的文献中的方法,遵循 Flux.1dev 模型许可证范畴。 Flux Ultimator 能增加小细节,增强鲜艳色彩,在 0.1 强度设置下有显著效果,能顺利集成到工作流程中,与其他 LORA 结合使用时强度需小于 0.5。 若图片质量细节不够,可选择 T5 Clip 的 fp16 版本。 ControlNet 传递的应是上传的原始图片。 【SD】用 AI 给老照片上色,岁月不改它模样: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 对于复杂的老照片,可在 PS 中进行角度调整和裁切,若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,使用 t2ia_color 模型和简单关键词。 新上线的 controlnet 模型中,Recolor 模型可将黑白图片重新上色。 人物照片还原可选择 realisian 的写实大模型,用提示词描述颜色和内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果更好。
2025-03-06
证件照片生成
以下是关于证件照片生成的相关内容: 可以通过搭建证件照应用页面来实现。先创建应用并设置第一个 div 容器,页面分为上中下三块,顶部为标题,中间有原图、过渡和最终结果,底部为展示区域和表单。还需对容器的高度、宽度、排列方向以及文本组件的字体、颜色、加粗等属性进行设置。图片上传处理方面,介绍了图片组件的本地上传和绑定数据功能,需注意微信截图可能导致上传问题。页面也可分为左右两块,左侧展示区域,右侧为表单,左侧还需嵌套容器处理图片和文字展示。此外,前端页面搭建有一些技巧,如在 DIV10 中选择子容器、复制搭建元素等,包括调整表单组件的尺寸、按钮文案和上传文件类型等设置。业务逻辑流程包括用户上传照片、图片理解、图像生成、智能换脸、背景修改等步骤,各步骤中有参数设置、提示词调整和测试方法。 普通人现在可以利用 AI 生成自己的证件照,无需去影楼拍摄。有能将上传照片生成白底、蓝底和红底的证件照生成工具。
2025-03-06
我需要找到一个方法来把我爷爷迷迷糊糊的老照片上的样子生成样貌特征完全一致的数字人脸,如何可以实现?
以下是一种可能实现将您爷爷老照片生成数字人脸的方法: 1. 利用剪映软件: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,比如“婉婉青春”。 软件会播放数字人的声音,您可判断是否需要,点击右下角“添加数字人”,将其添加到当前视频中。剪映会根据提供的内容生成对应音视频并添加到轨道中。 左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”本地图片,将其添加到视频轨道上(会覆盖数字人)。 拖动背景图的角将其放大到适合尺寸,将数字人拖动到合适位置。 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 完成后点击右上角“导出”按钮导出视频备用。 2. 若希望数字人脸换成特定的面孔,可能需要使用其他工具进行换脸。 3. 对于老照片的处理,还可以启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够的情况下放大图片。 对于复杂的老照片,可先在 ps 里进行角度调整和照片裁切,然后上色。若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定。 可加入第二个 controlnet 来控制颜色,使用 t2ia_color 模型,给出简单的关键词,如“蓝天、绿树、灰石砖”。最后经过脸部修复和放大得到最终效果。
2025-03-06
老旧照片修复
以下是关于用 AI 给老旧照片修复上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,在显存不够的情况下,仅使用分块渲染功能将图片放大到足够倍数。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。 4. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 5. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 6. 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 7. 对于复杂的照片,如人物多、场景复杂、像素低的情况,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色,还可从网上找参考照片让 AI 匹配色调,加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 作者为白马少年,发布时间为 2023 年 9 月 10 日 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 。
2025-03-06
任务照片如何更换背景
以下是关于任务照片更换背景的方法: 使用 Segment Anything 中的 GroundingDINO 模型: 1. 启用 GroundingDINO,AI 会自动下载模型,若无法使用魔法,可去云盘下载并放到指定文件目录。 2. 在检测提示词中输入相关内容,如“eye”,AI 可根据语义分割检测并设置蒙版,还可通过预览箱体获取编号来调整单一部分。 更换背景的具体操作: 1. 加载生成的背景蒙版。 2. 选择大模型,如 revAnimated_v122,并设置正向提示词,如“简单背景、花、国画、工笔”,选择蒙版模式为“重绘非蒙版内容”。 后续优化处理: 1. 若头发部分未抠好,可将图片再次放入图生图中,使用 tile 模型做整体细化,为人物衣服添加国风元素。 2. 进入 PS,使用创成式填充修复头发。 此外,在 PS 中也可进行背景替换等操作,如选择照片后使用一键选择主体和移除背景功能,若抠图不精准,可手动创建选区,反选选区后重新创建背景,使用“创成式填充”并添加提示词生成新背景。在 Stable Diffusion 中,还可通过涂鸦重绘添加元素,若想扩展背景可在图生图中选择“缩放后填充空白”并调整相关参数,若想只改变背景而不改变人物,可借助 PS 制作精确蒙版并在 Stable Diffusion 中切换到“重绘非蒙版区域”,调整提示词进行重绘。
2025-03-05
老照片修复工具推荐
以下是一些老照片修复工具推荐: 视频放大工具: https://www.topazlabs.com/topazvideoai 百度网盘分享的 Topaz 全家桶:链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 ,提取码:16d1 ,复制这段内容打开「百度网盘 APP 即可获取」 Kraken.io:主要用于图像压缩,也提供免费的图像放大功能,能保证图像细节清晰度。 Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术能将图像放大并赋予艺术效果,支持多种滤镜和风格。 RealESRGAN:https://replicate.com/nightmareai/realesrgan ,这是基于 RealESRGAN 的图像超分辨率增强模型,有人脸修复和可调节放大倍数选项,但使用几次要收费。 Photoshop Generative AI 功能:主要工具包括 Remove tool、Clone brush、Generative fill 以及 Neural filters,链接:https://x.com/xiaohuggg/status/1692751080973828468?s=46&t=F6BXooLyAyfvHbvr7Vw2g SD 图生图,重绘幅度小一点 图片放大工具: 本地工具放大:https://www.upscayl.org/download 开源工作流: 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn ,腾讯开源的模型,能恢复老照片,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 此外,将照片放入后期处理中,使用 GFPGAN 算法可将人脸变清晰,具体可参考文章—— 。
2025-03-05