直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

怎样把人物照片转变成会动的照片

回答

要将人物照片转变成会动的照片,可以参考以下几种方法:

  1. 使用 SadTalker 工具:
    • 图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项已有文字解释,可自行尝试几次。
    • 点击 generate。
    • 由于涉及到视频的推理和转换,输出时间要远远大于 AI 绘图和 sovits 的声音推理,需做好等待的准备。
    • 导入音频后,预计生成时间较长(如 3060 12g 显卡,13 秒音频可能需要 3 - 5 分钟)。
    • 最终生成的视频长度与音频一致,若想制作长视频,最好剪成小段分别推理,然后合并。
    • 完成后,可打开输出目录或下载视频文件查看效果。
  2. 利用 Stable Diffusion 相关技巧:
    • 对于局部重绘,原理是将蒙住的部分重新画,也可将未蒙住的部分重画,比如蒙住人物重画背景。
    • 更进阶的用法,可进入涂鸦重绘,用颜色画笔画任意想添加的东西。
    • 若想让照片变成横的,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。
    • 当背景拉伸重复度高时,可适当增加重绘幅度,但可能会改变人物细节。
    • 若想既不改变人物又修改背景,可借助 PS 抠像制作精确蒙版,进入“上传重绘蒙版”界面进行操作。
  3. 借助【SD】无需 Lora,一键换脸插件 Roop:
    • 选择要替换的人物照片,面部修复选择“GFPGAN”。右边参数数值越低人物越像但图像模糊,数值越高人物越不像但图像清晰,可根据需求选择,如使用 0.5 测试。
    • 最下面还有放大算法,可使用模型放大图像进行高清修复。
    • 生成后人脸部分像素可能偏低模糊,可将图发送到“图生图”,开较小重绘幅度,然后使用 controlnet 中的 tile 模型进行重绘。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

实战教程:使用Sadtalker让照片说话

图片预处理方式中,crop只截取图片的头部,full就是保留整张照片,下面的勾选项已经有文字解释,自己可以试几次点击generate由于涉及到视频的推理和转换,输出时间要远远大于ai绘图和sovits的声音推理,做好等待的准备。下图中,我导入了一个13秒的音频,预计需要3-5分钟(3060 12g显卡)最终生成的视频长度与音频一致,如果想制作一个长视频,最好是剪成小段,分别推理,然后合并。完成后,可以打开输出目录或者下载视频文件。看看效果带面部修复的效果:

【SD】玩转局部重绘,哪里不行点哪里

它的原理就是将蒙住的部分重新画,你也可以将没有蒙住的部分重新画,比如你可以把人物蒙住之后,重画她的背景。更进阶的用法,我们可以进入涂鸦重绘,用颜色画笔画任意你想添加的东西,比如在她的头顶加上一朵小黄花。添加关键词(Yellow flowers:1.2),点击生成,图片就像神笔马良一样生出了一朵花。如果我们想让这张照片变成横的,就需要扩展它的背景,可以在图生图中选择“缩放后填充空白”,重绘幅度0.5,并将宽度从512增加到1200。生成后不仅对背景做了补充,甚至还将人物进行了补全,但是背景拉伸的重复度太高,这时可以适当增加重绘幅度。当重绘幅度为0.58的时候,背景已经比较正常了。但是随着重绘幅度的增大,可以看见人物的细节也产生了一定的改变。有什么办法可以既不改变人物,又能修改背景呢?这里就需要用到一点PS的帮助了,我们保存这张图进入PS,对主体人物抠像。点击选择-主体,可以得到这个人物的选区。对选区填充白色,对背景填充黑色,就可以得到这个人物形象的精确蒙版。我们进入“上传重绘蒙版”的界面,上面放置需要重绘的图像,下面放置PS中制作好的蒙版。

【SD】无需Lora,一键换脸插件Roop

接下来启用ROOP插件,选择你想要替换的人物照片,面部修复选择“GFPGAN”。右边的参数数值越低,人物会越像,但是图像会很模糊;数值越高人物越不像,但是图像会很清晰。这个就取决于你的需求了,我使用0.5测试一下。最下面还有一个放大算法,可以使用一个模型放大你的图像,基本就相当于高清修复。设置好后,点击生成。可以看到,人脸部分的像素是偏低的,有点模糊。但是没有关系,我们可以将这张图发送到“图生图”,开一个比较小的重绘幅度。然后使用controlnet中的tile模型进行重绘。换脸完成,像不像你们自行评价吧~如果想要这个插件的话,可以添加我的公众号【白马与少年】,回复【SD】即可。推荐使用最新的秋叶整合包,出错概率最小,另外,科学上网很重要。特别提醒,此插件谨慎使用,切勿触犯法律。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

其他人在问
让照片说话 软件有哪些
以下是一些能让照片说话的软件及相关信息: SadTalker: 开源程序,可让照片说话唱歌,达到基本唇形同步。 独立使用或作为插件放入 StableDiffusion。 整合包:史上最炸裂版 AI 工具箱,包含 SDAI 绘画、VITS 文本转语音、wav2lip、sadTalker 唇型同步、视频修复,支持 A 卡。 相关链接: GitHub 地址:https://github.com/OpenTalker/SadTalker 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 夸克网盘整合包:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,等待弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音。 图片预处理方式:crop 只截取图片头部,full 保留整张照片。 由于涉及视频推理和转换,输出时间较长,需做好等待准备。最终生成的视频长度与音频一致,制作长视频建议剪成小段分别推理后合并。完成后可打开输出目录或下载视频文件。 KreadoAI: 点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能。 使用方法:点击开始创作,选择自定义照片;配音时可选择提供文字选择音色或直接上传音频;打开绿幕按钮,点击背景可添加背景图;最后点击生成视频。
2024-09-14
上传一张照片,可以输出照片内容的文字说明吗?
上传一张照片是可以输出照片内容的文字说明的。以下为两种常见的实现方式: 1. 利用 Sadtalker 进行处理:在图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项有文字解释,可自行尝试几次。点击 generate 后,由于涉及到视频的推理和转换,输出时间会远远大于 AI 绘图和 sovits 的声音推理,需做好等待准备。例如导入一个 13 秒的音频,预计需要 3 5 分钟(3060 12g 显卡)。最终生成的视频长度与音频一致,若想制作长视频,最好剪成小段分别推理再合并。完成后,可打开输出目录或下载视频文件查看效果。 2. 借助 GPT 识图功能:我们可以借用 GPT 来对图片的内容进行细致描述,当然也可以自行描述。例如对一张人物照片的描述:图片中的人物是一位年轻的男性,年纪大约在 20 到 30 岁之间。他的头发黑亮,整齐地梳向后方,呈现出一种利落而正式的发型,发尾略有一些微卷,显得时尚而有型。他的肤色白皙,面部线条分明,五官端正。他的眉毛浓密而有形,眼睛大而有神,显得非常有精神。鼻梁高挺,鼻翼略窄,嘴唇薄而有弧度,整体面部表情略显严肃,但却不失英俊。下巴线条明显,脸部轮廓立体分明,整体给人一种非常帅气且有魅力的感觉。他穿着一套正式的黑色西装,内搭白色衬衫,并佩戴了一条黑色领结。西装的剪裁非常合身,显示出他的修长身材和优雅气质。他左手握着一只话筒,似乎正在参加某个正式场合或发表演讲。背景较为简约,以浅色为主,突出人物的主体地位,进一步增强了他正式而庄重的形象。总体来看,这位年轻男性看起来像是东亚人种,具有典型的亚洲男性特征,且散发出一种自信和专业的气质。
2024-09-14
怎么才能让FLUX生成的人物更像真人的照片
以下是一些可能有助于让 FLUX 生成的人物更像真人照片的建议: 1. 尝试使用特定的提示词,例如“abstract network out of glass made of holographic liquid crystal, dark background, blue light reflections, symmetrical composition, centered in the frame, highly detailed, hyperrealistic, cinematic lighting, in the style of Octane Rende ar 16:9 style raw personalize v 6.1”。 2. 可以训练 FLUX Lora 模型,如褪色胶片风格,推荐权重 0.6 0.8,人像会偏向复古褪色的胶片风格。 3. 对于生成人物,还可以参考 XLabsAI 发布的不同 Lora,如 mjv6_lora(Midjourney 风格)、realism_lora(写实风格)等,并使用相应的示例进行参考和调整。 4. 您还可以从以下地址下载相关的 Lora:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs
2024-09-13
照片修复
以下是关于照片修复的相关知识: 1. 【SD】无需 Lora,一键换脸插件 Roop:启用 ROOP 插件,选择要替换的人物照片,面部修复选“GFPGAN”。右边参数数值越低人物越像但图像模糊,数值越高人物不像但图像清晰,可按需设置,如 0.5。最下面有放大算法,相当于高清修复。设置好后点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型重绘。如需此插件,可添加公众号【白马与少年】回复【SD】。推荐使用最新秋叶整合包,科学上网很重要,此插件需谨慎使用,切勿触犯法律。 2. 图像高清修复,无损放大 N 倍: 实现技术拆解:第二部分进行高清修复,把原本模糊的图片修复,并进行 2 倍放大。 Checkpoint 大模型使用 Iceclear/StableSR,搭配 Stable SR Upscaler 模型,推理图片噪点以还原图像。提示词部分应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)。全程采取两次高清修复。 3. 辅助工具:放大/扩图: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 相关工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ ,能够提供图片的放大和降噪功能,通过使用深度学习技术提高图像质量,同时保留细节和纹理,简单易用且效果好。
2024-09-11
我想要找一款AI智能消除照片背景杂物的工具
以下为您推荐一些 AI 智能消除照片背景杂物的工具: 1. RMBG1.4 去除照片背景模型:高精度背景去除,适用于电商、广告等场景。支持视频背景批量去除,提供蒙版输出功能。云端处理速度快,性能卓越。链接:https://github.com/ZHOZHOZHO/ComfyUIBRIA_AIRMBG ,https://x.com/xiaohuggg/status/1755075272410538450?s=20 2. AVAide Watermark Remover:在线工具,使用 AI 技术从图片中去除水印。支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,上传图片,选择水印区域,保存并下载处理后的图片。还提供去除文本、对象、人物、日期和贴纸等功能。 3. Vmake:提供 AI 去除图片水印的功能。可上传最多 10 张图片,AI 自动检测并移除水印。处理完成后可选择保存生成的文件。适合需快速去除水印、在社交媒体分享图片的用户。 4. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中多余物体、人物或水印,不留痕迹。支持直接粘贴图像或上传手机图像,操作简便。 这些工具各有特点,您可以根据具体需求选择最适合您的工具。
2024-09-09
图片风格转换,现实照片转换成动漫风格,有哪些网站、Bot、
目前在将现实照片转换成动漫风格方面,以下为您推荐一些常见的网站和工具: 1. 美图秀秀:功能丰富,操作相对简单,有多种动漫风格转换效果可选。 2. 醒图:提供多种特效和滤镜,包括动漫风格的转换。 至于 Bot 方面,暂时没有特别突出和广泛使用的专门用于现实照片转动漫风格的 Bot。但您可以持续关注相关领域的发展,可能会有新的工具出现。
2024-09-06
人工智能发展的流程图上面有相关人物与重要时间节点或重大事件
以下是人工智能发展的流程图相关内容,包含重要人物与重要时间节点或重大事件: 二十世纪中叶,人工智能领域开启。最初符号推理流行,带来专家系统等重要进展,但因提取知识成本高等问题,20 世纪 70 年代出现“人工智能寒冬”。 近现代,计算机科学发展为人工智能研究奠定基础,人们尝试用机器模拟人类思维。 1950 年,英国数学家阿兰·图灵提出著名的“图灵测试”。 1956 年,人工智能一词被提出,达特茅斯会议举行。 1997 年,深蓝在国际象棋比赛中击败卡斯帕罗夫。 2016 年,AlphaGo 在围棋比赛中战胜李世石。 2020 年,GPT3 发布。 2022 年,DALLE 发布。 2023 年,GPT4 发布。 2024 年,预计发布 GPT5 。 随着时间推移,计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中“人工智能”常被用作“神经网络”的同义词。
2024-09-16
在COMFYUI中使用FLUX大模型时,怎么才能让多次生成的人物一致
在 ComfyUI 中使用 FLUX 大模型让多次生成的人物一致的方法如下: 控制人物在多场景、多个姿势下的一致性有很多方法,课程后期会介绍。 对于多张图输出的显示问题,一次产出多张图在预览窗口目前不能并排显示。 Lora 的刷新:将 Lora 丢到文件夹后,多点几次刷新即可,Web UI 中 Lora 库有刷新按钮。 另外,在 Midjourney 中,人物一致性已上线,其操作如下: DavidH 介绍:Hey @everyone @here we're testing a new "Character Reference" feature today This is similar to the "Style Reference" feature, except instead of matching a reference style it tries to make the character match a "Character Reference" image. 具体操作:Type cref URL after your prompt with a URL to an image of a character. You can use cw to modify reference 'strength' from 100 to 0. strength 100 . 适用范围:This feature works best when using characters made from Midjourney images. It's not designed for real people / photos . 网页端操作:How does it work on the web alpha? Drag or paste an image into the imagine bar, it now has three icons. Selecting these sets whether it is an image prompt, a style reference, or a character reference. Shift + select an option to use an image for multiple categories. 在 ComfyUI 中处理模型连接和提示词相关问题,如让两个模型同时起作用的操作: 加入一个新节点,右键点击 【新建节点】 【实用工具】 【Primitive 元节点】。 在文本节点上单击右键,选择【转换文本为输入】,此时文本节点上就多了一个文本的连接点。 将元节点与文本节点相连接,元节点就变成了正向提示词的输入框。同理,可以将负向提示词框也用元节点代替。 再复制出一套正负提示词节点,一套给 base 模型,一套给 refiner 模型。然后,base 模型的那一套输出给第一个采样器节点,refiner 模型的那一套输出给第二个采样器节点。
2024-09-13
MJ人物姿势
以下是关于 MJ 人物姿势的相关信息: MewXAI 中的 MJ 绘画创意度和想象力极高,在摄影照片、海报、logo 设计、3D 模型、表情包制作等方面表现出色,并且通过姿态识别能够实现对人物动作的精准控制,不仅可以生成单人的姿势,还可以生成多人的姿势,实现对 AI 画图的完美控制。 Midjourney V6 更新了角色一致性命令“cref”。在 MJ 网页社区里随机选一张图片,点击箭头下方的图片 icon 按钮(图 1),在上方输入栏里选择三个按钮(图 2 红框里第一个就是角色参考,点击一下图标),加上描述词,调整设置(图 3),回车即可实现人物面部不变,场景变化(图 4)。同时,按住 Shift 键选择一个选项可将图像用于多个类别。需要注意的是,虽然 MJ V6 还处于 alpha 测试阶段,此功能及其他功能可能会突然更改,但 V6 官方 beta 版本即将推出。
2024-09-10
用哪个ai工具可以做双图,人物没变化
以下是一些可以用于生成双图且人物没变化的 AI 工具及相关信息: 1. Controlnet:正式绘画目前有两种出图方式,包括图生图和 controlnet。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后等待图片生成。 2. Midjourney:在网页版中,传一张图片,右下角有小 icon,鼠标 hover 上去会出现 3 个 icon,最左边小人的 icon 可把图片当做角色参考。官方对于角色一致性也给了一些简单的小 Tips。用在 2D 和 3D 角色上效果较好。 您可以根据自己的需求选择适合的工具。
2024-09-10
AI绘画人物头像图生图
以下是关于 AI 绘画人物头像图生图的相关内容: 在使用图生图功能时,每次生成都会重新调整整个画面,局部重绘则可以只改变涂抹的部分。例如,将人物头部涂抹掉,修改提示词为“一个粉色头发的女孩的脸”进行生成,可换掉头部。还可以使用局部重绘修改帽子部分,增加提示词“猫耳”再次生成。此外,将图片再次放入以图生图中,通过 DeepBooru 反推关键词,并使用新的大模型和 LORA 进行重新生成,能改成特定的人物风格。但目前的图可能存在细节瑕疵,需要不断调整参数,后期借助 PS 修补。同时,在独立游戏开发中运用 AI 绘画也有一些经验。比如在《玩具帝国》中,最初使用 AI 画画存在风格不合适、缺乏叙事性、图生图不可行、训练泛化性差等问题。经过尝试不同的方法,如 Embedding、CKPT、Lora 等,最终达到了较好的效果,甚至能从特定的训练集中生成原本没有的内容。另外,还有一些关于汉服系的 AI 绘画提示词示例,如“Pixar Style,Tiny cute and adorable Cute little mouse wearing hanfu,Delicate face,fluffy hair,anthropomorphic,cinematic lighting,baptiste monge,Chinese culture,super clear details,super clear material,closeup,complex texture,octane rendering,zbrush,8k,portrait testp ar 9:16 upbeta upbeta upbeta upbeta upbeta upbeta”等。
2024-09-09