Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

怎样把人物照片转变成会动的照片

Answer

要将人物照片转变成会动的照片,可以参考以下几种方法:

  1. 使用 SadTalker 工具:
    • 图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项已有文字解释,可自行尝试几次。
    • 点击 generate。
    • 由于涉及到视频的推理和转换,输出时间要远远大于 AI 绘图和 sovits 的声音推理,需做好等待的准备。
    • 导入音频后,预计生成时间较长(如 3060 12g 显卡,13 秒音频可能需要 3 - 5 分钟)。
    • 最终生成的视频长度与音频一致,若想制作长视频,最好剪成小段分别推理,然后合并。
    • 完成后,可打开输出目录或下载视频文件查看效果。
  2. 利用 Stable Diffusion 相关技巧:
    • 对于局部重绘,原理是将蒙住的部分重新画,也可将未蒙住的部分重画,比如蒙住人物重画背景。
    • 更进阶的用法,可进入涂鸦重绘,用颜色画笔画任意想添加的东西。
    • 若想让照片变成横的,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。
    • 当背景拉伸重复度高时,可适当增加重绘幅度,但可能会改变人物细节。
    • 若想既不改变人物又修改背景,可借助 PS 抠像制作精确蒙版,进入“上传重绘蒙版”界面进行操作。
  3. 借助【SD】无需 Lora,一键换脸插件 Roop:
    • 选择要替换的人物照片,面部修复选择“GFPGAN”。右边参数数值越低人物越像但图像模糊,数值越高人物越不像但图像清晰,可根据需求选择,如使用 0.5 测试。
    • 最下面还有放大算法,可使用模型放大图像进行高清修复。
    • 生成后人脸部分像素可能偏低模糊,可将图发送到“图生图”,开较小重绘幅度,然后使用 controlnet 中的 tile 模型进行重绘。
Content generated by AI large model, please carefully verify (powered by aily)

References

实战教程:使用Sadtalker让照片说话

图片预处理方式中,crop只截取图片的头部,full就是保留整张照片,下面的勾选项已经有文字解释,自己可以试几次点击generate由于涉及到视频的推理和转换,输出时间要远远大于ai绘图和sovits的声音推理,做好等待的准备。下图中,我导入了一个13秒的音频,预计需要3-5分钟(3060 12g显卡)最终生成的视频长度与音频一致,如果想制作一个长视频,最好是剪成小段,分别推理,然后合并。完成后,可以打开输出目录或者下载视频文件。看看效果带面部修复的效果:

【SD】玩转局部重绘,哪里不行点哪里

它的原理就是将蒙住的部分重新画,你也可以将没有蒙住的部分重新画,比如你可以把人物蒙住之后,重画她的背景。更进阶的用法,我们可以进入涂鸦重绘,用颜色画笔画任意你想添加的东西,比如在她的头顶加上一朵小黄花。添加关键词(Yellow flowers:1.2),点击生成,图片就像神笔马良一样生出了一朵花。如果我们想让这张照片变成横的,就需要扩展它的背景,可以在图生图中选择“缩放后填充空白”,重绘幅度0.5,并将宽度从512增加到1200。生成后不仅对背景做了补充,甚至还将人物进行了补全,但是背景拉伸的重复度太高,这时可以适当增加重绘幅度。当重绘幅度为0.58的时候,背景已经比较正常了。但是随着重绘幅度的增大,可以看见人物的细节也产生了一定的改变。有什么办法可以既不改变人物,又能修改背景呢?这里就需要用到一点PS的帮助了,我们保存这张图进入PS,对主体人物抠像。点击选择-主体,可以得到这个人物的选区。对选区填充白色,对背景填充黑色,就可以得到这个人物形象的精确蒙版。我们进入“上传重绘蒙版”的界面,上面放置需要重绘的图像,下面放置PS中制作好的蒙版。

【SD】无需Lora,一键换脸插件Roop

接下来启用ROOP插件,选择你想要替换的人物照片,面部修复选择“GFPGAN”。右边的参数数值越低,人物会越像,但是图像会很模糊;数值越高人物越不像,但是图像会很清晰。这个就取决于你的需求了,我使用0.5测试一下。最下面还有一个放大算法,可以使用一个模型放大你的图像,基本就相当于高清修复。设置好后,点击生成。可以看到,人脸部分的像素是偏低的,有点模糊。但是没有关系,我们可以将这张图发送到“图生图”,开一个比较小的重绘幅度。然后使用controlnet中的tile模型进行重绘。换脸完成,像不像你们自行评价吧~如果想要这个插件的话,可以添加我的公众号【白马与少年】,回复【SD】即可。推荐使用最新的秋叶整合包,出错概率最小,另外,科学上网很重要。特别提醒,此插件谨慎使用,切勿触犯法律。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

Others are asking
照片生成卡通头像
以下是关于照片生成卡通头像的相关内容: 通用人物模版: 如果想用真人照片生成卡通头像,可以使用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在操作过程中,如果生成了满意的图,一定要记得存起来,下次想要同种类型的可以直接拿来喂图,效果更好。 个性操作: 1. 复杂提示词:例如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 2. 不同照片生成:如果对照片风格不满意,可以更换新照片使用上述提示词重新生成。 3. 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的 Disney 换成 Pixar;如果是女孩,可以把提示词里的 boy 换成 girl。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。 背景和基础操作: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的教程。今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格的头像。先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号或不懂基础操作,可以查看之前的教程,如“”。 做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/
2025-01-04
我想把照片变成漫画形式,可以帮我找一个ai做吗
以下是 OpenAI 春季发布会中关于将照片转换为漫画的一些示例: 输入:一名留着中长棕色头发、留着胡须的年轻白人男子表情中性。他戴着眼镜,穿着浅灰色 T 恤。背景是简单的米色,方形。图像整体基调卡通俏皮。 输出:相应的漫画。 输入:一位黑发、笑容灿烂的年轻人摆出专业的头像。他穿着深色西装外套,系着图案领带,散发出优雅而专业的气息。他的眼睛明亮,笑容真诚,传达出幸福和自信的感觉。背景是中性灰色,将焦点放在拍摄对象的脸上。 输出:相应的漫画。 输入:一位留着及肩黑发的年轻亚洲女性摆出姿势拍照。她穿着绿色高领毛衣,表情中性。她的眉毛修整整齐,涂着淡粉色的口红。背景是一面朴素的白墙。 输出:相应的漫画。 输入:一位留着整洁黑发、戴着眼镜的年轻亚洲男子摆出姿势拍照。他表情温和,穿着一件休闲的靛蓝色 T 恤。柔和的灯光在中性背景下突出了他的五官,给照片带来了平静的感觉。 输出:相应的漫画。 输入:一名浅棕色头发的年轻白人对着镜头微笑。他穿着一件简单的黑色 T 恤,表情随意、轻松。背景似乎是一个郁郁葱葱的绿色花园,为肖像增添了一种充满活力和自然的感觉。 输出:相应的漫画。 输入:一位年轻的印度男子站在他的家中,脸上挂着欢迎的微笑。他有一头深色短发,穿着一件带有热带图案的蓝色衬衫。背景中的厨房为图像增添了舒适和居住的感觉。 输出:相应的漫画。 输入:一位年轻的白人男子在户外摆姿势,笑容温暖,留着浅棕色短发。他穿着一件经典的蓝色衬衫,给人一种利落又平易近人的感觉。背景柔和模糊,将注意力集中在他友好的表情和随意的举止上。 输出:相应的漫画。 您可以参考以上示例,了解 OpenAI 在照片转漫画方面的能力。但需要注意的是,目前 OpenAI 暂未直接提供将照片转换为漫画的公共服务。您还可以尝试其他专门用于照片转漫画的工具或软件,如 Adobe Photoshop、Prisma 等。
2025-01-03
照片修复工具有哪些
以下是一些常见的照片修复工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片: https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 关于 ComfyUI BrushNet 的介绍: 这个过程有点像小时候玩的连点成图游戏,只不过是电脑在操作图片。具体来说: 1. 掩码:如同一张有洞的纸覆盖在图片上,电脑程序通过这些洞知晓哪些部分需要修复。 2. 编码器:是电脑的大脑,把需要修复的图片转换成能理解和处理的信息。 3. 噪声潜在空间:为使修复部分不单调,程序会加入随机性,让修复的图片更自然。 4. BrushNet 和冻结的 UNet(Frozen UNet,预训练好且固定不变的):像画家的画笔和调色板,协助电脑细致完成修复工作。 5. 去噪和生成图像:程序尝试去除不需要的噪声,创建出真实的图片部分。 6. 模糊掩码和合成:最后,程序用特殊技巧将新生成的图片和原始图片融合,如同用橡皮擦去画作错误并重画,只是运用的是电脑技术。
2024-12-27
照片生成动画
以下是关于照片生成动画的相关内容: 使用 Runway 生成动画: 图片准备好后,可拖到 Runway 里生成 4 秒视频。Runway 是收费的,您也可以在闲鱼或淘宝找免费的或买号。进入 Runway 官网首页,点击“start with image”,然后直接将图片拖进来。动画幅度尽量用 3,5 有时会乱跑。啥都不用改,直接点击生成即可。注意:不需要等进度条转完,可以直接继续往里放图片,可以同步执行。直接点删除,然后重新上传下面的图即可(最多可以放几个您可以自行测试)。 使用 Camera Motion 生成动画: 1. 上传图片:点击“AddImage”上传图片。 2. 输入提示词:在“Prompt”中输入提示词。 3. 设置运镜方向:选择您想要的运镜方向,输入运镜值(https://waytoagi.feishu.cn/docx/Ci9yd5xu2o46rXxNofdcnqH9nXbdoxcniTMBNtWHj6MSpXvB2DTyUh)。 4. 设置运动幅度:运动幅度和画面主体运动幅度有关,与运镜大小无关,可以设置成您想要的任意值。 5. 其它:选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 6. 生成视频:点击“create”,生成视频。 相关资讯: 1. Wonder Dynamics 推出自动 3D 动画生成技术 Wonder Animation:只需导入视频,无需手动设置即可自动生成 3D 场景。可与现有动画和 3D 渲染软件无缝整合,支持多种格式。显著加速动画和 3D 内容创作流程,适用于影视和动画项目制作。详情: 2. HeyGen 推出基于照片生成数字人的新功能:上传照片或输入文字提示即可生成个性化的 AI 数字人形象。可选择性别、年龄、种族,定制肢体动作、服装、姿势和背景。支持脚本编辑,提供多种声音和情感表达,一分钟即可生成视频。详情: 3. DID 推出 Express 和 Premium+两款新数字人工具:Express:通过一分钟视频训练模型,支持同步头部动作。Premium+:需要更长视频训练,可支持手部和躯干动作。DID 表示互动视频广告的点击率和转化率分别提升了 30%和 35%。详情:
2024-12-27
老照片上色,推荐工具
以下是为您推荐的老照片上色工具: 1. 字节发布的新模型 SeedEdit:能够给黑白老照片上色,还能进行元素替换、风格切换、移除无关元素等操作。 2. Stable Diffusion:将照片放入后期处理,使用 GFPGAN 算法使人脸变清晰,再发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复。但对于内容较多的照片,可能需要逐个上色并用 PS 进行融合。
2024-12-25
旧照片翻新用哪一款ai工具?
以下是一些可用于旧照片翻新的 AI 工具: 1. Stable Diffusion:可以通过设置颜色提示词和使用 cutoff 插件来控制颜色,使老照片上色效果更好。对于复杂的照片,可能需要逐个上色并用 PS 进行融合。相关文章: 2. Dreamina 即梦: 网址:https://dreamina.jianying.com/aitool/home?subTab= 优点:不需要🪜,每天有免费额度;注册可用抖音号或手机号,耗时约 5 分钟。 3. Sora: 网址:https://openai.com/sora 优点:发布的成果好,集成在 openai 一套里可用。 限制:需要🪜,需要 gmail 注册,需要订阅后才能使用,耗时 30 60 分钟,价格为 GPT 4 20$一个月。
2024-12-24
推荐将线上视频转变成文字的运用
以下是一些将线上视频转换成文字的应用推荐: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,能在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需注意是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的相关网站可以查看: 另外,为您推荐在线 TTS 工具 Voicemaker(https://voicemaker.in/),它可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 以上内容由 AI 大模型生成,请仔细甄别。
2024-09-19
flux lora调参数,我训练出来的人物模型和数据集的人物图片不像,出现这种情况的原因都有哪些,应该调整哪些参数,我需要我的flux模型训练出来的模型是一致性还原性,和泛化性比较不错的,按照这个方向给我指导
以下是关于 flux lora 调参数以获得一致性、还原性和泛化性较好的人物模型的指导: 打标环节: 选择基础大模型,如“麦橘写实”,并为 lora 命名。 将照片导入,选择合适分辨率,可勾选“脸部加强训练”,然后进行预处理。手动裁剪图片比自动裁剪更可靠。 预处理后会出现脸部和整体文件夹,且每张照片自动打好 tag 标签。 可为整体添加统一标签,也可单独修改每张图片的标签。标签有助于 AI 理解图片,描述越详细,人物变化可能越多,泛化性可能越好。仔细检查每张图片的标签,其质量会影响人物 lora 的泛化性。 参数调整环节: 大部分参数是固定的,主要的几个按照人物参数配置一遍。后期根据生成结果再调整。 炼丹环节: 例如 18 张脸部图片,20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1。训练总步数和时长会有所不同,loss 值可作为参考,但最终效果仍需通过测试判断。 此外,在 Lora 串联方面,多个 Lora 串联时左右顺序不影响结果,可复制并点对点连接。CLIP 层 1 和 2 的效果不同,加 Lora 时某些 Lora 可能更适合 2。Lora 可用于生成底模无法画出的内容。在运行中点击取消可打断正在渲染跑的图。图像放大可通过 up scale image using model 节点,选择放大模型,用 resize 节点调整尺寸,再用编码器和采样器处理。放大模型直接放大的图像效果不佳,需再次采样增加细节。添加飞桨缺失节点可通过拖入工作流查看标红节点,从管理器安装或从 GitHub 获取节点包放入文件管理系统。采样器和调度器参数设置建议参考模型作者推荐,并结合自己调试。Web UI 中 Lora 库有刷新按钮,将 Lora 丢到文件夹后多点几次刷新即可。
2025-01-04
SD如何人物换脸
以下是关于 SD 人物换脸的详细步骤: 1. 安装 Roop 插件:安装时间较长,需耐心等待。安装好后打开 SD 文件目录下的特定文件夹,在地址栏输入“cmd”并回车,在打开的 dos 界面粘贴“python m pip install insightface==0.7.3 user”自动安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),在云盘后台回复【SD】可下载。 2. 后续操作:安装完成后重新打开启动器,后台会继续下载模型,全程要保证科学上网。Roop 插件主要适用于真实人脸替换,对二次元人物作用不大。选用真实系模型“realisticVisionV20”,关键词描述人物。启用 Roop 插件,选择要替换的人物照片,面部修复选“GFPGAN”,右边参数数值越低人物越像但图像模糊,数值越高人物越不像但图像清晰,可根据需求设置,如 0.5。设置好后点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型重绘。 3. 多人物脸部替换:先正常生成图片,如两个古风人物形象。发送到图生图中调整重绘幅度。在 roop 插件中,从左往右编号,载入相应人物照片形象进行脸部替换。 4. 获取插件:想要 Roop 插件,可添加公众号【白马与少年】,回复【SD】。 另外,还有关于 SD 中更精确蒙版的操作,如使用 GroundingDINO 模型分割:启用 GroundingDINO 时 AI 会自动下载模型,也可在云盘下载放到特定文件目录。在检测提示词中输入如“eye”,可自动检测出相应部分并设置蒙版,还能通过预览箱体得到编号选择调整单一部分。选择要修改的蒙版上传到重绘蒙版,添加提示词生成。给人物换背景时,加载生成的背景蒙版,选择大模型和正向提示词,蒙版模式选“重绘非蒙版内容”,生成后可再次放入图生图中细化,还可在 PS 中修复。 特别提醒,使用相关插件需谨慎,切勿触犯法律。
2024-12-31
做卖货视频,想要把其中的人物和部分物体换掉,声音也换掉,可以用哪些方法
以下是一些可以用于做卖货视频时换掉人物、部分物体和声音的方法: 1. 数字人脸创作: 可以使用一系列逼真的照片或插图人脸来创造,所有人脸都经过优化,在添加语音和动作时能实现最佳效果。 上传自己的照片,如自己、朋友或家人的面部照片进行创作。 利用 DID 自带的 Stable Diffusion 的能力生成想象中的人脸,如描述“一个外星女神”“一个微笑的十九世纪维多利亚绅士”等。 数字人像添加到人脸库后可随意重复使用,输入新脚本让其说话。 2. 数字人说话方式: 用 GPT 直接生成脚本让数字人说话。 利用 GPT3 文本生成技术撰写脚本。 先选好脸,再输入脚本。 输入准备好的脚本,在 DID 中选择数百种语言和口音,并调整角色说话风格。 上传自己的音频记录,或从电影、电视剧中剪辑喜欢的台词、吟唱自编的歌曲。 3. 相关工具和操作指引: 利用 TecCreative 工具,如数字人口播配音,输入口播文案,选择期望生成的数字人形象及目标语言即可生成数字人口播视频。 图片换脸,仅需上传原始图片和换脸图片,即可一键实现素材换脸。 视频换脸,自动识别视频中的人脸,并将其替换为选择的脸部。 音频合成数字人,上传音频文件,选择数字人角色和输出类型即可生成。 AI 配音,多语种智能配音,区分男声和女声。 AI 字幕,智能识别视频语言并生成对应字幕。 4. 实战操作: 准备视频中播放的内容文字,可利用 AI 生成。 使用剪映 App 对视频进行简单处理,如添加文字内容轨道,替换默认文本内容等。
2024-12-30
有什么好的ai可以做到把视频中的人物或物体,背景等换掉,而且把其中的语音改成自己想要的说话声
以下是一些可以实现您需求的 AI 工具和方法: 1. 剪映 App: 生成数字人:在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到视频中,左下角会提示渲染完成,可点击预览查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,将图片添加到视频轨道上,通过拖动轨道右侧竖线使其与视频对齐,选中轨道后可调整图片大小和数字人位置。 2. TecCreative 工具: 数字人口播配音:输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。 图片换脸:上传原始图片和换脸图片,一键实现素材换脸。 视频换脸:上传原始视频和换脸图片,自动识别并替换人脸。 音频合成数字人:上传音频文件,选择数字人角色和输出类型,生成数字人视频。 AI 配音:输入需配音文案,选择音色,立即生成。 AI 字幕:点击上传视频,开始生成,字幕解析完成后可下载 SRT 字幕。 在使用这些工具时,请注意相关的格式和文件大小限制,如图片大小上限 5M,支持 JPG、PNG 格式;音频文件支持 MP3 和 WAV 格式,文件大小上限 5M;视频支持 MP4 文件类型,大小上限为 50M。
2024-12-30
我想用AI做一个人物访谈录发在公众号上,请帮我生成一段200字的简介
以下是为您生成的 200 字左右的人物访谈录简介: 南瓜博士首次写小说获奖,背后离不开 AI 的助力。他先让 AI 写故事概要和角色背景介绍并做修改,还采用让 AI 以表格形式输出细节描述的技巧,打破叙事习惯,方便局部调整,确保都是具体细节。之后将生成的表格串联成文,过程中偶尔给出建议。然而,因小说字数超 2000 字,修改时 GPT4 记性不好,Claude 又改丢关键情节。但最终,在与 AI 的合作与磨合中,南瓜博士成功获奖,展现了 AI 在创作中的独特作用与挑战。
2024-12-26
我想用AI做一个人物访谈录发在公众号上,请帮我取公众号的一个名字,请给出10个供我参考
以下是为您提供的 10 个适合发布人物访谈录的公众号名字,供您参考: 1. 《深度人物志》 2. 《人物访谈集萃》 3. 《名人面对面访谈》 4. 《非凡人物访谈录》 5. 《人物心灵访谈》 6. 《魅力人物访谈窗》 7. 《人物故事访谈馆》 8. 《杰出人物访谈记》 9. 《人物风采访谈坛》 10. 《热点人物访谈坊》
2024-12-26