Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

SD如何人物换脸

Answer

以下是关于 SD 人物换脸的详细步骤:

  1. 安装 Roop 插件:安装时间较长,需耐心等待。安装好后打开 SD 文件目录下的特定文件夹,在地址栏输入“cmd”并回车,在打开的 dos 界面粘贴“python -m pip install insightface==0.7.3 --user”自动安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),在云盘后台回复【SD】可下载。
  2. 后续操作:安装完成后重新打开启动器,后台会继续下载模型,全程要保证科学上网。Roop 插件主要适用于真实人脸替换,对二次元人物作用不大。选用真实系模型“realisticVisionV20”,关键词描述人物。启用 Roop 插件,选择要替换的人物照片,面部修复选“GFPGAN”,右边参数数值越低人物越像但图像模糊,数值越高人物越不像但图像清晰,可根据需求设置,如 0.5。设置好后点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型重绘。
  3. 多人物脸部替换:先正常生成图片,如两个古风人物形象。发送到图生图中调整重绘幅度。在 roop 插件中,从左往右编号,载入相应人物照片形象进行脸部替换。
  4. 获取插件:想要 Roop 插件,可添加公众号【白马与少年】,回复【SD】。

另外,还有关于 SD 中更精确蒙版的操作,如使用 GroundingDINO 模型分割:启用 GroundingDINO 时 AI 会自动下载模型,也可在云盘下载放到特定文件目录。在检测提示词中输入如“eye”,可自动检测出相应部分并设置蒙版,还能通过预览箱体得到编号选择调整单一部分。选择要修改的蒙版上传到重绘蒙版,添加提示词生成。给人物换背景时,加载生成的背景蒙版,选择大模型和正向提示词,蒙版模式选“重绘非蒙版内容”,生成后可再次放入图生图中细化,还可在 PS 中修复。

特别提醒,使用相关插件需谨慎,切勿触犯法律。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】无需Lora,一键换脸插件Roop

安装时间比较长,要耐心等待。安装好之后,打开SD文件目录下的这个文件夹。在地址栏输入“cmd”,然后回车。在打开的dos界面里面,将这行代码“python-m pip install insightface==0.7.3--user”粘贴进来,就会自动开始安装insightface。如果这个阶段出现错误,建议去下载使用最新的秋叶4.2整合包(6月23号更新),下载包我已经更新到了云盘里,后台回复【SD】就可以下载。安装完成后,重新打开我们的启动器,后台会继续下载一些模型,此时一定要保证全程科学上网。完成这些后,我们的Roop插件就可以正常使用了。这个插件主要适用于真实的人脸替换,所以对二次元之类的人物作用不大。我们选用一个真实系模型“realisticVisionV20”,关键词描述的是一个老人举着气球。得到了一张如下的照片。接下来启用ROOP插件,选择你想要替换的人物照片,面部修复选择“GFPGAN”。右边的参数数值越低,人物会越像,但是图像会很模糊;数值越高人物越不像,但是图像会很清晰。这个就取决于你的需求了,我使用0.5测试一下。最下面还有一个放大算法,可以使用一个模型放大你的图像,基本就相当于高清修复。设置好后,点击生成。可以看到,人脸部分的像素是偏低的,有点模糊。但是没有关系,我们可以将这张图发送到“图生图”,开一个比较小的重绘幅度。然后使用controlnet中的tile模型进行重绘。换脸完成,像不像你们自行评价吧~如果想要这个插件的话,可以添加我的公众号【白马与少年】,回复【SD】即可。推荐使用最新的秋叶整合包,出错概率最小,另外,科学上网很重要。特别提醒,此插件谨慎使用,切勿触犯法律。

【SD】多人物脸部替换,一键换脸插件Roop(2)

我先正常地生成一张图片,内容是两个古风的人物形象,一男一女坐在一起,在大漠黄沙之下,互相对视。正向提示词是:best quality,official art,8k wallpaper,highly detailed,illustration,close-up,(a man and a woman sitting together:1.6),upper body,antique style,drifting snow,yellow sand fills the sky,withered tree,desert,gu,<lora:武侠V2_2.0:1>。模型使用的是majicmixRealistic,外加一个武侠lora。其余参数如下。得到这张图,仿佛两个古时的人转世来到了现在,回到曾经相识的大漠,相对而坐,往事如梭。发送到图生图中,调整重绘幅度为0.4。在roop插件中,默认是从左往右开始编号,0,1,2,3……这样依次往下。所以左边男人的编号为0,右边女人的编号为1。我们在第一个roop中载入至尊宝的照片形象。在第二个roop中载入紫霞的照片形象。脸部替换完成。这个插件最强大的地方就在于,它仅凭一张照片就能复刻出这个角色的其他角度和表情,而且能让人一眼感觉确实很像。放大看看特写。如果真的千年之后,两人再相见,他们心里会想什么呢?最后使用一下ps扩图,看看辽阔的黄沙大漠,七月飞雪。如果想要这个插件的话,可以添加我的公众号【白马与少年】,回复【SD】即可。鲜花总会凋谢但会再开一生所爱隐约在白云外-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)

【SD】商业换装如此简单,Segment Anything保姆级教学

但有的时候,我们需要更精确一点的蒙版,比如人物的眼睛,或者是身上的配饰等等。单靠SAM模型就很难得到想要的蒙版了,这个时候我们就需要使用到segment anything中的GroundingDINO了。启用GroundingDINO,AI会自动下载模型,此时会需要用魔法,没有魔法的同学可以去我的云盘直接下载。放到这个文件目录下“……sd-webui-aki-v4.2\extensions\sd-webui-segment-anything\models\grounding-dino”点击启用,在检测提示词中输入“eye”,AI就可以根据语义分割帮我们自动检测出眼睛的部分,并设置好蒙版。我们还可以通过预览箱体,来得到两只眼睛的编号,通过编号可以选择调整单一的眼睛。比如,我只想调整左边那只眼睛,我就只需要勾选1就可以了。和刚才一样,选择我们想要修改的蒙版,上传到重绘蒙版当中。添加提示词“闭眼”。点击生成,可以看到图片就修改好了。我们再来给人物换个背景试试,加载刚才生成的背景蒙版。大模型选择revAnimated_v122,正向提示词:简单背景、花、国画、工笔。蒙版模式选择“重绘非蒙版内容”。得到这张图片,头发的部分没有抠太好。我们将它再次放入图生图中,使用tile模型做一次整体细化,除了融合人物之外,还能给人物的衣服也添加上国风元素。生成,人物好像变得高级了一些。来到PS,使用创成式填充修复一下头发。完成啦。

Others are asking
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25
视频换脸软件有哪些
以下是一些常见的视频换脸软件: 1. :在线换脸,可使用上传的图片。 2. :在线视频操纵软件。 3. :在照片上交换面孔,效果出众。 4. :在自拍上叠加名人的脸。 5. :实时换脸的视频通话。 6. :在线媒体中的换脸。 7. :在线图片换脸。 8. :改进的实时换脸视频通话。 9. :视频和图片的换脸解决方案。 此外,还有以下两款: 1. Viggle(有免费额度): 网址:http://viggle.ai discord 免费体验:https://discord.com/invite/viggle 功能包括图片+动作视频转视频、图片+文字动作描述转视频、文字转视频,可完成视频换脸。 具体操作: /mix:将角色图像混合到动态视频中,上传一张字符清晰的图片和一段清晰运动的视频。 /animate:使用文本运动提示为静态角色设置动画,上传一张字符清晰的图片并描述想让角色做的动作(也可从 https://viggle.ai/prompt 中复制动作提示词)。 /ideate:纯粹从文本创建角色视频,描述想要创造的角色和希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /character:通过文本提示创建角色并将其动画化,描述想要创造的角色,从四个结果中选择一个图像,描述希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /stylize:使用文本提示符重新设计角色的样式并将其动画化,上传一张字符清晰的图片,描述想改变角色的任何地方来重新塑造它,从四个结果中选择一个图像,描述想要角色做的动作(或者从 https://viggle.ai/prompt 中复制动作提示词)。 官方提供了多种动作提示词可供参考,点击对应动作下方的复制按钮即可复制提示词到生成视频的时候使用,提示词地址:https://viggle.ai/prompt 2. Swapface(有免费额度): 网址:https://swapface.org//home 图片换脸、视频换脸,直播实时换脸,需要下载电脑客户端使用,没有在线版,可以通过邀请好友、点评软件获取积分。视频换脸是可以上传视频或者 gif 图,换脸可以识别图片、视频里的多张脸进行替换。 视频换脸操作流程:效果预览,左边原视频,右边换脸后效果。 示例视频:
2024-12-17
视频换脸
以下是关于视频换脸的相关信息: 视频换脸可以自动识别视频中的人脸,并将其替换为选择的脸部,实现在视频中快速、精确地替换人物的脸部。 操作指引: 1. 上传原始视频。 2. 上传换脸图片。 3. 点击生成。 相关工具及链接: 1. 【TecCreative】: 图片大小上限 5M,支持 JPG、PNG 格式。 2. Swapface(有免费额度): https://swapface.org//home 需要下载电脑客户端使用,没有在线版,可以通过邀请好友、点评软件获取积分。 视频换脸是可以上传视频或者 gif 图,换脸可以识别图片、视频里的多张脸进行替换。 效果预览:左边原视频,右边换脸后效果。 在“AI 摊主速成脑暴会”中,视频换脸属于视频处理类别,积分 60 分。
2024-12-17
换脸AI有免费的吗
以下是一些关于免费换脸 AI 的信息: 有方法可以在大约 10 分钟左右制作 AI 换脸、AI 数字人视频。制作数字人视频免费,数字人换脸约 0.8 元。 Swapface 有免费额度,可通过邀请好友、点评软件获取积分。它支持图片换脸、视频换脸、直播实时换脸,需要下载电脑客户端使用,没有在线版。网址:https://swapface.org//home 。 开源、免费的换脸解决方案 facefusion ,开源地址:https://github.com/facefusion/facefusion 。但该软件需要 python 环境,以及要安装视频解码器等多个依赖的软件,本地安装需要一定编程知识。且本地计算机若无 GPU 或 GPU 显存较小,执行速度会非常缓慢。云服务解决方案如利用阿里云的 PAI 和 AutoDL 则需要产生一定费用。
2024-12-14
给视频里的人换脸用什么AI
以下是一些可以用于给视频里的人换脸的 AI 方法: 1. 使用 facefusion 工具: 点击快捷工具中顶部的“JupyterLab”,打开这个工具。 点击顶部的“+”号选项卡,新打开一个终端窗口。 在终端区域,启动一个终端的选项卡。 在打开的终端窗口中,输入以下 3 条命令: 查看文件列表。输入“ls”并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录,输入“cd facefusion”并按回车,进入程序目录。 启动 facefusion。输入“python./run.py executionproviders cuda cpu”启动程序(注意:后面的参数“executionproviders cuda cpu”非常重要,如果不加“cuda”,则默认不使用 GPU 能力,推理将非常慢)。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。 在 facefusion 软件界面上,上传准备好的图片、视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置,会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击它可以导出变量后的视频到本地。 2. 诗云马良平台:早在 21 年,诗云马良平台就推出了给视频中模特换脸、切换语言的能力,方便电商营销商家进行产品的本地化推广。 3. HenGen AI:近期 HenGen AI 也公布了 AI 切换视频内语言的能力,并且能够将 Avatar 口型与视频相匹配。
2024-12-14
AI换脸工具
以下是关于 AI 换脸工具的相关内容: 实战:每个人都可以用 10 分钟轻松制作 AI 换脸、AI 数字人视频的方法 1. 点击快捷工具中顶部的“JupyterLab”,打开这个工具。此工具提供执行 Python 程序的说明和控制服务器的终端使用。 2. 通过终端启动 facefusion。点击顶部的“+”号选项卡,新打开一个终端窗口。在终端区域启动终端选项卡,输入以下 3 条命令: 查看文件列表。输入“ls”并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录,输入“cd facefusion”并按回车。 启动 facefusion。输入“python./run.py executionproviders cuda cpu”启动程序。注意:后面的参数“executionproviders cuda cpu”非常重要,如果不加“cuda”,则默认不使用 GPU 能力,推理将非常慢。 3. 当出现提示信息时,说明启动成功。 4. 打开 facefusion 软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。在 facefusion 软件界面上,上传准备好的图片、视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击可导出变量后的视频到本地。 辅助工具:换脸 1. E4S:一个精细化的面部交换(换脸)技术。与传统换脸技术不同,E4S 更加精细和高级,能确保换出来的脸在形状、纹理和光照方面自然逼真,精确处理脸部每一个小细节。项目地址: 2. Misgif:一款可以将脸放入喜欢的 GIF 表情包中的应用,具有娱乐性。 3. Face Swapper:AI 换脸工具,可一次替换多张脸,支持 JPG、PNG、WEBP 格式,最大 1024px 分辨率。应用场景包括时尚、美容、电影、媒体、人力资源。传送门: 星流一站式 AI 设计工具中的换脸 1. 什么是换脸?自动替换原图的脸部信息。 2. 如何使用?选中图像进入扩展功能界面,自动提取面部信息,上传想要替换到图像的图片。参数方面,提示词框会自动根据图像进行填充,无需手动填写。重绘风格选择与放大图像相对应的风格,会提升换脸效果,其余参数默认即可。
2024-12-04
怎么看sd的插件不兼容
SD 插件不兼容可能有多种情况和解决方法: 对于提示词服从度增强插件,当生成图与提示词不太相符时,可以通过多刷图来找到符合需求的绘图。若条件太多始终达不到效果,可提高 cfg 值并启用修复插件。但开启插件并提高 CFG 值后,画面可能会发黄,颜色偏差可利用 PS 做后续调整。安装方式可以在扩展列表中搜索插件名字,或放在特定路径文件夹下,安装完成后重启 webUI 即可启用。 对于无需 Lora 的一键换脸插件 Roop,安装时间较长,需耐心等待。安装过程包括在特定文件夹地址栏输入“cmd”回车,在打开的 dos 界面粘贴代码安装 insightface。若出现错误,可下载最新秋叶 4.2 整合包。安装完成后重新打开启动器,后台会继续下载模型,需全程科学上网。使用时要注意参数设置,人脸像素可能偏低,可发送到“图生图”并使用 controlnet 中的 tile 模型重绘。此插件谨慎使用,切勿触犯法律。获取插件可添加公众号【白马与少年】回复【SD】。
2025-01-02
SD插件
以下是关于 SD 插件的相关信息: 1. 【SD】无需 Lora,一键换脸插件 Roop: 安装时间较长,需耐心等待。安装好后打开 SD 文件目录下的特定文件夹,在地址栏输入“cmd”回车,在打开的 dos 界面粘贴“python m pip install insightface==0.7.3 user”自动安装 insightface。若此阶段出错,建议下载最新秋叶 4.2 整合包(6 月 23 号更新),后台回复【SD】可在云盘下载。安装完成后重新打开启动器,后台会继续下载模型,全程需科学上网。此插件主要适用于真实人脸替换,对二次元人物作用不大。选用真实系模型“realisticVisionV20”,设置相关参数后点击生成,人脸像素可能偏低模糊,可发送到“图生图”并使用 controlnet 中的 tile 模型重绘。想要此插件,可添加公众号【白马与少年】回复【SD】。使用时需谨慎,切勿触犯法律。 2. 【SD】手涂蒙版定位插件 Latent Couple: 主提示词描述小鸟站在女孩肩上的画面、女孩装束和周围环境等,色块对应小鸟和女孩提示词后点击发送。填上常用标准负向提示词,大模型选择“revAnimated_v122”。多次生成后选择不错的进行高清修复放大。使用此插件可更灵活控制构图。想要此插件,可添加公众号【白马与少年】回复【SD】。 3. 【SD】告别提示词颜色污染!Cutoff 插件: 作者为白马少年,发布于 20230811 20:01,原文网址:https://mp.weixin.qq.com/s/xVskDEjDUET6yFo1YSZvTg 。在使用 Stable Diffusion 绘画时会出现颜色词汇互相污染的情况,此插件可解决该问题。因未收录到官方插件列表,可到 https://github.com/hnmr293/sdwebuicutoff 或作者云盘链接下载,安装后重启即可看到该插件。
2024-12-30
SD软件免费下载
以下是关于 Stable Diffusion(SD)相关软件和插件的信息: 1. 【SD】告别提示词颜色污染!Cutoff 插件: 该插件能解决 SD 绘画中颜色互相污染的问题。 未收录到官方插件列表,可到 https://github.com/hnmr293/sdwebuicutoff 下载,或到作者云盘链接下载。安装后重启即可使用。 2. 【SD】无需 Lora,一键换脸插件 Roop: 安装时间较长,需耐心等待。 安装步骤包括打开特定文件夹,在地址栏输入“cmd”回车,粘贴代码“python m pip install insightface==0.7.3 user”安装 insightface。 若安装出错,可下载最新的秋叶 4.2 整合包(6 月 23 号更新),回复【SD】获取云盘下载包。 安装完成后,重新打开启动器,后台会继续下载模型,需全程科学上网。 插件主要适用于真实人脸替换,对二次元人物作用不大。 可添加作者公众号【白马与少年】,回复【SD】获取插件。 3. 【SD】SD 的大哥 Fooocus 重磅问世,三步成图傻瓜式操作: Fooocus 使用最新推出的 SDXL 1.0 模型,结合了 stable diffusion 和 Midjourney 的优点。 保留了 SD 的开源属性,可部署到本地免费使用,操作界面简洁,省去了 WebUI 中复杂的参数调节。 勾选“Advanced”会弹出高级设置窗口,可调整多种参数。 风格选项整合了 100 多种不同预设风格。 配置要求:本地部署,需要不低于 8GB 的内存和 4GB 的英伟达显卡。 介绍/安装包下载:https://github.com/lllyasviel/Fooocus(文末领取软件+模型整合包:16G) 使用指南:https://github.com/lllyasviel/Fooocus/discussions/117 大模型(base 和 Refiner)默认放在:\\Fooocus_win64_1110\\Fooocus\\models\\checkpoints
2024-12-26
flux和sdXL出图的区别
Flux 和 SDXL 出图主要有以下区别: 1. 生成人物外观:Flux 存在女生脸油光满面、下巴等相同外观问题,而 SDXL 相对在这方面有改进。 2. 模型构成:SDXL 由 base 基础模型和 refiner 优化模型两个模型构成,能更有针对性地优化出图质量;Flux 中 Dev/Schnell 是从专业版中提取出来,导致多样性丧失。 3. 处理方式:在低显存运行时,可采用先使用 Flux 模型进行初始生成,再用 SDXL 放大的分阶段处理方式,有效控制显存使用。 4. 模型参数和分辨率:SDXL 的 base 模型参数数量为 35 亿,refiner 模型参数数量为 66 亿,总容量达 13G 之多,基于 10241024 的图片进行训练,可直接生成 1000 分辨率以上的图片,拥有更清晰的图像和更丰富的细节;而 Flux 在这方面相对较弱。
2024-12-20
flux和sd3.5出图的区别
Flux 和 SD3.5 出图存在以下区别: 1. 模型性质:Flux.1 有多种版本,如开源不可商用的 FLUX.1等。而 SD3.5 未提及相关性质。 2. 训练参数:Flux.1 的训练参数高达 120 亿,远超 SD3 Medium 的 20 亿。 3. 图像质量和提示词遵循能力:Flux.1 在图像质量、提示词跟随、尺寸适应、排版和输出多样性等方面超越了一些流行模型,如 Midjourney v6.0、DALL·E 3和 SD3Ultra 等。 4. 应用场景:Flux.1 可以在 Replicate 或 fal.ai 等平台上试用,支持在 Replicate、fal.ai 和 Comfy UI 等平台上使用,并且支持用户根据自己的数据集进行微调以生成特定风格或主题的图像。而 SD3.5 未提及相关应用场景。 5. 本地运行:文中尝试了在没有 N 卡,不使用复杂工作流搭建工具的 Mac Mini M1 上运行 FLUX.1,以及在边缘设备 Raspberry PI5B 上运行的情况,未提及 SD3.5 的相关内容。 6. 模型安装部署:对于 Flux.1,不同版本的模型下载后放置的位置不同,如 FLUX.1应放在 ComfyUI/models/unet/文件夹中。而 SD3.5 未提及相关安装部署内容。 7. 显存处理:对于 Flux.1,如果爆显存,“UNET 加载器”节点中的 weight_dtype 可以控制模型中权重使用的数据类型,设置为 fp8 可降低显存使用量,但可能会稍微降低质量。而 SD3.5 未提及相关显存处理内容。 8. 提示词使用:在训练 Flux 时,应尽量使用长提示词或自然语言,避免使用短提示词,因为 T5 自带 50%的删标。而 SD3.5 未提及相关提示词使用内容。
2024-12-20
sd的提示词有哪些语法
以下是关于 SD 提示词的语法: 1. 多个提示词之间使用英文半角符号“,”分隔,例如:masterpiece,best quality,ultradetailed,illustration,closeup,straight on,face focus,1girl,white hair,golden eyes,long hair,halo,angel wings,serene expression,looking at viewer。 2. 一般而言,概念性、大范围、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词。大致顺序为:。 3. 每个词语本身自带的权重可能不同,模型训练集中较多出现的关键词,输入一个词就能极大影响画面;较少出现的关键词,输入多个相关词汇对画面影响效果可能有限。提示词的顺序很重要,越靠后的权重越低。关键词最好具有特异性,措辞越具体越好,避免抽象和有解释空间的措辞。 4. 可以使用括号人工修改提示词的权重,例如: 将权重减少为原先的 25%。 5. 可以通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,语法为:例如:a,100 步采样,一开始。提示词为:fantasy landscape with a mountain and an oak in foreground shoddy 在第 25 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background shoddy 在第 50 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background masterful 在第 60 步后,提示词为:fantasy landscape with a lake and an oak in background masterful 在第 75 步后,提示词为:fantasy landscape with a lake and a christmas tree in background masterful。 6. 提示词还可以轮转,比如:在第一步时,提示词为“cow in a field”;在第二步时,提示词为"horse in a field.";在第三步时,提示词为"cow in a field",以此类推。 7. 交替词:in a field 可以支持多个词交替。 8. 可组合扩散(AND 语法):a cat AND a dog 比如想画一个猫和狗的混合物种,每一个要混合的东西支持加权重,比如 a cat:1.2 AND dog AND a benguin:2.2。通过继续向总数添加更多提示,这可以方便地生成微调的递归变化,比如 log AND frog:0.13 AND yellow eyes:0.08 。 请注意,权重值最好不要超过 1.5。
2024-12-19
做卖货视频,想要把其中的人物和部分物体换掉,声音也换掉,可以用哪些方法
以下是一些可以用于做卖货视频时换掉人物、部分物体和声音的方法: 1. 数字人脸创作: 可以使用一系列逼真的照片或插图人脸来创造,所有人脸都经过优化,在添加语音和动作时能实现最佳效果。 上传自己的照片,如自己、朋友或家人的面部照片进行创作。 利用 DID 自带的 Stable Diffusion 的能力生成想象中的人脸,如描述“一个外星女神”“一个微笑的十九世纪维多利亚绅士”等。 数字人像添加到人脸库后可随意重复使用,输入新脚本让其说话。 2. 数字人说话方式: 用 GPT 直接生成脚本让数字人说话。 利用 GPT3 文本生成技术撰写脚本。 先选好脸,再输入脚本。 输入准备好的脚本,在 DID 中选择数百种语言和口音,并调整角色说话风格。 上传自己的音频记录,或从电影、电视剧中剪辑喜欢的台词、吟唱自编的歌曲。 3. 相关工具和操作指引: 利用 TecCreative 工具,如数字人口播配音,输入口播文案,选择期望生成的数字人形象及目标语言即可生成数字人口播视频。 图片换脸,仅需上传原始图片和换脸图片,即可一键实现素材换脸。 视频换脸,自动识别视频中的人脸,并将其替换为选择的脸部。 音频合成数字人,上传音频文件,选择数字人角色和输出类型即可生成。 AI 配音,多语种智能配音,区分男声和女声。 AI 字幕,智能识别视频语言并生成对应字幕。 4. 实战操作: 准备视频中播放的内容文字,可利用 AI 生成。 使用剪映 App 对视频进行简单处理,如添加文字内容轨道,替换默认文本内容等。
2024-12-30
有什么好的ai可以做到把视频中的人物或物体,背景等换掉,而且把其中的语音改成自己想要的说话声
以下是一些可以实现您需求的 AI 工具和方法: 1. 剪映 App: 生成数字人:在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到视频中,左下角会提示渲染完成,可点击预览查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,将图片添加到视频轨道上,通过拖动轨道右侧竖线使其与视频对齐,选中轨道后可调整图片大小和数字人位置。 2. TecCreative 工具: 数字人口播配音:输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。 图片换脸:上传原始图片和换脸图片,一键实现素材换脸。 视频换脸:上传原始视频和换脸图片,自动识别并替换人脸。 音频合成数字人:上传音频文件,选择数字人角色和输出类型,生成数字人视频。 AI 配音:输入需配音文案,选择音色,立即生成。 AI 字幕:点击上传视频,开始生成,字幕解析完成后可下载 SRT 字幕。 在使用这些工具时,请注意相关的格式和文件大小限制,如图片大小上限 5M,支持 JPG、PNG 格式;音频文件支持 MP3 和 WAV 格式,文件大小上限 5M;视频支持 MP4 文件类型,大小上限为 50M。
2024-12-30
我想用AI做一个人物访谈录发在公众号上,请帮我生成一段200字的简介
以下是为您生成的 200 字左右的人物访谈录简介: 南瓜博士首次写小说获奖,背后离不开 AI 的助力。他先让 AI 写故事概要和角色背景介绍并做修改,还采用让 AI 以表格形式输出细节描述的技巧,打破叙事习惯,方便局部调整,确保都是具体细节。之后将生成的表格串联成文,过程中偶尔给出建议。然而,因小说字数超 2000 字,修改时 GPT4 记性不好,Claude 又改丢关键情节。但最终,在与 AI 的合作与磨合中,南瓜博士成功获奖,展现了 AI 在创作中的独特作用与挑战。
2024-12-26
我想用AI做一个人物访谈录发在公众号上,请帮我取公众号的一个名字,请给出10个供我参考
以下是为您提供的 10 个适合发布人物访谈录的公众号名字,供您参考: 1. 《深度人物志》 2. 《人物访谈集萃》 3. 《名人面对面访谈》 4. 《非凡人物访谈录》 5. 《人物心灵访谈》 6. 《魅力人物访谈窗》 7. 《人物故事访谈馆》 8. 《杰出人物访谈记》 9. 《人物风采访谈坛》 10. 《热点人物访谈坊》
2024-12-26
给我几个免费的图片转视频工具,主要针对于有人物的图片
以下为您推荐几个免费的图片转视频工具,主要针对有人物的图片: 1. Viggle: 网址:http://viggle.ai 有免费额度。 功能: /mix:将角色图像混合到动态视频中。 /animate:使用文本运动提示为静态角色设置动画。 /ideate:纯粹从文本创建角色视频。 /character:通过文本提示创建角色并将其动画化。 /stylize:使用文本提示符重新设计角色的样式并将其动画化。 操作步骤: 上传一张字符清晰的图片。 描述您希望角色执行的动作(或从https://viggle.ai/prompt中复制动作提示词)。 2. Dreamina: 网址:https://dreamina.jianying.com/aitool/home?subTab 优点:不需要🪜,每天有免费额度。 注册:抖音号或手机号。 时间:5min 3. Sora: 网址:https://openai.com/sora 优点:发布的成果好,集成在 openai 一套里可用。 限制:需要🪜,需要 gmail 注册,需要订阅后才能使用。 时间:30 60min 价格:GPT 4 20$一个月
2024-12-25
免费的ai虚拟人物
以下为您介绍一些免费的 AI 虚拟人物相关内容: 1. Vocs AI:这是一个免费的人工智能语音生成器和转换器。您可以按照以下步骤操作: 上传一段清晰的无伴奏人声录音,推荐 wav 或 mp3 格式,更推荐 wav。 从超过 20 名才华横溢的 AI 歌手、说唱歌手、叙述者、角色和配音艺术家中选择,将原始无伴奏声音转换成 AI 虚拟艺术家的声音。 点击“转换”,Vocs AI 的语音技术将把您上传的音频转换成 AI 版本的原声。 下载转换后的音频。需要注意的是,输入音频的质量将直接影响 AI 人声转换的输出质量。链接:https://www.vocs.ai/ 2. 剪映数字人“私有化”: 准备谷歌账号(可在淘宝或者在账号解决平台“”购买)。 第一步,打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”。 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步,等待专属的数字人视频出炉。 3. 关于数字人的一些算法开源代码仓库: ASR 语音识别:openai 的 whisper:https://github.com/openai/whisper ;wenet:https://github.com/wenete2e/wenet ;speech_recognition:https://github.com/Uberi/speech_recognition 。 AI Agent:大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 。 TTS:微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费;VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本;sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面。 简单构建数字人还存在一些问题,例如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2024-12-24