直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

数字人说话

回答

数字人说话的相关内容如下:

  • 创作数字人脸的方式有三种:
    • 使用一系列逼真的照片或插图人脸,这些人脸经过优化,在添加语音和动作时能实现最佳效果。
    • 上传自己的照片,如自己、朋友或家人的面部照片。
    • 利用 D-ID 自带的 Stable Diffusion 的能力生成想象中的人脸,通过描述想要的脸的样子来生成,如“一个外星女神”“一个微笑的十九世纪维多利亚绅士”等。
  • 让数字人说话的方式也有三种:
    • 利用 GPT 直接生成脚本让数字人说话,如利用 GPT-3 文本生成技术撰写脚本。
    • 先选好脸,再输入脚本,D-ID 里有数百种语言和口音,可选择想要使用的声音,并调整角色说话的风格。
    • 上传自己的音频记录,或者从电影或电视剧中剪辑出最喜欢的台词,或是吟唱自编的歌曲。
  • 一些相关工具及特点和使用方法:
    • HEYGEN:优点是人物灵活,五官自然,视频生成很快;缺点是中文的人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。
    • D-ID:优点是制作简单,人物灵活;缺点是免费版下载后有水印。使用方法为点击网址,点击右上角的 Create vedio,选择人物形象,可点击 ADD 添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开自己生成的视频,可下载或直接分享给朋友。
    • KreadoAI:优点是免费,功能齐全;缺点是音色很 AI。使用方法为点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”的功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景可添加背景图,最后点击生成视频。

此外,出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务以及 AI 智能硬件。其搭建的数字人 workflow 仅需上传一张照片,输入一段文字或上传一段音频,就可以生成短视频让“照片开口说话”。还有利用历史名人的肖像画生成对话并剪辑成有趣短视频的例子,如李白吟诗的视频在 B 站点赞超 1000 万。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

电商:带货本地生活

第一种,可以使用一系列逼真的照片或插图人脸来创造。所有人脸都经过优化,可以在添加语音和动作时实现最佳效果。第二种,上传自己的照片,可以是自己的面部、朋友或家人的面部照片就可以创作了第三种,利用D-ID自带的Stable Diffusion的能力生成您想象中的任何人脸。简单讲,你可以描述下你想要的这张脸长啥样,比如“一个外星女神”,“一个微笑的十九世纪维多利亚绅士”等等,它马上可以生成你长你想要的脸。不管用哪种方式,一旦这个数字人像被添加到人脸库里,你就可以随意重复使用它。只需输入新的脚本,就可以让这个数字人像说任何你想让他说的话。瞧,这就是用一些历史名人的肖像画生成的对话,剪辑成有剧情的短视频就非常有趣,里面就有我喜欢的李白吟诗,目前该博主在B站点赞已经超过1000万,只有你想不到,没有你做不到。[heading1]六、三种方式让数字人说话[content]可以用GPT直接生成脚本让数字人说话第一种,利用GPT-3文本生成技术来撰写脚本。这一全新的脚本撰写功能,保证我们再也不会因为无话可说而感到尴尬;也可以先选好脸,再输入脚本第二种,输入准备好的脚本,D-ID里面有数百种语言和口音,选择你想要使用的声音,并调整角色说话的风格,就可以了。第三种,也是最基本的,上传自己的音频记录。或者从电影或电视剧中剪辑出您最喜欢的台词,或是吟唱自编的歌曲也是可以的。

照片数字人工作流及语音合成(TTS)API- 出门问问Mobvoi

工作流作者:Chaojie https://github.com/chaojie/ComfyUI-mobvoi-openapi/blob/main/wf.json创意策划:JessyJangHi,亲爱的AI爱好者及开发者老师们,ComfyUI全球领导力峰会我们特意搭建数字人workflow(照片数字人驱动),仅需要上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”,希望能让大家感受生成式AI的魅力,应用于更多的使用场景。*本次活动特意提供了免费api额度及操作指南给大家进行体验,诚邀大家玩起来~以下是一些不同风格的照片驱动效果展示👇file:未命名项目(9).mp4我是能扫的动态二维码file:未命名项目(5).mp4皮克斯风格(女)file:未命名项目(6).mp4皮克斯风格(男)file:8409_1718172922.mp4真人照片效果展示👉真人、卡通、有胡须遮挡、有眼镜装饰,都可以驱动尝试~欢迎多多体验!原照片- V50老爷爷file:未命名项目(7).mp4照片驱动后的效果原照片-胡须遮挡file:未命名项目(10).mp4片驱动后的效果file:8411_1718173605.mp4真人照片效果展示

AI 数字人|一键让照片说话

优点:人物灵活,五官自然,视频生成很快。五星好评。缺点:中文的人声选择较少[heading3]使用方法[content]1.点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片1.上传后效果如图所示,My Avatar处显示上传的照片1.点开大图后,点击Create with AI Studio,进入数字人制作1.写上视频文案并选择配音音色,也可以自行上传音频1.最后点击Submit,就可以得到一段数字人视频啦~[heading2]D-ID[content]优点:制作简单,人物灵活缺点:为了防止侵权,免费版下载后有水印[heading3]使用方法[content]1.点击上面的网址,点击右上角的Create vedio1.选择人物形象,你可以点击ADD添加你的照片,或者使用D-ID给出的人物形象1.配音时,你可以选择提供文字选择音色,或者直接上传一段音频1.最后,点击Generate vedio就可以生成一段视频啦1.打开自己生成的视频,可以下载或者直接分享给朋友~[heading2]KreadoAI[content]优点:免费(对于普通娱乐玩家,嗯这很重要),功能齐全缺点:音色很ai[heading3]使用方法[content]1.点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能1.点击开始创作,选择自定义照片1.配音时,你可以选择提供文字选择音色,或者直接上传一段音频1.打开绿幕按钮,点击背景,可以添加背景图1.最后,点击生成视频

其他人在问
目前做的比较好的数字人直播有哪些?
目前数字人直播在店播场景下效果较好,以下是一些相关信息: 电商直播分为达播跟店播,数字人直播在店播中的数据基本能保持跟真人一样。 数字人直播适用的品类和场景: 适用于不需要强展示的商品,如品牌食品饮料。 适用于虚拟商品,如门票、优惠券等。 不适用于促销场景。 数字人直播的盈利方式: 直接卖数字人工具软件,分实时驱动和非实时驱动两类,实时驱动价格较高,非实时效果差且价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 目前业界对数字人的定义还没有统一标准,一般可分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业和直播带货。
2024-10-18
数字人直播防分控要做到哪些?
以下是关于数字人直播防分控需要做到的一些方面: 在盈利方式方面: 1. 可以直接销售数字人工具软件,包括实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 在适用品类和场景方面: 1. 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,因其过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,这涉及主播话术、套路和调动直播间氛围的能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果最佳,数据基本能保持跟真人一样。 在壁垒和未来市场格局方面: 1. 从长期来看,技术上没有壁垒,但目前仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高,比如更真实的对口型、更低的响应延迟等。 2. 市场不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果的公司。因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题会很麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难与之竞争。
2024-10-18
ai数字人直播
以下是关于 AI 数字人直播的相关信息: AI 数字人直播盈利方式: 1. 直接卖数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人接管,市面标准零售价一年 4 6 万往上。非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料。不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路和调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果最好,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上没壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。单纯靠开源算法拼的东西,实时性、可用性不高。 2. 不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司。因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜、不考虑客户效果的公司,售后问题麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等全环节打通服务,会绑定商家,竞争难度大。 数字人简介: 数字人是指运用数字技术创造出来的人,虽现阶段不能像科幻作品中的人型机器人一样具备高度智能,但已在生活各类场景中出现,且随着 AI 技术发展迎来应用爆发。目前业界没有准确定义,一般根据技术栈不同分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关。随着视觉算法进步,在无昂贵动捕设备时,也可通过摄像头捕捉人体骨骼和人脸关键点信息,达到不错效果。
2024-10-18
公司数字化转型对于客户服务增值有什么好处?如何平衡技术和个性化,人性化服务
公司数字化转型对客户服务增值的好处包括: 1. 个性化服务:利用 AI 分析客户行为数据,深入了解客户需求和偏好,为其提供定制化的产品推荐和服务,如电子商务网站根据用户购物历史和浏览习惯推荐相似产品,在线零售商利用客户购买数据推荐新产品或补充产品,从而提升客户体验和忠诚度。 2. 定制化沟通和推广:通过更具针对性的沟通和营销活动加强与客户的关系,提高忠诚度。根据客户偏好和行为数据定制营销活动,在客户支持和沟通中采用个性化方法,定期收集客户反馈并用于优化服务和产品,监控效果并不断优化推荐和营销策略。 3. 提升操作效率:Token 化在自然语言处理中应用,将大段文本分解成小块处理单元,便于管理和分析复杂文本数据,使 AI 模型快速识别关键信息,加速决策过程,提升业务响应速度。 4. 优化客户服务:Token 化使客户服务自动化成为可能,通过自动响应系统快速准确处理客户请求,极大提升客户满意度和品牌忠诚度。 5. 个性化营销:利用 Token 化分析用户行为和偏好,提供高度个性化的营销内容,增加销售转化率。 在平衡技术和个性化、人性化服务方面,可以采取以下措施: 1. 深入挖掘客户数据,同时注重保护客户隐私和数据安全。 2. 结合人工干预和监督,确保服务的人性化和温度。 3. 持续收集客户反馈,根据反馈调整技术应用和服务策略。 4. 培训员工,使其在运用技术的同时能够提供贴心的服务。
2024-10-16
我想找一个免费生成数字人的软件
以下为您介绍几款免费生成数字人的软件及使用方法: 剪映:在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,可点击预览查看效果。还可为视频增加背景图片,删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”本地图片,将图片添加到视频轨道上,调整图片位置和大小。 HEYGEN:优点是人物灵活、五官自然、视频生成快;缺点是中文人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片,上传后效果在My Avatar处显示,点开大图后点击Create with AI Studio进入制作,写上视频文案并选择配音音色或自行上传音频,最后点击Submit得到数字人视频。 DID:优点是制作简单、人物灵活;缺点是免费版下载后有水印。使用方法为点击网址,点击右上角Create vedio,选择人物形象,可点击ADD添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击Generate vedio生成视频,打开生成的视频可下载或分享。 KreadoAI:优点是免费、功能齐全;缺点是音色较AI。使用方法为点击网址注册后获得120免费k币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。 此外,还有通过AI换脸软件完成数字人“私有化”的方法:需要谷歌账号(可在淘宝或“”购买)。第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusioncolab 并点击open colab进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,点击红框对应的URL打开操作界面;第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成;第三步等待专属数字人视频出炉。有关数字人使用问题可在评论区留言交流,对数字人课程感兴趣可查看通往AGI之路X AI沃茨的《克隆你自己》课程。在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 。
2024-10-16
近期数字人比较成熟的应用有哪些
数字人目前有以下较为成熟的应用: 1. 影视行业:真人驱动的数字人通过动捕设备或视觉算法还原真人动作表情,用于影视制作。 2. 直播带货:真人驱动的数字人在直播带货领域发挥作用。 3. 家庭:未来可能会有数字人管家,全面接管智能家居或其他设备。 4. 学校:未来可能会有数字人老师,为学生答疑解惑。 5. 商场:未来可能会有数字人导购,为顾客提供指路、托管个人物品等服务。 数字人的构建方式包括: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表如 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表如 UE、Unity、虚幻引擎 MetaHuman 等。 3. AIGC:虽然省去建模流程,但在数字人 ID 一致性和帧连贯性上存在弊端,不过算法发展迅速,未来可能会有改善。AIGC 还有直接生成 2D/3D 引擎模型的探索方向。
2024-10-16
我想让ai模拟抖音网红说话,有最佳实践可以参考吗?
目前暂时没有关于让 AI 模拟抖音网红说话的最佳实践内容。但一般来说,您可以先分析一些抖音网红的语言特点,比如常用的词汇、语气、口头禅、表达方式等,然后为 AI 提供这些特征的描述和示例,让其学习和模仿。同时,您还可以通过不断调整输入的提示词和训练数据,来优化 AI 的模拟效果。
2024-09-29
让图片开口说话
以下是一些让图片开口说话的方法和相关信息: 可以使用一键数字人的好用小工具来实现让照片开口讲话。 实战教程方面,可使用 SadTalker 让照片说话。在图片预处理方式中,crop 只截取图片头部,full 保留整张照片,下面的勾选项有文字解释,可自行尝试。点击 generate 后,由于涉及到视频的推理和转换,输出时间远大于 AI 绘图和 sovits 的声音推理,需做好等待准备。例如导入 13 秒的音频,预计需要 3 5 分钟(3060 12g 显卡)。最终生成的视频长度与音频一致,若想制作长视频,最好剪成小段分别推理再合并。完成后可打开输出目录或下载视频文件查看效果。带面部修复会有不同效果。 SadTalker 是利用目前主流的开源程序让照片说话唱歌,达到基本的唇形同步。其相关链接如下: GitHub 地址:https://github.com/OpenTalker/SadTalker 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 对于编程、python、conda 不熟悉的,可使用整合包:用夸克网盘分享的「EZAIStarterv0.9.8.zip」,链接:https://pan.quark.cn/s/1d5ca9f57f5c ;视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 。具体步骤为:点我启动,在启动界面中选择音频、图像口型同步的下载图标,下载完毕后启动应用,会弹出独立窗口(非默认浏览器),选择 SadTalker 同步器,分别导入图片和声音。
2024-09-26
让照片说话 软件有哪些
以下是一些能让照片说话的软件及相关信息: SadTalker: 开源程序,可让照片说话唱歌,达到基本唇形同步。 独立使用或作为插件放入 StableDiffusion。 整合包:史上最炸裂版 AI 工具箱,包含 SDAI 绘画、VITS 文本转语音、wav2lip、sadTalker 唇型同步、视频修复,支持 A 卡。 相关链接: GitHub 地址:https://github.com/OpenTalker/SadTalker 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 夸克网盘整合包:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,等待弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音。 图片预处理方式:crop 只截取图片头部,full 保留整张照片。 由于涉及视频推理和转换,输出时间较长,需做好等待准备。最终生成的视频长度与音频一致,制作长视频建议剪成小段分别推理后合并。完成后可打开输出目录或下载视频文件。 KreadoAI: 点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能。 使用方法:点击开始创作,选择自定义照片;配音时可选择提供文字选择音色或直接上传音频;打开绿幕按钮,点击背景可添加背景图;最后点击生成视频。
2024-09-14
什么软件可以直接生成卡通形象并且能说话
以下是一些可以生成卡通形象并且能说话的软件: 1. Creatie AI:AI 驱动的设计神器,能在几分钟内设计网站或程序,融合多种功能,自动分析设计文件,创建统一样式库,快速转化为高保真可交互原型并生成代码。网址:http://creatie.ai 。 2. 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。网址:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20 。 3. NoLang:支持将文字、网页链接、PDF 等直接转换为视频,自动总结 PDF 内容并生成解答视频,还可追问,但目前服务器承受压力大,支持日语和英语。网址:http://nolang.com 。 此外,制作数字人的工具还有: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-09-03
如何让照片跟着语音说话
以下是让照片跟着语音说话的两种方法: 方法一:使用 SadTalker 1. 开源程序 SadTalker 可实现让照片说话唱歌并达到基本唇形同步。 GitHub 地址:https://github.com/OpenTalker/SadTalker 可独立使用或作为插件放入 stablediffusion 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 2. 对于编程、python、conda 不熟悉的,建议使用整合包: 史上最炸裂版 AI 工具箱来啦,SDAI 绘画、VITS 文本转语音,wav2lip、sadTalker 唇型同步,视频修复,支持 A 卡! 夸克网盘分享链接:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 3. 具体步骤: 点我启动,在启动界面中,选择音频、图像口型同步的下载图标。 下载完毕后启动应用,会弹出独立窗口。 选择 sadtalker 同步器,分别导入图片和声音。 图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项已有文字解释,可自行尝试几次。 点击 generate。由于涉及到视频的推理和转换,输出时间要远远大于 ai 绘图和 sovits 的声音推理,需做好等待准备。例如导入 13 秒的音频,预计需要 3 5 分钟(3060 12g 显卡)。 最终生成的视频长度与音频一致,如果想制作长视频,最好剪成小段,分别推理,然后合并。完成后,可打开输出目录或下载视频文件查看效果。 方法二:使用 DID 1. 点击网址,点击右上角的 Create vedio。 2. 选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。
2024-08-27
给我介绍一个可以让图片说话的ai
以下为您介绍可以让图片说话的 AI 工具: 1. 剪映 AI: 功能:上传一张照片,即可输入文字/音频等,驱动照片数字人对口型说话或唱歌。 使用场景: 用户 UGC 玩法:新歌发行(歌手照片+有词的歌)、趣味而创(老照片/影视剧梗图+流行音乐/网络用语)、宠物照片+宠物说话或宠物唱歌、表情包趣味玩梗、趣味表情包+想说的话。 PGC 使用:口播视频,制作自己照片数字人、宝宝/宠物说话、影视动漫等人物说话唱歌,进行影视二创、禅宗小和尚形象,说佛言佛语快速涨粉便于快速起号。 2. SadTalker: 介绍:利用目前主流的开源程序让照片说话唱歌,达到基本的唇形同步。 资源获取: GitHub 地址:https://github.com/OpenTalker/SadTalker 整合包:我用夸克网盘分享了「EZAIStarterv0.9.8.zip」,点击链接即可保存 链接:https://pan.quark.cn/s/1d5ca9f57f5c 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 、https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 具体步骤:点我启动,在启动界面中,选择音频、图像口型同步的下载图标;下载完毕后,启动应用,等待,会弹出一个独立的窗口(而不是默认浏览器);选择 SadTalker 同步器,分别导入图片和声音。 3. KreadoAI: 使用方法: 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。
2024-08-21