数字人说话的相关内容如下:
此外,出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务以及 AI 智能硬件。其搭建的数字人 workflow 仅需上传一张照片,输入一段文字或上传一段音频,就可以生成短视频让“照片开口说话”。还有利用历史名人的肖像画生成对话并剪辑成有趣短视频的例子,如李白吟诗的视频在 B 站点赞超 1000 万。
第一种,可以使用一系列逼真的照片或插图人脸来创造。所有人脸都经过优化,可以在添加语音和动作时实现最佳效果。第二种,上传自己的照片,可以是自己的面部、朋友或家人的面部照片就可以创作了第三种,利用D-ID自带的Stable Diffusion的能力生成您想象中的任何人脸。简单讲,你可以描述下你想要的这张脸长啥样,比如“一个外星女神”,“一个微笑的十九世纪维多利亚绅士”等等,它马上可以生成你长你想要的脸。不管用哪种方式,一旦这个数字人像被添加到人脸库里,你就可以随意重复使用它。只需输入新的脚本,就可以让这个数字人像说任何你想让他说的话。瞧,这就是用一些历史名人的肖像画生成的对话,剪辑成有剧情的短视频就非常有趣,里面就有我喜欢的李白吟诗,目前该博主在B站点赞已经超过1000万,只有你想不到,没有你做不到。[heading1]六、三种方式让数字人说话[content]可以用GPT直接生成脚本让数字人说话第一种,利用GPT-3文本生成技术来撰写脚本。这一全新的脚本撰写功能,保证我们再也不会因为无话可说而感到尴尬;也可以先选好脸,再输入脚本第二种,输入准备好的脚本,D-ID里面有数百种语言和口音,选择你想要使用的声音,并调整角色说话的风格,就可以了。第三种,也是最基本的,上传自己的音频记录。或者从电影或电视剧中剪辑出您最喜欢的台词,或是吟唱自编的歌曲也是可以的。
工作流作者:Chaojie https://github.com/chaojie/ComfyUI-mobvoi-openapi/blob/main/wf.json创意策划:JessyJangHi,亲爱的AI爱好者及开发者老师们,ComfyUI全球领导力峰会我们特意搭建数字人workflow(照片数字人驱动),仅需要上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”,希望能让大家感受生成式AI的魅力,应用于更多的使用场景。*本次活动特意提供了免费api额度及操作指南给大家进行体验,诚邀大家玩起来~以下是一些不同风格的照片驱动效果展示👇file:未命名项目(9).mp4我是能扫的动态二维码file:未命名项目(5).mp4皮克斯风格(女)file:未命名项目(6).mp4皮克斯风格(男)file:8409_1718172922.mp4真人照片效果展示👉真人、卡通、有胡须遮挡、有眼镜装饰,都可以驱动尝试~欢迎多多体验!原照片- V50老爷爷file:未命名项目(7).mp4照片驱动后的效果原照片-胡须遮挡file:未命名项目(10).mp4片驱动后的效果file:8411_1718173605.mp4真人照片效果展示
优点:人物灵活,五官自然,视频生成很快。五星好评。缺点:中文的人声选择较少[heading3]使用方法[content]1.点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片1.上传后效果如图所示,My Avatar处显示上传的照片1.点开大图后,点击Create with AI Studio,进入数字人制作1.写上视频文案并选择配音音色,也可以自行上传音频1.最后点击Submit,就可以得到一段数字人视频啦~[heading2]D-ID[content]优点:制作简单,人物灵活缺点:为了防止侵权,免费版下载后有水印[heading3]使用方法[content]1.点击上面的网址,点击右上角的Create vedio1.选择人物形象,你可以点击ADD添加你的照片,或者使用D-ID给出的人物形象1.配音时,你可以选择提供文字选择音色,或者直接上传一段音频1.最后,点击Generate vedio就可以生成一段视频啦1.打开自己生成的视频,可以下载或者直接分享给朋友~[heading2]KreadoAI[content]优点:免费(对于普通娱乐玩家,嗯这很重要),功能齐全缺点:音色很ai[heading3]使用方法[content]1.点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能1.点击开始创作,选择自定义照片1.配音时,你可以选择提供文字选择音色,或者直接上传一段音频1.打开绿幕按钮,点击背景,可以添加背景图1.最后,点击生成视频