拥有自己的数字人可以通过以下几种方式实现:
关于卡尔,从创建AIGC开源学习网站learnpromptl.pro,到建立卡尔的AI沃茨万人社群,他一直致力于AI学习圈。这一次,他建立了一套完整的数字人学习体系,放在这门《克隆你自己》的课程中,带领大家全方位掌握数字人各技能💪同时,他详细回顾了2023年数字人领域的破圈事件⬇️|文本|标签|备注|附件|<br>|-|-|-|-|<br>|AI马斯克对谈AI乔布斯超331.9k播放||||<br>|霉霉说中文火遍全网,HeyGen再破圈||||<br>|AI郭德纲讲英文相声||||<br>|硅语翻译|海外明星送出中文新年祝福||||<br>|通义千问|兵马俑跳科目三||||<br>|小冰推出支持交互的多模态数字人||||<br>|阿根廷新总统用HeyGen做演讲||||🤖️数字人的出现,可以极大程度上优化工作流,尤其在制作个人ip短视频、配音、直播甚至到智能客服、虚拟偶像等各种领域都可以完成赋能。所以如果你想加入这场数字人浪潮,拥有自己的数字分身,优化自己的工作流,这门具备完整数字人学习体系的课程,正是你的需求💡
上述种种,如果都要自建代码实现各模块,开发工作量巨大,迭代难度也很高,对于个人开发者来讲不现实。因此我们推荐借助开源社区的力量,现在开源社区已经有了像dify、fastgpt等等成熟的高质量AI编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等等。我们可以通过这些框架快速编排出自己的AI Agent,赋予数字人灵魂。在笔者的开源项目中,使用了dify的框架,利用其编排和可视化交互任意修改流程,构造不同的AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时Dify的API暴露了audio-to-text和text-to-audio两个接口,基于这个两个接口就可以将数字人的语音识别和语音生成都交由Dify控制,从而低门槛做出来自己高度定制化的数字人(如下图),具体的部署过程参考B站视频:https://www.bilibili.com/video/BV1kZWvesE25。
3.1生成数字人在剪映右侧窗口顶部,我们打开“数字人”选项,选取一位免费的、适合的数字人形象,这里我选择“婉婉-青春”。当你选择一个数字人形象时,软件会马上播放出该数字人的声音。你可以判断是否是你需要的,点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容,来生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮,查看生成的数字人效果。3.2增加背景图片接下来,可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道,或者点击软件中间文字内容,按删除键删去文字:为了让视频更美观,我们为视频增加背景图片。当然你可以增加多个背景图片,为简化演示,这里增加1张图片。点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传:我选择一张书架图片上传,然后像添加文字内容一样,点击图片右下角的加号,将这个图片添加到视频的轨道上(会覆盖数字人):