以下为您介绍一些免费的 AI 虚拟人物相关内容:
简单构建数字人还存在一些问题,例如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
[[twi]@Vocs_twi.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/U9s0bpgTWotba4xaCPbcBloKnVe?allow_redirect=1)链接:https://www.vocs.ai/Vocs AI提供了一个免费的AI语音生成和转换工具。操作步骤如下:上传一段清晰的无伴奏人声录音。(wav或mp3格式,更推荐wav)从超过20名才华横溢的AI歌手、说唱歌手、叙述者、角色和配音艺术家中选择,将你的原始无伴奏声音转换成AI虚拟艺术家的声音。点击“转换”,Vocs AI的语音技术将把你上传的音频转换成AI版本的原声。下载你转换后的音频。Vocs AI强调,输入音频的质量将直接影响AI人声转换的输出质量。因此,最好在进行AI转换之前,确保你的原始人声听起来正如你所希望的那样。
尽管剪映已经有很多公模数字人,但是从抖音上大火的数字人账号上看,私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。📍注意:需要谷歌账号(淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买)1.第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面2.第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成!反复调试后给大家选出了最佳参数!1.第三步:等着自己专属的数字人视频出炉!有关数字人使用上的问题,欢迎在底部评论区留言,一起交流~同时如果对数字人课程感兴趣的话,欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程!📌课程内容:[实战课程:数字人课程](https://waytoagi.feishu.cn/wiki/JOWjwM0qfi2rYVkUIwychk9MnSh)🎉在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0🌍:aiwarts101
上述算法开源的代码有很多,这里列出一些仓库供大家参考:ASR语音识别openai的whisper:https://github.com/openai/whisperwenet:https://github.com/wenet-e2e/wenetspeech_recognition(这是一个语音识别的接口集合,里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognitionAI Agent大模型部分就比较多了,包括ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent部分可以使用LangChain的模块去做自定义,里面基本包含了Agent实现的几个组件(https://www.langchain.com/)TTS微软的edge-tts:https://github.com/rany2/edge-tts,只能使用里面预设的人物声音,目前接口免费。VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits系列可以自己训练出想要的人声。so-vits-svc:https://github.com/svc-develop-team/so-vits-svc,专注到唱歌上面,前段时间很火的AI孙燕姿。除了算法,人物建模模型可以通过手动建模(音频驱动)或者AIGC的方式生成人物的动态效果(例如wav2lip模型)实现,这样就完成了一个最简单的数字人。当然这种简单的构建方式还存在很多的问题,例如:如何生成指定人物的声音?TTS生成的音频如何精确驱动数字人口型以及做出相应的动作?数字人如何使用知识库,做出某个领域的专业性回答?