免费的AI数字人模型。-WayToAGI

回答

以下为您介绍一些免费的 AI 数字人模型及相关生成方法：

算法开源代码仓库：
- ASR 语音识别：
  - openai 的 whisper：https://github.com/openai/whisper
  - wenet：https://github.com/wenet-e2e/wenet
  - speech_recognition（这是一个语音识别的接口集合，里面有不同实现的语音识别的接口）：https://github.com/Uberi/speech_recognition
- TTS：
  - 微软的 edge-tts：https://github.com/rany2/edge-tts，只能使用里面预设的人物声音，目前接口免费。
  - VITS：https://github.com/jaywalnut310/vits，还有很多的分支版本，可以去搜索一下，vits 系列可以自己训练出想要的人声。
  - so-vits-svc：https://github.com/svc-develop-team/so-vits-svc，专注到唱歌上面，前段时间很火的 AI 孙燕姿。
- 大模型：包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。
- Agent 部分可以使用 LangChain 的模块去做自定义，里面基本包含了 Agent 实现的几个组件(https://www.langchain.com/)
在剪映中生成数字人：
- 在剪映右侧窗口顶部，打开“数字人”选项，选取一位免费的、适合的数字人形象，如“婉婉-青春”。选择数字人形象时，软件会播放其声音，可判断是否需要，点击右下角的“添加数字人”将其添加到当前视频中。剪映 App 会根据提供的内容生成对应音视频并添加到轨道中，左下角会提示渲染完成时间，之后可点击预览按钮查看效果。
- 为让视频更美观，可增加背景图片。点击左上角的“媒体”菜单并点击“导入”按钮，选择本地图片上传，将图片添加到视频轨道上，可调整图片位置和大小。
数字人“私有化”：
- 打开谷歌浏览器，点击链接 https://github.com/facefusion/facefusion-colab 并点击 open colab 进到程序主要运行界面，在右上角点击“代码执行程序”选择“全部运行”，无需安装和付费。点击红框对应的 URL 打开操作界面。
- 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频，保持默认参数，点击“START”生成。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

[title]AI数字人-定义数字世界中的你[heading2]一、数字人简介[heading4]1.2算法驱动的数字人上述算法开源的代码有很多，这里列出一些仓库供大家参考：ASR语音识别openai的whisper:https://github.com/openai/whisperwenet:https://github.com/wenet-e2e/wenetspeech_recognition(这是一个语音识别的接口集合，里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognitionAI Agent大模型部分就比较多了，包括ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent部分可以使用LangChain的模块去做自定义，里面基本包含了Agent实现的几个组件(https://www.langchain.com/)TTS微软的edge-tts：https://github.com/rany2/edge-tts，只能使用里面预设的人物声音，目前接口免费。VITS：https://github.com/jaywalnut310/vits，还有很多的分支版本，可以去搜索一下，vits系列可以自己训练出想要的人声。so-vits-svc:https://github.com/svc-develop-team/so-vits-svc，专注到唱歌上面，前段时间很火的AI孙燕姿。除了算法，人物建模模型可以通过手动建模(音频驱动)或者AIGC的方式生成人物的动态效果(例如wav2lip模型)实现，这样就完成了一个最简单的数字人。当然这种简单的构建方式还存在很多的问题，例如：如何生成指定人物的声音？TTS生成的音频如何精确驱动数字人口型以及做出相应的动作？数字人如何使用知识库，做出某个领域的专业性回答？

实战：每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法！

[title]实战：每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法！[heading1]三、生成数字人3.1生成数字人在剪映右侧窗口顶部，我们打开“数字人”选项，选取一位免费的、适合的数字人形象，这里我选择“婉婉-青春”。当你选择一个数字人形象时，软件会马上播放出该数字人的声音。你可以判断是否是你需要的，点击右下角的“添加数字人”，就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容，来生成对应音视频，并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮，查看生成的数字人效果。3.2增加背景图片接下来，可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道，或者点击软件中间文字内容，按删除键删去文字：为了让视频更美观，我们为视频增加背景图片。当然你可以增加多个背景图片，为简化演示，这里增加1张图片。点击左上角的“媒体”菜单，并点击“导入”按钮，来选择本地的一张图片上传：我选择一张书架图片上传，然后像添加文字内容一样，点击图片右下角的加号，将这个图片添加到视频的轨道上（会覆盖数字人）：此时，书架图片就会在视频轨道的下面，添加一条新轨道：为了让图片在整个视频播放的时候都显示，可以点击这个轨道最右侧的竖线，向右拖拽，直到视频的最后，也就是和视频对齐：此时，背景图片所在的轨道是选中状态。如果没选中，鼠标点击一下这个规定即可。在显示区域，拖动背景图的一个角，将图片放大到适合的尺寸，比如覆盖视频窗口。并将数字人拖动到合适的位置:

方案：剪映数字人“个性化“—无限免费私模数字人

尽管剪映已经有很多公模数字人，但是从抖音上大火的数字人账号上看，私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。📍注意：需要谷歌账号（淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买）1.第一步打开谷歌浏览器，点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行，无需安装，无需付费。点击红框对应的URL就会打开操作界面2.第二步，点击“source”上传自己的照片和“target”上传之前的剪映数字人视频，保持默认参数，点击“START”就能生成！反复调试后给大家选出了最佳参数！1.第三步：等着自己专属的数字人视频出炉！有关数字人使用上的问题，欢迎在底部评论区留言，一起交流~同时如果对数字人课程感兴趣的话，欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程！📌课程内容：[实战课程：数字人课程](https://waytoagi.feishu.cn/wiki/JOWjwM0qfi2rYVkUIwychk9MnSh)🎉在线观看第一节：https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 🌍：aiwarts101