与知识库对话 - ai数字人怎么生成

回答

生成 AI 数字人主要有以下步骤：

在剪映中生成数字人：
- 打开剪映右侧窗口顶部的“数字人”选项，选取免费且适合的数字人形象，如“婉婉-青春”。
- 软件会播放数字人的声音，可判断是否需要，点击右下角“添加数字人”将其添加到当前视频中，软件会生成对应音视频并添加到轨道中，左下角会提示渲染完成时间，可点击预览查看效果。
增加背景图片：
- 删除先前导入的文本内容，因为视频音频已包含文字。
- 点击左上角“媒体”菜单并“导入”，选择本地图片上传，如一张书架图片，点击图片右下角加号添加到视频轨道（会覆盖数字人）。
- 拖动轨道最右侧竖线使图片与视频对齐，选中轨道，拖动图片角放大到合适尺寸，并将数字人拖动到合适位置。
增加字幕：
- 点击文本-智能字幕-识别字幕，点击开始识别，软件会自动将文字智能分段形成字幕。
算法驱动的数字人实现流程：
- 核心算法包括 ASR（语音识别），能将用户音频数据转化为文字，便于数字人理解和生成回应。
- AI Agent（人工智能体）充当数字人大脑，可接入大语言模型，拥有记忆模块等使其更真实。
- TTS（文字转语音）将数字人依靠 LLM 生成的文字输出转换为语音。

完成上述步骤后，点击右上角“导出”按钮导出视频备用。若希望数字人换脸，则需使用其他工具。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

3.1生成数字人在剪映右侧窗口顶部，我们打开“数字人”选项，选取一位免费的、适合的数字人形象，这里我选择“婉婉-青春”。当你选择一个数字人形象时，软件会马上播放出该数字人的声音。你可以判断是否是你需要的，点击右下角的“添加数字人”，就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容，来生成对应音视频，并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮，查看生成的数字人效果。3.2增加背景图片接下来，可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道，或者点击软件中间文字内容，按删除键删去文字：为了让视频更美观，我们为视频增加背景图片。当然你可以增加多个背景图片，为简化演示，这里增加1张图片。点击左上角的“媒体”菜单，并点击“导入”按钮，来选择本地的一张图片上传：我选择一张书架图片上传，然后像添加文字内容一样，点击图片右下角的加号，将这个图片添加到视频的轨道上（会覆盖数字人）：此时，书架图片就会在视频轨道的下面，添加一条新轨道：为了让图片在整个视频播放的时候都显示，可以点击这个轨道最右侧的竖线，向右拖拽，直到视频的最后，也就是和视频对齐：此时，背景图片所在的轨道是选中状态。如果没选中，鼠标点击一下这个规定即可。在显示区域，拖动背景图的一个角，将图片放大到适合的尺寸，比如覆盖视频窗口。并将数字人拖动到合适的位置:

实战：每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法！

3.3增加字幕点击文本-智能字幕-识别字幕，点击开始识别：软件会自动将文字智能分段并形成字幕：至此，数字人视频就完成了。点击右上角的“导出”按钮，导出视频以作备用。如果你希望数字换成自己希望的面孔，比如这个：就需要用另一个工具来进行换脸了。

AI 数字人-定义数字世界中的你

这类数字人强调自驱动，人为干预更少，技术实现上更加复杂，一个最简单的算法驱动的数字人大致流程如下：其中三个核心算法分别是：1.ASR(Automatic Speech Recognition，语音识别)：我们希望和数字人的交互跟人一样以对话为主，所以算法驱动的第一步就是语音识别，它能将用户的音频数据转化为文字，便于数字人理解和生成回应。2.AI Agent（人工智能体）：充当数字人的大脑，可以直接接入大语言模型，强调Agent的概念是为了让数字人拥有记忆模块等更加真实。3.TTS(Text to Speech，文字转语音）：数字人依靠LLM生成的输出是文字，为了保持语音交互一致性，需要将文字转换为语音，由数字人。