知識ベースとの対話 - 数字人部署

回答

数字人的部署主要包括以下方面：

剪映数字人“私有化”：
- 准备谷歌账号（可在淘宝或“有号”购买）。
- 打开谷歌浏览器，点击链接 https://github.com/facefusion/facefusion-colab 并点击 open colab 进入程序主要运行界面，在右上角点击“代码执行程序”选择“全部运行”。
- 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频，保持默认参数，点击“START”生成，反复调试可获得最佳参数。
构建高质量的 AI 数字人：
- 构建数字人躯壳：
  - AIGC 方式可省去建模流程直接生成数字人的展示图片，但存在算法生成的数字人难以保持 ID 一致性和帧与帧连贯性不佳的问题。若对人物模型真实度要求不高，可使用典型项目如 wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC 还有直接生成 2d/3d 引擎模型的方向，但仍在探索中。建好的模型可使用 web 前端页面（Live2D 提供了 web 端的 SDK）或 Native 的可执行程序进行部署，最终以 GUI 形式呈现给用户。
- 构建数字人灵魂：
  - 实时性：由于数字人算法组成庞大，几乎不能单机部署，特别是大模型部分，算法一般部署到额外集群或调用提供的 API，会涉及网络耗时和模型推理耗时，低延时是亟需解决的问题。
  - 多元跨模态：不仅要有语音交互，还可根据实际需求添加其他感官交互，如通过摄像头数据获取视觉信息并进行图像解析。
  - 拟人化场景：处理如插话、转移话题等非线性对话情景，以实现工程上的丝滑处理。

AIモデルによって生成されたコンテンツであり、慎重に確認してください（提供元: aily）

参照

尽管剪映已经有很多公模数字人，但是从抖音上大火的数字人账号上看，私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。?注意：需要谷歌账号（淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买）1.第一步打开谷歌浏览器，点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行，无需安装，无需付费。点击红框对应的URL就会打开操作界面1.第二步，点击“source”上传自己的照片和“target”上传之前的剪映数字人视频，保持默认参数，点击“START”就能生成！反复调试后给大家选出了最佳参数！1.第三步：等着自己专属的数字人视频出炉！

AI 数字人-定义数字世界中的你

3.实时性：由于整个数字人的算法部分组成庞大，几乎不能实现单机部署，特别是大模型部分，所以算法一般会部署到额外的集群或者调用提供出来的API，这里面就会涉及到网络耗时和模型推理耗时，如果响应太慢就会体验很差，所以低延时也是亟需解决的一个问题。4.多元跨模态：仅仅是语音交互的数字人是远远不够的，人有五感(听觉、视觉、嗅觉、触觉、味觉)，听觉只是其中一种，其他的感官可以根据实际需求来做，比如视觉我们可以通过添加摄像头数据来获取数据，再通过系列CV算法做图像解析等；5.拟人化场景：我们正常和人交流的时候不是线性对话，会有插话、转移话题等情况，这些情景如何通过工程丝滑处理。

AI 数字人-定义数字世界中的你

虽然AIGC的方式相比前两者省去了建模流程，直接生成数字人的展示图片，但弊端也明显，算法生成的数字人很难保持ID一致性，帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高，可以使用这种方案(算法发展非常快，可能不久就会有连贯度很高的生成方式)，典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型，而不是直接生成数字人的最终展示部分，但该方向还在探索中。得益于现有各类技术方案的成熟度，以往建模往往都是由专业的建模师完成工作，不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署，最后呈现在用户面前的是一个GUI。