Chat with Wiki - AI数字人

Answer

AI 数字人是运用数字技术创造出来的人，目前业界尚无准确定义，一般可根据技术栈分为两类：

真人驱动的数字人：重在通过动捕设备或视觉算法还原真人动作表情，主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关，不过随着视觉算法进步，在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。
算法驱动的数字人：强调自驱动，人为干预更少，技术实现更复杂。其大致流程包含三个核心算法：
- ASR（语音识别）：能将用户音频数据转化为文字，便于数字人理解和生成回应，以实现像人与人一样的对话交互。
- AI Agent（人工智能体）：充当数字人的大脑，可接入大语言模型，拥有记忆模块等使其更真实。
- TTS（文字转语音）：将数字人依靠 LLM 生成的文字输出转换为语音，保持语音交互一致性。

此外，还有一些与 AI 数字人相关的摊位活动，如为企业和个人提供数字劳动力，解决重复性、创意性工作难题的“AI 数字员工”体验 demo，包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等；以及“AIGC 数字艺术挂画”“数字生命赋予每个人的新生”“AI 智能体应用”“Ai 心理疏导”“AIGC（图生图）趣味定制；AI 数字人定制”等。

Content generated by AI large model, please carefully verify (powered by aily)

References

摊位信息

|你的摊位活动主题和内容|摊位区域|摊位编号|摊位类型||-|-|-|-||主题：AI数字员工 内容：为企业和个人提供数字劳动力，解决重复性、创意性工作难题。 体验demo：抖音运营、AI客服、智能问诊、企业定制员工、定制知识库。 另：我是黄诗程，也是大会志愿者，希望可以把杭州商场举办AI切磋大会的模式理念在深圳广州复制推广。|C|53|产品展示||AIGC数字艺术挂画|D|8|图画||数字生命赋予每个人的新生|C|80|照片||友链-王府井|C|81|现场分享||AI智能体应用|C|47|产品展示||当算命占卜这种古老智慧搭上AI快车，会擦出怎样的火花？本摊位结合AI技术进行易经六爻分层算卦解卦，多层次解读会有意想不到的效果呦|A|83|玄学||Ai心理疏导 |A|20|产品展示+心理疏导||AIGC(图生图)趣味定制；AI数字人定制|A|21|图画||低成本线下外语会议实时翻译+纪要|D|9|产品展示||照片风格转绘、宠物风格转绘、换脸、写真、图可以DIY制作拼图/照片+相框、转印到帆布袋/纯色长袖上，冰箱贴上等等|A|90|照片/冰箱贴|

AI 数字人-定义数字世界中的你

数字人，是指运用数字技术创造出来的人，虽然在现阶段不能做到像科幻作品中的人型机器人一样具备高度智能，但它已经在生活的各类场景中触手可及，而且随着AI技术的发展，也正在迎来应用爆发。目前业界还没有一个关于数字人的准确定义，但一般可以根据技术栈的不同分为两类，一类是由真人驱动的数字人，另一类是由算法驱动的数字人。[heading4]1.1真人驱动的数字人[content]这类数字人重在通过动捕设备或视觉算法还原真人动作表情，主要应用于影视行业以及现下很火热的直播带货，其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关，不过随着视觉算法的不断进步，现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息，从而做到不错的效果。

AI 数字人-定义数字世界中的你

这类数字人强调自驱动，人为干预更少，技术实现上更加复杂，一个最简单的算法驱动的数字人大致流程如下：其中三个核心算法分别是：1.ASR(Automatic Speech Recognition，语音识别)：我们希望和数字人的交互跟人一样以对话为主，所以算法驱动的第一步就是语音识别，它能将用户的音频数据转化为文字，便于数字人理解和生成回应。2.AI Agent（人工智能体）：充当数字人的大脑，可以直接接入大语言模型，强调Agent的概念是为了让数字人拥有记忆模块等更加真实。3.TTS(Text to Speech，文字转语音）：数字人依靠LLM生成的输出是文字，为了保持语音交互一致性，需要将文字转换为语音，由数字人。