与知识库对话 - 我想要能代替我直播的数字人工具

回答

以下是一些能代替您直播的数字人工具相关信息：

数字人类型和应用场景：

二维/三维虚拟人：用于游戏、IP 品牌（柳夜熙）、内容创作等。
真人形象数字人：用于直播卖货、营销/投流广告视频录制（Heygen）、语言学习（CallAnnie）等。

数字人的价值：

代替人说话，提升表达效率和营销效率，例如真人做不到 24 小时直播，但数字人可以。
创造真实世界无法完成的对话或交流。

数字人面临的问题：

平台限制：目前数字人水平参差不齐，平台担心直播观感，有一定打压限制。比如抖音出台一些标准，而微信视频号容忍度更低，人工检查封号。
技术限制：形象只是皮囊，智能水平和未来想象空间，依赖大模型技术提升。
需求限制：直播带货算个落地场景，但不刚。“懂得都懂”的刚需场景，国内搞不了。目前更多是体验新鲜感。
伦理/法律限制：声音、影像版权等，比如换脸、数字永生等等。

数字人直播盈利方式：

直接卖数字人工具软件。分实时驱动和非实时驱动两类，实时驱动在直播时能改音频话术，真人接管。市面价格在一年 4 - 6 万往上（标准零售价）。非实时一个月 600 元，效果很差，类似放视频的伪直播，市场价格混乱，靠发展代理割韭菜。
提供数字人运营服务，按直播间成交额抽佣。

AI 直播卖货适用品类和场景：

适用于不需要强展示的商品，如品牌食品饮料。如果服装就搞不了，过品快，衣服建模成本高。
适用于虚拟商品，如门票、优惠券等。
不适用于促销场景，这涉及主播话术、套路，调动直播间氛围能力等。
电商直播分为达播跟店播，数字人直播跑下来效果最好的是店播，数据基本能保持跟真人一样（朋友公司数据）。

AI 直播的壁垒和未来市场格局：

时间拉长，技术上没壁垒。但目前看仍有技术门槛，单纯靠开源算法拼的东西，实时性、可用性不高。比如更真实的对口型，更低的响应延迟等。
不会一家独大，可能 4 - 5 家一线效果，大多二三线效果公司。因为它只是工具，迁移成本低。
真正把客户服务好，能规模化扩张的公司更有价值。疯狂扩代理割韭菜，不考虑客户效果的公司，售后问题很麻烦。
有资源、有业务的大平台下场，可能会带来降维打击，例如剪映马上要做，如果不仅提供数字人，还提供货品供应链、数据复盘分析等等，全环节打通会绑定商家，很难打。

虚拟主播的驱动方式：目前，虚拟数字人从技术驱动方式上可以分为两类，一种是“中之人”驱动，另一种是由 AI 驱动。 “中之人”通过动作捕捉和面部捕捉技术，实现虚拟人与现实的交互。动作捕捉技术可以提供一套全身动捕硬件设备，售价约为 29000 元，另需缴纳 800 元的软件年度服务费。如果只需要捕捉面部表情，价格则约为 6000 元左右。总的来说，“中之人”是虚拟人物的“皮囊”，而“中之人”才是其真正的灵魂。 AI 驱动是通过 AI 技术实现虚拟人的创建、驱动和内容生成的综合技术，使其具备感知、表达等交互能力。AI 驱动的虚拟人能够智能地读取并解析外部输入信息，并根据解析结果做出决策，然后驱动人物模型生成相应的语音和动作，从而与用户进行互动。这种“一站式”技术让虚拟数字人具备更加自然、智能、人性化的交互能力。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

7月2日张晟、汗青讨论数字人

嘉宾：张晟（来自一线数字人公司）、汗青（B站搜索AI Talk）视频源地址：[AI数字人（虚拟人）讨论总结](https://bytedance.feishu.cn/docx/ZYladJDfrocZOGxylnucJeMXn0b)[heading2]AI数字人类型和应用场景？[content]1.二维/三维虚拟人：用于游戏、IP品牌（柳夜熙）、内容创作（[http://AI.talk](https://t.co/EM7nnuMohc)）等。2.真人形象数字人：用于直播卖货，营销/投流广告视频录制（Heygen）、语言学习（CallAnnie）等等。[heading2]AI数字人的价值是什么？[content]1.代替人说话，提升表达效率和营销效率。比如真人做不到24小时直播，但数字人可以。2.创造真实世界无法完成的对话或交流。例如AI talk的实验探索，复活故去的亲人等。[heading2]AI数字人面临的问题？[content]平台限制：目前数字人水平参差不齐，平台担心直播观感，有一定打压限制。比如抖音出台一些标准，而微信视频号容忍度更低，人工检查封号。技术限制：形象只是皮囊，智能水平和未来想象空间，依赖大模型技术提升。需求限制：直播带货算个落地场景，但不刚。“懂得都懂”的刚需场景，国内搞不了。目前更多是体验新鲜感。伦理/法律限制：声音、影像版权等，比如换脸、数字永生等等。

7月2日张晟、汗青讨论数字人

1.直接卖数字人工具软件。分实时驱动和非实时驱动两类，实时驱动在直播时能改音频话术，真人接管。市面价格在一年4-6万往上（标准零售价）。非实时一个月600元，效果很差，类似放视频的伪直播，市场价格混乱，靠发展代理割韭菜。2.提供数字人运营服务，按直播间成交额抽佣。[heading2]AI直播卖货适用品类和场景？[content]1.适用于不需要强展示的商品，如品牌食品饮料。如果服装就搞不了，过品快，衣服建模成本高。2.适用于虚拟商品，如门票、优惠券等。3.不适用于促销场景，这涉及主播话术、套路，调动直播间氛围能力等。4.电商直播分为达播跟店播，数字人直播跑下来效果最好的是店播，数据基本能保持跟真人一样（朋友公司数据）。[heading2]AI直播的壁垒和未来市场格局是什么？[content]1.时间拉长，技术上没壁垒。但目前看仍有技术门槛，单纯靠开源算法拼的东西，实时性、可用性不高。比如更真实的对口型，更低的响应延迟等。2.不会一家独大，可能4-5家一线效果，大多二三线效果公司。因为它只是工具，迁移成本低。3.真正把客户服务好，能规模化扩张的公司更有价值。疯狂扩代理割韭菜，不考虑客户效果的公司，售后问题很麻烦。4.有资源、有业务的大平台下场，可能会带来降维打击，例如剪映马上要做，如果不仅提供数字人，还提供货品供应链、数据复盘分析等等，全环节打通会绑定商家，很难打。

虚拟主播，能在电商直播间站稳脚跟吗？

目前，虚拟数字人从技术驱动方式上可以分为两类，一种是“中之人”驱动，另一种是由AI驱动。“中之人”这个词源自日语“中の人”，字面意思是“在里面的人”，主要用于指控制虚拟主播进行直播的人。通过动作捕捉和面部捕捉技术，实现虚拟人与现实的交互。动作捕捉技术可以提供一套全身动捕硬件设备，售价约为29000元，另需缴纳800元的软件年度服务费。如果只需要捕捉面部表情，价格则约为6000元左右。总的来说，“中之人”是虚拟人物的“皮囊”，而“中之人”才是其真正的灵魂。AI驱动是通过AI技术实现虚拟人的创建、驱动和内容生成的综合技术，使其具备感知、表达等交互能力。AI驱动的虚拟人能够智能地读取并解析外部输入信息，并根据解析结果做出决策，然后驱动人物模型生成相应的语音和动作，从而与用户进行互动。这种“一站式”技术让虚拟数字人具备更加自然、智能、人性化的交互能力。