Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

数字人直播

Answer

以下是关于数字人直播的相关信息:

会议讨论

  • 目前数字人在电商直播上有所探索,做电商直播可能只是因为前期宣传及未发现其他更好场景。
  • 数字人在电商领域不能成为壁垒,配套的运营服务才是关键,续费客户多因服务而非数字人本身。
  • 电商直播分达播和店播,数字人直播在店播中的效果较好,数据能与真人相当。
  • 不建议商家依赖数字人,现阶段数字人服务多为辅助。

盈利方式

  • 直接卖数字人工具软件,实时驱动的一年 4 - 6 万往上,非实时的一个月 600 元,市场价格混乱。
  • 提供数字人运营服务,按直播间成交额抽佣。

适用品类和场景

  • 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,过品快且建模成本高。
  • 适用于虚拟商品,如门票、优惠券等。
  • 不适用于促销场景,涉及主播话术、套路及调动氛围能力等。
  • 店播场景下数字人直播效果较好。

壁垒和未来市场格局

  • 长期看技术上无壁垒,目前有技术门槛,如更真实对口型、更低响应延迟等。
  • 不会一家独大,可能 4 - 5 家一线效果,大多二三线效果公司。
  • 把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜的公司售后问题多。
  • 有资源、有业务的大平台下场可能带来降维打击。

数字人简介: 数字人是运用数字技术创造出来的,虽现阶段不能高度智能,但在生活场景中已常见,且随 AI 技术发展迎来应用爆发。业界尚无准确定义,一般可分真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,应用于影视和直播带货,表现质量与建模和动捕设备相关,视觉算法进步使无昂贵设备也能有不错效果。

Content generated by AI large model, please carefully verify (powered by aily)

References

会议讨论:7 月 2 日AI数字人(虚拟人)讨论

‍​⁢‬⁢⁡⁡⁡‬‍⁤⁣​‍​​⁤​​⁢⁤​​⁢⁢‬​⁡​​‍‌⁤‌​​‍⁢​‍​⁢⁣‌昨晚参与了一场AI数字人(虚拟人)的会议讨论,向阳把两个小时的内容浓缩总结了下-大家可以直接看飞书云文档对数字人感兴趣的可以听一下会议原声,以下链接中有上传[AI数字人(虚拟人)讨论总结](https://bytedance.feishu.cn/docx/ZYladJDfrocZOGxylnucJeMXn0b)有一位从业者的发言也比较有内容我这里引用下:有几个点很认同也是我们半年跑下来的一些结果(我负责的业务线也是在做数字人,目前也是在电商直播上探索)1.之所以现在做电商,不是因为电商适合数字人,可能只是因为前期硅基他们宣传的猛+确实还没发现其他更好的场景2.在电商领域,数字人不能也无法成为壁垒,跟数字人配套的运营服务才是,我们目前续费的客户全不是因为数字人而是因为配套的服务跟上。3.电商直播分为达播跟店播,目前数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样4.给所有的商家建议都是别依赖数字人,数字人服务在目前这个阶段还只能是辅助(如果只是单纯的数字人那就连辅助都算不上)5.xx公司就纯隔韭菜对商家伤害太大6.目前有几个领域数字人效果也很棒roi比电商还高7.在店播场景下,实时互动的必要性没那么高,我们做几轮ab测效果差不多

7月2日 张晟、汗青讨论数字人

1.直接卖数字人工具软件。分实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人接管。市面价格在一年4-6万往上(标准零售价)。非实时一个月600元,效果很差,类似放视频的伪直播,市场价格混乱,靠发展代理割韭菜。2.提供数字人运营服务,按直播间成交额抽佣。[heading2]AI直播卖货适用品类和场景?[content]1.适用于不需要强展示的商品,如品牌食品饮料。如果服装就搞不了,过品快,衣服建模成本高。2.适用于虚拟商品,如门票、优惠券等。3.不适用于促销场景,这涉及主播话术、套路,调动直播间氛围能力等。4.电商直播分为达播跟店播,数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样(朋友公司数据)。[heading2]AI直播的壁垒和未来市场格局是什么?[content]1.时间拉长,技术上没壁垒。但目前看仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高。比如更真实的对口型,更低的响应延迟等。2.不会一家独大,可能4-5家一线效果,大多二三线效果公司。因为它只是工具,迁移成本低。3.真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。4.有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。

AI 数字人-定义数字世界中的你

数字人,是指运用数字技术创造出来的人,虽然在现阶段不能做到像科幻作品中的人型机器人一样具备高度智能,但它已经在生活的各类场景中触手可及,而且随着AI技术的发展,也正在迎来应用爆发。目前业界还没有一个关于数字人的准确定义,但一般可以根据技术栈的不同分为两类,一类是由真人驱动的数字人,另一类是由算法驱动的数字人。[heading4]1.1真人驱动的数字人[content]这类数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。

Others are asking
怎么搭建自己的直播数字人平台
搭建自己的直播数字人平台可以参考以下步骤: 1. 了解相关技术和场景: 熟悉企业端 AI 实践经验,包括 AI 生成爆款内容、公域阵地场景(如视频号、抖音、小红书、公众号等平台的营销推广,涉及矩阵号工具、内容抓取分析、脚本创作、AI 剪辑、自动回复评论、无人直播工具等)、私域阵地场景(朋友圈、小红书、社群、个人 IP 的获客转化,销售企微 SCRM 工具、企业智能体进行 AI 内容抓取和自动回复)、服务自动化工具、快速搭建数据分析看板、跨境电商场景(如 tiktok 视频制作及投放、电商图片设计、精准营销、语言翻译、AI 独立站建设、社媒私域、批量混剪、海外达人直播、无人直播等)。 2. 构建数字人躯壳: 可以使用 web 前端页面(Live2D 提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。 例如开源数字人项目选择 live2d 作为数字人躯壳,其驱动方式相比 AI 生成式更加可控和自然,相比虚幻引擎更加轻量和简单,卡通二次元形象接受度更高。可参考 Live2D 官方示例:https://github.com/Live2D 。 3. 延伸阅读相关资料: 参考政策如《互联网信息服务深度合成管理规定》(http://www.gov.cn/zhengce/zhengceku/202212/12/content_5731431.htm )、《北京市促进数字人产业创新发展行动计划》(https://www.ncsti.gov.cn/kjdt/scyq/zcwj_47/202209/P020220906666181884578.pdf )等。 了解应用如《一键拥有自己的 AI 虚拟人合成平台》(https://mp.weixin.qq.com/s/EhukdKOlHYJGwHBldGi4Q )、《使用 AI 工具生成虚拟数字人(视频)》(https://www.bilibili.com/video/BV1Tb411D7fo/?spm_id_from=333.337.searchcard.all.click&vd_source=2c5fdcdac5fea78671c3a8ebd9a134d3 )等。
2025-03-11
实时驱动 ai直播
以下是关于实时驱动 AI 直播的相关信息: AI 数字人直播盈利方式: 1. 直接销售数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人可接管,市面价格一年 4 6 万往上(标准零售价)。非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料,不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路及调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播效果最好的是店播,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上没壁垒,但目前仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高,如更真实的对口型、更低的响应延迟等。 2. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司,因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。 虚拟主播在电商直播间的情况: 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但由于技术尚未达到真人直播的水平,所以通常只在午夜时段排期。阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),其中每个店铺视为一路,该服务提供多种功能。虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设了丰富的动作库和真实的语音表现,但商品展示以图片为主,虚拟主播无法与产品有接触,纯粹只能动嘴皮,商品只能放在一旁,这样的测评结果缺乏真实性,容易引起用户反感。目前,AI 驱动的虚拟主播更像是一个花瓶,能够吸引一些好奇的用户,再负责一些基础性的产品介绍和互动问答。 11 月 11 日和 10 日的 AI 相关动态: 11 月 11 日:Google 在 iPhone 上测试独立的「Google Gemini」应用,新应用支持 iOS 用户使用 Gemini Live,通过语音命令与 AI 互动,功能类似 ChatGPT 的高级语音交流。包含视觉识别功能,并已在 2024 年 9 月对 Android 用户开放,预计将随 Gemini 2.0 的发布正式上线。 11 月 10 日:Google 发布 Gemini AI 驱动的视频演示工具 Vids,通过简单提示或 Google Drive 文档,自动生成视频故事板,包含场景、脚本和背景音乐。支持语音旁白和滚动式提词器,便于自然流畅的录制,应用于客户支持、培训视频、公司公告、会议回顾等多种场景。NVIDIA AI Blueprint 是长视频内容总结与问答解决方案,能快速总结数小时视频的关键事件和对话,省去逐帧观看的时间,支持长视频的搜索、问答和实时事件检测,适用于监控、教育、客户服务等场景,为开发者提供构建视频理解和摘要功能的框架。
2025-03-11
AI直播
以下是关于 AI 直播的相关信息: 1. AI 春晚: 是由 WaytoAGI 社区组织,由 300 多位 AI 爱好者共同创作的 AI 作品。 运用了数字人 AI 生图文声视频、AI 转会、AI 音乐模型训练等多种先进技术。 作品时长约 150 分钟,涵盖多种类型节目。 于 24 年大年初一当晚直播,18 万人在线观看,后续视频播放量超 200 万,媒体曝光量超 500 万。 多个节目登录央视网,孵化了数个优质项目与团队。 完整版观看链接:https://www.bilibili.com/video/BV15v421k7PY/?spm_id_from=333.999.0.0 相关进度: 2. AI 梦:一丹一世界(下)2025 年 2 月 8 日副本: 是 AI 炼丹直播共学课第二节课。 比赛要求:参加由麦乐园和摩达社区发起的比赛,须用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 作图思路分享:分三步,明确创作主题即锚点,确定主体及联想角色设定,增加叙事感。 图片构成因素:包括构图、色彩以及光影。 关于构图:包括概念、分类(景别和拍摄视角)、要素(主体、陪体、前景、背景、点线面)、方式(点中心构图、九宫格构图、三分法构图等)。在 AI 绘图中,推荐中景及以上景别。 3. 字节 Trae Windows 版相关: 推出了两个活动:AI 编程重磅直播,邀请在 AI 编程领域取得成绩的嘉宾深度交流,由黄叔亲自主持,还邀请了 Eric 等嘉宾;AI 编程训练营,WaytoAGI 和 AI 编程社推出为期 2 周左右的共学营,包含图文教程、视频、直播,社群内有老师答疑,完全免费。 Trae Windows 版本已上线,Mac 版本也可下载,官网地址:https://www.trae.ai/
2025-03-11
AI分析直播数据
使用 AI 分析直播数据可以参考以下方法和步骤: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,处理大量数据以获取关键信息,如受欢迎的产品、价格区间、销量等。 2. 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:使用 AI 设计工具根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:利用 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:通过 AI 图像识别技术选择或生成高质量的产品图片,展示产品特点。 6. 价格策略:依靠 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:利用 AI 分析客户评价和反馈,了解客户需求,优化产品和服务。 8. 个性化推荐:借助 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:使用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:依靠 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:利用 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:通过 AI 分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:借助 AI 在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:利用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。 罗文在直播数据分析方面的分享包括: 1. 演示了利用工作流进行直播数据处理及智能体创建参赛的过程,包括利用插件识别图片内容获取直播数据,将数据传入大模型得到优化建议,通过不断添加节点提升数据质量,最后将工作流封装成智能体。 2. 讨论了利用 AI 优化模板并提交的直播数据分析流程,包括模板内容的编写与注意事项,还介绍了飞书的功能如共学小组和其智能 AI 功能,分享了直播数据分析模板的制作过程,最后提及了模板大赛相关问题、专业版好用之处等。 3. 提到了直播数据分析工作流的搭建与应用,包括插件测试与选择、工作流搭建步骤、工作流效果提升、工作流封装与应用、相关问题探讨等。 4. 介绍了直播数据分析与报名流程,包括工作流运行与问题排查、报名流程介绍、AI 辅助文档生成、加入共学小组等内容。
2025-03-09
直播分身怎么搭建
搭建直播分身可以参考以下步骤: 1. 构建数字人躯壳:建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。可以选择 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。另外,卡通二次元的形象接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 2. 搭建智能体:创建一个智能体,输入人设等信息,放上相关工作流。配置完成后进行测试。需要注意的是,工作流中的某些插件 api_token 填的是个人 token,不能直接发布,可将 api_token 作为工作流最开始的输入,用户自己购买后输入 api_token 再使用然后发布。 3. 直播数据分析工作流的搭建与应用: 插件测试与选择:先测试插件是否好用,如遇到数据格式不对等问题需重新选择和调整。 工作流搭建步骤:从上传直播数据,到利用大模型优化提示词和整理数据,逐步完善工作流。 工作流效果提升:增加模型和节点,不断迭代工作流,使生成的直播分析和方案质量更好。 工作流封装与应用:将工作流封装成智能体,可用于回复用户问题和处理不同的直播数据。 相关问题探讨:讨论了如获取商品评价数据的方式,以及将直播工作拆分组合的可能性等问题。 工作流运行与问题排查:涉及直播数据工作流的运行,出现问题时考虑输出环节,还提到未启动工作流的情况及解决尝试。 报名流程介绍:包括通过网址找到报名链接,填写相关信息如名字、智能体名字、商店链接、文档说明等并提交。 AI 辅助文档生成:使用豆包等 AI 工具生成提交模板,如主题、应用场景、主要功能、设计思路等内容。 加入共学小组:提到飞书中的共学小组和 prompt 学习群,满员时考虑新建或加入其他相关群组。
2025-03-09
我想用ai进行直播建立虚拟的我
如果您想用 AI 进行直播建立虚拟的自己,以下是一些相关信息: 虚拟主播在电商直播间的现状和挑战: 直播间的特点在于真实性,包括真实的商品展示、试用以及评测,这是虚拟主播面临的挑战。如虚拟网红翎 Ling 的美妆带货翻车案例,虚拟人很难让消费者共情。 尽管 3D 交互技术可完善数字人与真实空间的交互,但实现与商品的互动较困难,且用户希望了解商品细节。 虚拟数字人的发展阶段: 拟人化:由计算机虚拟合成高度逼真的三维动画人物,初步基于 AI 实现虚拟人驱动,实时进行信息沟通和反馈。 同人化:从外观模拟进阶到情感可交互,实现与人类高质量情感互动。 超人化:虚拟人的能力超越自然人,“虚拟”实体化,机器人承载虚拟人意识回到现实世界。 虚拟直播间的场景搭建: 绿幕的虚拟直播场景方案是低成本的直播样式,手机上有相关绿幕视频抠图 App,288 元可购买永久会员解锁所有功能。 场景搭建成本因多种因素而异,包括规模、复杂度、细节程度、互动特效等。 MR 设备的普及可能带动新的技术迭代,提供更沉浸式的互动购物体验。 构建高质量 AI 数字人的方法: 建好的模型可使用 web 前端页面或 Native 的可执行程序进行部署,呈现在用户面前的是一个 GUI。 开源数字人项目选择 live2d 作为数字人躯壳,相比其他方式更可控、自然、轻量和简单,卡通二次元形象接受度更高。 品牌使用 AI 驱动虚拟主播的情况: 欧莱雅、YSL、兰蔻、李宁、北面等品牌会使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。 阿里云提供的品牌智能直播间基础版有多种功能,售价为 99000 元/(年×路)。 淘宝智能直播间的虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,展示方式和互动流程有一定特点,但也存在一些问题,如无法与产品接触导致测评缺乏真实性。
2025-03-06
我想要一个以自己为蓝本,包括人物和声音的数字人,用来录制课程
以下是制作以自己为蓝本,包括人物和声音的数字人用来录制课程的方法: 1. 生成数字人: 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,然后点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到视频轨道中,左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片: 可删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,如一张书架图片,点击图片右下角加号将其添加到视频轨道上(会覆盖数字人)。为让图片在整个视频播放时都显示,点击轨道最右侧竖线向右拖拽至与视频对齐。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 换脸: 若希望数字人换成自己的面孔,需要用另一个工具进行换脸。 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费,点击红框对应的 URL 打开操作界面。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程: 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2025-03-11
有哪些好用的数字人工具,效果好,清晰,不违和,免费
以下是一些好用的数字人工具,效果好、清晰、不违和且免费: 1. 开源且适合小白用户的工具: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub: 官网: 2. Google Veo 2: 效果:生成的视频接近真实,几乎难以分辨。 应用:适合创作和内容制作。 3. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 2. 上传后效果如图所示,My Avatar 处显示上传的照片。 3. 点开大图后,点击 Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击 Submit,就可以得到一段数字人视频。 4. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的 Create vedio。 2. 选择人物形象,你可以点击 ADD 添加你的照片,或者使用 DID 给出的人物形象。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 5. KreadoAI: 优点:免费(对于普通娱乐玩家,这很重要),功能齐全。 缺点:音色很 AI。 使用方法: 1. 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-03-11
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。 增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-11
我想制作AI数字人,如何去寻找相关资料和教程
以下是寻找制作 AI 数字人相关资料和教程的途径: 1. 在线文档和公众号:可以查看。 2. B 站:在 B 站搜索相关视频教程。 3. 具体操作方法: 在剪映中,右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频。剪映会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐。 此外,还有一些开源的算法代码仓库可供参考: 1. ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义,包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌方面。 除了算法,人物建模模型可以通过手动建模实现,但这种简单的构建方式还存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-03-11
视频号数字人
以下是关于视频号数字人的相关内容: 制作方法: 1. 准备内容:先准备一段视频中播放的文字内容,如产品介绍、课程讲解、游戏攻略等,也可利用 AI 生成。 2. 创建视频内容:使用剪映 App 进行简单处理。电脑端打开剪映 App,点击“开始创作”,选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号添加文字内容轨道,将准备好的文字内容替换默认文本内容,为数字人提供语音播放内容及生成相应口型。 3. 生成数字人:在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角的“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,需用另一个工具来进行换脸。 类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(柳夜熙)、内容创作()等。 2. 真人形象数字人:用于直播卖货,营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等。 价值: 1. 代替人说话,提升表达效率和营销效率,如真人无法 24 小时直播,数字人可以。 2. 创造真实世界无法完成的对话或交流,例如 AI talk 的实验探索,复活故去的亲人等。 面临的问题: 1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。如抖音出台一些标准,微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间依赖大模型技术提升。 3. 需求限制:直播带货是落地场景,但不刚需。“懂得都懂”的刚需场景,国内搞不了,目前更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等。
2025-03-11