Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

数字人 的供应商

Answer

以下是一些数字人的供应商:

此外,还可以借助开源社区的力量,如使用像 dify、fastgpt 等成熟的高质量 AI 编排框架来构建数字人。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台进行部署。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人-定义数字世界中的你

上述种种,如果都要自建代码实现各模块,开发工作量巨大,迭代难度也很高,对于个人开发者来讲不现实。因此我们推荐借助开源社区的力量,现在开源社区已经有了像dify、fastgpt等等成熟的高质量AI编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等等。我们可以通过这些框架快速编排出自己的AI Agent,赋予数字人灵魂。在笔者的开源项目中,使用了dify的框架,利用其编排和可视化交互任意修改流程,构造不同的AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时Dify的API暴露了audio-to-text和text-to-audio两个接口,基于这个两个接口就可以将数字人的语音识别和语音生成都交由Dify控制,从而低门槛做出来自己高度定制化的数字人(如下图),具体的部署过程参考B站视频:https://www.bilibili.com/video/BV1kZWvesE25。如果有更加高度定制的模型,也可以在Dify中接入XInference等模型管理平台,然后部署自己的模型。此外,数字人GUI工程中仍然保留了LLM、ASR、TTS、Agent等多个模块,能够保持更好的扩展,比如实现更加真实性感的语音转换、或者如果有更加Geek的Agent实现也可以选择直接后端编码扩展实现。上述Dify接口使用注意事项:1.使必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。2.只有接入了支持TTS和SPEECH2TEXT的模型供应商,才会在功能板块中展示出来,Dify的模型供应商图标下标签有展示该供应商支持哪些功能,这里可以自行选择自己方便使用的。对于TTS,不同的模型供应商支持的语音人物不同,可以根据个人喜好添加。

1.7 AI 数字人+语音合成

AI类厂商商汤:[SenseMARS DigitalHuman](https://www.sensetime.com/cn/product-detail?categoryId=163&gioNav=1)竹间:[Bot Factory对话AI平台](https://www.emotibot.com/product/bot_avatar.html)出门问问:[奇妙元](https://www.weta365.com/)追一:[多模态数字人](https://zhuiyi.ai/product/digital-human)其他数字王国:[虚拟人实验室](https://digitaldomain.com/%e8%99%9a%e6%8b%9f%e4%ba%ba%e5%ae%9e%e9%aa%8c%e5%ae%a4/?lang=zh-hans)

7月2日 张晟、汗青讨论数字人

1.直接卖数字人工具软件。分实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人接管。市面价格在一年4-6万往上(标准零售价)。非实时一个月600元,效果很差,类似放视频的伪直播,市场价格混乱,靠发展代理割韭菜。2.提供数字人运营服务,按直播间成交额抽佣。[heading2]AI直播卖货适用品类和场景?[content]1.适用于不需要强展示的商品,如品牌食品饮料。如果服装就搞不了,过品快,衣服建模成本高。2.适用于虚拟商品,如门票、优惠券等。3.不适用于促销场景,这涉及主播话术、套路,调动直播间氛围能力等。4.电商直播分为达播跟店播,数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样(朋友公司数据)。[heading2]AI直播的壁垒和未来市场格局是什么?[content]1.时间拉长,技术上没壁垒。但目前看仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高。比如更真实的对口型,更低的响应延迟等。2.不会一家独大,可能4-5家一线效果,大多二三线效果公司。因为它只是工具,迁移成本低。3.真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。4.有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。

Others are asking
我是一个供应商品质管理专家,我要给采购和供应商品质部门做一个AI办公应用的培训,你也是AI办公类的专家,请帮我草拟一个大纲,看看如何应用AI提高办公效率,有哪些工具推荐使用,特别是对于供应商管理方面的应用,请文章要带点个人感情色彩,temperature=5
以下是为您草拟的关于 AI 办公应用培训的大纲: 一、AI 在办公中的应用概述 1. 介绍 AI 技术的发展趋势和对办公领域的影响 2. 强调 AI 在提高办公效率方面的重要性 二、AI 办公工具推荐 1. 医学:中医应用 简介:将人工智能与中医结合,辅助看诊,提高诊疗效率 应用场景:如辅助诊断、生成药方等 优势:24 小时服务,提高效率 2. 数据:数据分析 prompt 简介:适合数据团队日常使用的 prompt 案例 应用场景:数据发现、数据治理等 优势:提升数据分析的准确性和效率 3. 工作流:成为生产力工具 起床:让 AI 为您排 TODO 优先级,进行私董会脑暴 工作中:有阳光会撒娇的 AI 小助理加油 重点事项:内容创作分 bot 团队组,如选题、标题、框架、扩写等,并分组互相改 优化:包括 Zion、ChatO 和自动化 AIAgent 分身,基于自身知识库的 bot;将知识库和 Prompt 资产放入飞书维护 备选:50 多个生产力 AI 待命 未来:将公司业务搬入飞书,外接 MJ、ChatBot 分身和咨询日程预约 三、AI 在供应商管理方面的应用 1. 利用 AI 进行供应商数据的分析和预测,如供应商的绩效评估、风险预测等 2. 通过 AI 优化供应商的选择和评估流程,提高准确性和效率 3. 借助 AI 实现与供应商的智能沟通和协作,及时解决问题 希望这个大纲能够帮助您顺利开展培训,让采购和供应商品质部门的同事们充分了解并应用 AI 来提高办公效率!
2024-08-31
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。使用时请遵守相关使用条款和隐私政策,并注意对生成内容的版权和伦理责任。 以下是数字人视频的制作方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-26
数字人
数字人是运用数字技术创造出来的人,目前业界没有准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业和直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。 增加字幕,点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,需要用另一个工具来进行换脸。
2025-03-25
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-24
AI数字员工
AI 数字员工是为企业和个人提供数字劳动力,解决重复性、创意性工作难题的一种应用。以下是关于 AI 数字员工的一些详细信息: 摊位活动主题和内容:为企业和个人提供数字劳动力,解决重复性、创意性工作难题。体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。 学习路径:结合“一人公司”的愿景,需要大量的智能体(数字员工)替我们打工。未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。创造者的学习方向是用大模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。Agent 工程(基础版)如同传统的软件工程学,有梳理流程、“任务”工具化、建立规划、迭代优化等迭代范式。 数字人相关技术: 算法驱动的数字人:开源代码仓库包括 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition)、AI Agent(大模型如 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc)。 人物建模模型可以通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果。但简单的构建方式还存在一些问题,如生成指定人物的声音、TTS 生成的音频精确驱动数字人口型及动作、数字人使用知识库做出专业性回答等。
2025-03-24
数字员工
数字员工是基于大语言模型为大脑,串联所有已有的工具和新造的 AI 工具的智能体。 在成为基于 Agent 的创造者方面,数字员工的学习路径包括: 1. 学历(大模型):掌握大模型相关知识。 2. 察言观色(观察):具备观察能力。 3. 逻辑思维(推理):拥有推理能力。 4. 执行(SOP):遵循标准操作流程执行任务。 Agent 工程(基础版)的范式包括: 1. 梳理流程:梳理工作流程 SOP,并拆解成多个单一「任务」和多个「任务执行流程」。 2. 「任务」工具化:自动化每一个「任务」,形成一系列的小工具,让机器能完成每一个单一任务。 3. 建立规划:串联工具,基于 agent 框架让 bot 来规划「任务执行流程」。 4. 迭代优化:不停迭代优化「任务」工具和「任务执行流程」规划,造就能应对实际场景的 Agent。 数字员工的“进化论”方面,需要在固化流程和让 AI 自主思考之间,在对 AI 能力基础上作出妥协和平衡。 在摊位信息中,有关于 AI 数字员工的摊位,其主题为为企业和个人提供数字劳动力,解决重复性、创意性工作难题,体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。 序智科技是一家人工智能创业公司,基于大模型技术打造数字劳动力平台。其招聘后端开发工程师的职责包括参与公司后端服务的设计、开发和维护,优化后端架构,提升系统性能和稳定性等。要求计算机相关专业本科及以上学历,有 3 年以上后端开发经验等。同时也招聘前端开发工程师。
2025-03-24
AI数字员工
AI 数字员工是为企业和个人提供数字劳动力,能够解决重复性、创意性工作难题。其体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。 结合“一人公司”的愿景,需要大量智能体(数字员工)替我们工作。未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。 创造者的学习方向是用大模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。Agent 工程(基础版)如同传统的软件工程学,有迭代的范式,包括梳理流程、“任务”工具化、建立规划、迭代优化。 在数字人方面,算法驱动的数字人涉及 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition 等)、AI Agent(大模型如 ChatGPT、Claude 等,Agent 部分可使用 LangChain 的模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc 等)。人物建模模型可通过手动建模或 AIGC 方式生成人物动态效果。但简单的构建方式存在如生成指定人物声音、TTS 音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等问题。
2025-03-24