Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

怎么搭建自己的直播数字人平台

Answer

搭建自己的直播数字人平台可以参考以下步骤:

  1. 了解相关技术和场景:
    • 熟悉企业端 AI 实践经验,包括 AI 生成爆款内容、公域阵地场景(如视频号、抖音、小红书、公众号等平台的营销推广,涉及矩阵号工具、内容抓取分析、脚本创作、AI 剪辑、自动回复评论、无人直播工具等)、私域阵地场景(朋友圈、小红书、社群、个人 IP 的获客转化,销售企微 SCRM 工具、企业智能体进行 AI 内容抓取和自动回复)、服务自动化工具、快速搭建数据分析看板、跨境电商场景(如 tiktok 视频制作及投放、电商图片设计、精准营销、语言翻译、AI 独立站建设、社媒私域、批量混剪、海外达人直播、无人直播等)。
  2. 构建数字人躯壳:
    • 可以使用 web 前端页面(Live2D 提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。
    • 例如开源数字人项目选择 live2d 作为数字人躯壳,其驱动方式相比 AI 生成式更加可控和自然,相比虚幻引擎更加轻量和简单,卡通二次元形象接受度更高。可参考 Live2D 官方示例:https://github.com/Live2D 。
  3. 延伸阅读相关资料:
    • 参考政策如《互联网信息服务深度合成管理规定》(http://www.gov.cn/zhengce/zhengceku/2022-12/12/content_5731431.htm )、《北京市促进数字人产业创新发展行动计划》(https://www.ncsti.gov.cn/kjdt/scyq/zcwj_47/202209/P020220906666181884578.pdf )等。
    • 了解应用如《一键拥有自己的 AI 虚拟人合成平台》(https://mp.weixin.qq.com/s/EhukdKO-lHYJGwHBldGi4Q )、《使用 AI 工具生成虚拟数字人(视频)》(https://www.bilibili.com/video/BV1Tb411D7fo/?spm_id_from=333.337.search-card.all.click&vd_source=2c5fdcdac5fea78671c3a8ebd9a134d3 )等。
Content generated by AI large model, please carefully verify (powered by aily)

References

社区AI讲师招募

1.有丰富的企业端AI实践经验,主要针对以下几个场景(有其中一个场景或多个场景实践能力沉淀均可):1.1.AI生成爆款内容:借助AI分析能力,挖掘同品类爆款内容,借助AI工具能力,生成电商商品图、小红书图文内容、种草短视频内容等;1.2.公域阵地场景:依托于视频号、抖音、小红书、公众号等平台,搭建企业的营销推广能力,包括搭建矩阵号和IP号,通过短视频,直播等方式获取leads,这个背后是矩阵号工具、内容抓取分析、脚本创作、AI剪辑、自动回复评论、无人直播工具等;1.3.私域阵地场景:朋友圈、小红书、社群、个人IP。获客转化,销售企微SCRM工具、企业智能体进行AI内容抓取和自动回复;1.4.服务自动化工具,数据监控和预警,流程优化,自动运营等;1.5.快速搭建数据分析看板;1.6.跨境电商场景:tiktok视频制作及投放、电商图片设计、精准营销、语言翻译、AI独立站建设、社媒私域、批量混剪、海外达人直播、无人直播(数字人直播)等2.有不错的表达能力,能将自己在技术和业务方面的沉淀清晰的调理表达出来[heading1]招募流程[content]对感兴趣的小伙伴,提交份个人简历(包括基本信息介绍、学历、专业、工作经验,以及AI企业端的案例)可以填写下面的问卷预约时间进行电话面谈,面谈通过后,开始进行公开课试讲。

AI 数字人-定义数字世界中的你

建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署,最后呈现在用户面前的是一个GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了live2d作为数字人躯壳,因为这类SDK的驱动方式相比现在的AI生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于live2d的SDK驱动方式可以参考官方示例:https://github.com/Live2D。

1.7 AI 数字人+语音合成

|标题与链接|发布者|摘要|发表日期|类别||-|-|-|-|-||[直播带货领域,虚拟偶像如何立足?](https://www.woshipm.com/marketing/4224804.html)|大王叫我去巡山||2020/10/23|文章||[互联网信息服务深度合成管理规定](http://www.gov.cn/zhengce/zhengceku/2022-12/12/content_5731431.htm)|网信办||2022/11/25|政策||[虚拟现实与行业应用融合发展行动计划(2022—2026年)](http://www.gov.cn/zhengce/zhengceku/2022-11/01/5723273/files/23f1b69dcf8b4923a20bd6743022a56f.pdf)|工信部||2022/10/28|政策||[北京市促进数字人产业创新发展行动计划](https://www.ncsti.gov.cn/kjdt/scyq/zcwj_47/202209/P020220906666181884578.pdf)|北京市经济和信息化局||2022/08/03|政策||[广播电视和网络视听“十四五”科技发展规划](http://gbdsj.gd.gov.cn/zwgk/zcfg/content/post_3617251.html)|国家广电||2021/11/02|政策||[基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端](https://patentimages.storage.googleapis.com/63/06/93/34232a18dded0f/WO2022048403A1.pdf)|魔珐科技||2022/03/10|专利||[数字人的健身教练指导方法、装置、电子设备及存储介质](https://patentimages.storage.googleapis.com/29/77/1f/51a6ec30eca651/CN111986775A.pdf)|追一科技||2020/11/24|专利||[Digital human generation method and system](https://patentimages.storage.googleapis.com/42/e3/ec/6e1d09d7e7037d/US10607133.pdf)|华为||2020/03/31|专利||[一键拥有自己的AI虚拟人合成平台](https://mp.weixin.qq.com/s/EhukdKO-lHYJGwHBldGi4Q)|古哒哒研究所||2023/05/18|应用||[使用AI工具生成虚拟数字人(视频)](https://www.bilibili.com/video/BV1Tb411D7fo/?spm_id_from=333.337.search-card.all.click&vd_source=2c5fdcdac5fea78671c3a8ebd9a134d3)|ChatAI智能小助手||2023/02/28|应用|

Others are asking
实时驱动 ai直播
以下是关于实时驱动 AI 直播的相关信息: AI 数字人直播盈利方式: 1. 直接销售数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人可接管,市面价格一年 4 6 万往上(标准零售价)。非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料,不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路及调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播效果最好的是店播,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上没壁垒,但目前仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高,如更真实的对口型、更低的响应延迟等。 2. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司,因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。 虚拟主播在电商直播间的情况: 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但由于技术尚未达到真人直播的水平,所以通常只在午夜时段排期。阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),其中每个店铺视为一路,该服务提供多种功能。虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设了丰富的动作库和真实的语音表现,但商品展示以图片为主,虚拟主播无法与产品有接触,纯粹只能动嘴皮,商品只能放在一旁,这样的测评结果缺乏真实性,容易引起用户反感。目前,AI 驱动的虚拟主播更像是一个花瓶,能够吸引一些好奇的用户,再负责一些基础性的产品介绍和互动问答。 11 月 11 日和 10 日的 AI 相关动态: 11 月 11 日:Google 在 iPhone 上测试独立的「Google Gemini」应用,新应用支持 iOS 用户使用 Gemini Live,通过语音命令与 AI 互动,功能类似 ChatGPT 的高级语音交流。包含视觉识别功能,并已在 2024 年 9 月对 Android 用户开放,预计将随 Gemini 2.0 的发布正式上线。 11 月 10 日:Google 发布 Gemini AI 驱动的视频演示工具 Vids,通过简单提示或 Google Drive 文档,自动生成视频故事板,包含场景、脚本和背景音乐。支持语音旁白和滚动式提词器,便于自然流畅的录制,应用于客户支持、培训视频、公司公告、会议回顾等多种场景。NVIDIA AI Blueprint 是长视频内容总结与问答解决方案,能快速总结数小时视频的关键事件和对话,省去逐帧观看的时间,支持长视频的搜索、问答和实时事件检测,适用于监控、教育、客户服务等场景,为开发者提供构建视频理解和摘要功能的框架。
2025-03-11
数字人直播
以下是关于数字人直播的相关信息: 会议讨论: 目前数字人在电商直播上有所探索,做电商直播可能只是因为前期宣传及未发现其他更好场景。 数字人在电商领域不能成为壁垒,配套的运营服务才是关键,续费客户多因服务而非数字人本身。 电商直播分达播和店播,数字人直播在店播中的效果较好,数据能与真人相当。 不建议商家依赖数字人,现阶段数字人服务多为辅助。 盈利方式: 直接卖数字人工具软件,实时驱动的一年 4 6 万往上,非实时的一个月 600 元,市场价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,过品快且建模成本高。 适用于虚拟商品,如门票、优惠券等。 不适用于促销场景,涉及主播话术、套路及调动氛围能力等。 店播场景下数字人直播效果较好。 壁垒和未来市场格局: 长期看技术上无壁垒,目前有技术门槛,如更真实对口型、更低响应延迟等。 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜的公司售后问题多。 有资源、有业务的大平台下场可能带来降维打击。 数字人简介: 数字人是运用数字技术创造出来的,虽现阶段不能高度智能,但在生活场景中已常见,且随 AI 技术发展迎来应用爆发。业界尚无准确定义,一般可分真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,应用于影视和直播带货,表现质量与建模和动捕设备相关,视觉算法进步使无昂贵设备也能有不错效果。
2025-03-11
AI直播
以下是关于 AI 直播的相关信息: 1. AI 春晚: 是由 WaytoAGI 社区组织,由 300 多位 AI 爱好者共同创作的 AI 作品。 运用了数字人 AI 生图文声视频、AI 转会、AI 音乐模型训练等多种先进技术。 作品时长约 150 分钟,涵盖多种类型节目。 于 24 年大年初一当晚直播,18 万人在线观看,后续视频播放量超 200 万,媒体曝光量超 500 万。 多个节目登录央视网,孵化了数个优质项目与团队。 完整版观看链接:https://www.bilibili.com/video/BV15v421k7PY/?spm_id_from=333.999.0.0 相关进度: 2. AI 梦:一丹一世界(下)2025 年 2 月 8 日副本: 是 AI 炼丹直播共学课第二节课。 比赛要求:参加由麦乐园和摩达社区发起的比赛,须用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 作图思路分享:分三步,明确创作主题即锚点,确定主体及联想角色设定,增加叙事感。 图片构成因素:包括构图、色彩以及光影。 关于构图:包括概念、分类(景别和拍摄视角)、要素(主体、陪体、前景、背景、点线面)、方式(点中心构图、九宫格构图、三分法构图等)。在 AI 绘图中,推荐中景及以上景别。 3. 字节 Trae Windows 版相关: 推出了两个活动:AI 编程重磅直播,邀请在 AI 编程领域取得成绩的嘉宾深度交流,由黄叔亲自主持,还邀请了 Eric 等嘉宾;AI 编程训练营,WaytoAGI 和 AI 编程社推出为期 2 周左右的共学营,包含图文教程、视频、直播,社群内有老师答疑,完全免费。 Trae Windows 版本已上线,Mac 版本也可下载,官网地址:https://www.trae.ai/
2025-03-11
AI分析直播数据
使用 AI 分析直播数据可以参考以下方法和步骤: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,处理大量数据以获取关键信息,如受欢迎的产品、价格区间、销量等。 2. 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:使用 AI 设计工具根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:利用 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:通过 AI 图像识别技术选择或生成高质量的产品图片,展示产品特点。 6. 价格策略:依靠 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:利用 AI 分析客户评价和反馈,了解客户需求,优化产品和服务。 8. 个性化推荐:借助 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:使用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:依靠 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:利用 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:通过 AI 分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:借助 AI 在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:利用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。 罗文在直播数据分析方面的分享包括: 1. 演示了利用工作流进行直播数据处理及智能体创建参赛的过程,包括利用插件识别图片内容获取直播数据,将数据传入大模型得到优化建议,通过不断添加节点提升数据质量,最后将工作流封装成智能体。 2. 讨论了利用 AI 优化模板并提交的直播数据分析流程,包括模板内容的编写与注意事项,还介绍了飞书的功能如共学小组和其智能 AI 功能,分享了直播数据分析模板的制作过程,最后提及了模板大赛相关问题、专业版好用之处等。 3. 提到了直播数据分析工作流的搭建与应用,包括插件测试与选择、工作流搭建步骤、工作流效果提升、工作流封装与应用、相关问题探讨等。 4. 介绍了直播数据分析与报名流程,包括工作流运行与问题排查、报名流程介绍、AI 辅助文档生成、加入共学小组等内容。
2025-03-09
直播分身怎么搭建
搭建直播分身可以参考以下步骤: 1. 构建数字人躯壳:建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。可以选择 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。另外,卡通二次元的形象接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 2. 搭建智能体:创建一个智能体,输入人设等信息,放上相关工作流。配置完成后进行测试。需要注意的是,工作流中的某些插件 api_token 填的是个人 token,不能直接发布,可将 api_token 作为工作流最开始的输入,用户自己购买后输入 api_token 再使用然后发布。 3. 直播数据分析工作流的搭建与应用: 插件测试与选择:先测试插件是否好用,如遇到数据格式不对等问题需重新选择和调整。 工作流搭建步骤:从上传直播数据,到利用大模型优化提示词和整理数据,逐步完善工作流。 工作流效果提升:增加模型和节点,不断迭代工作流,使生成的直播分析和方案质量更好。 工作流封装与应用:将工作流封装成智能体,可用于回复用户问题和处理不同的直播数据。 相关问题探讨:讨论了如获取商品评价数据的方式,以及将直播工作拆分组合的可能性等问题。 工作流运行与问题排查:涉及直播数据工作流的运行,出现问题时考虑输出环节,还提到未启动工作流的情况及解决尝试。 报名流程介绍:包括通过网址找到报名链接,填写相关信息如名字、智能体名字、商店链接、文档说明等并提交。 AI 辅助文档生成:使用豆包等 AI 工具生成提交模板,如主题、应用场景、主要功能、设计思路等内容。 加入共学小组:提到飞书中的共学小组和 prompt 学习群,满员时考虑新建或加入其他相关群组。
2025-03-09
我想用ai进行直播建立虚拟的我
如果您想用 AI 进行直播建立虚拟的自己,以下是一些相关信息: 虚拟主播在电商直播间的现状和挑战: 直播间的特点在于真实性,包括真实的商品展示、试用以及评测,这是虚拟主播面临的挑战。如虚拟网红翎 Ling 的美妆带货翻车案例,虚拟人很难让消费者共情。 尽管 3D 交互技术可完善数字人与真实空间的交互,但实现与商品的互动较困难,且用户希望了解商品细节。 虚拟数字人的发展阶段: 拟人化:由计算机虚拟合成高度逼真的三维动画人物,初步基于 AI 实现虚拟人驱动,实时进行信息沟通和反馈。 同人化:从外观模拟进阶到情感可交互,实现与人类高质量情感互动。 超人化:虚拟人的能力超越自然人,“虚拟”实体化,机器人承载虚拟人意识回到现实世界。 虚拟直播间的场景搭建: 绿幕的虚拟直播场景方案是低成本的直播样式,手机上有相关绿幕视频抠图 App,288 元可购买永久会员解锁所有功能。 场景搭建成本因多种因素而异,包括规模、复杂度、细节程度、互动特效等。 MR 设备的普及可能带动新的技术迭代,提供更沉浸式的互动购物体验。 构建高质量 AI 数字人的方法: 建好的模型可使用 web 前端页面或 Native 的可执行程序进行部署,呈现在用户面前的是一个 GUI。 开源数字人项目选择 live2d 作为数字人躯壳,相比其他方式更可控、自然、轻量和简单,卡通二次元形象接受度更高。 品牌使用 AI 驱动虚拟主播的情况: 欧莱雅、YSL、兰蔻、李宁、北面等品牌会使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。 阿里云提供的品牌智能直播间基础版有多种功能,售价为 99000 元/(年×路)。 淘宝智能直播间的虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,展示方式和互动流程有一定特点,但也存在一些问题,如无法与产品接触导致测评缺乏真实性。
2025-03-06
搭建本地知识库
搭建本地知识库的步骤如下: 1. 了解 RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 大模型训练数据有截止日期,RAG 可通过检索外部数据并在生成步骤中传递给 LLM 来解决。 RAG 应用包括文档加载、文本分割、存储、检索和输出 5 个过程。 文档加载可从多种来源加载,如 PDF 等非结构化数据、SQL 等结构化数据和代码等。 文本分割将文档切分为指定大小的块。 存储包括将文档块嵌入转换为向量形式并存储到向量数据库。 检索通过算法找到与输入问题相似的嵌入片。 输出将问题和检索出的嵌入片提交给 LLM 生成答案。 文本加载器将用户提供的文本加载到内存以便后续处理。 2. 安装和配置 AnythingLLM: 安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 3. 构建本地知识库: 在 AnythingLLM 中创建独有的 Workspace 与其他项目数据隔离。 首先创建工作空间。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,包括 Chat 模式(大模型根据训练数据和上传文档综合给出答案)和 Query 模式(大模型仅依靠文档数据给出答案)。 完成配置后可与大模型进行对话测试。 本文思路来源于视频号博主黄益贺,作者按照其视频进行了实操并附加了 RAG 额外知识。作者是大圣,致力于使用 AI 工具成为超级个体的程序员,目前沉浸于 AI Agent 研究。读完本文,您将学习到如何使用 Ollama 一键部署本地大模型、了解 ChatGPT 信息流转、RAG 概念及核心技术、通过 AnythingLLM 搭建本地化数据库等内容。
2025-03-12
微信机器人搭建
以下是关于搭建微信机器人的详细步骤和相关信息: 一、纯 GPT 大模型能力的微信聊天机器人搭建 1. 开始搭建 重点在于修改 dockercompose.yml 文件中的具体配置,以串联微信号和已创建好的 AI 机器人。配置的参考官方来源是:https://docs.linkai.tech/cow/quickstart/config 。 配置中的每个参考名称的全大写描述,如 open_ai_api_key 对应编排模板的 OPEN_AI_API_KEY ,model 对应编排模板的 MODEL ,以此类推,在编排模板去配置具体的配置参数。 私聊或群交流时,最好加上前缀触发机器人回复,如配置的 ,即对应的配置参数 SINGLE_CHAT_PREFIX ,在私聊或群里发消息,必须包含 bot 或者 @bot 才会触发机器人回复。在群组里,对应配置参数是 GROUP_CHAT_PREFIX ,机器人只会回复群里包含 @bot 的消息。 还有参数 GROUP_NAME_WHITE_LIST ,用来配置哪些群组的消息需要自动回复。 2. 疑问解答 宝塔面板提供图形化管理界面,操作简单直观,许多常见任务可通过点击按钮完成。 宝塔面板、Docker 有详细官方文档和教程,极简未来平台也提供操作指南和技术支持,遇到问题可查阅或寻求帮助。 可加入相关技术社群或论坛向有经验用户请教。 设置定期备份和监控,确保出现问题可及时恢复。 二、第一天教程:COW 部署 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复。 2. 若想为 AI 赋予提示词,可返回“目录 4 里的第 17 步”,其中 中文部分可进行更改。 3. 此后进行任何更改,都需要重新打印登陆二维码才会生效。 4. 多次重新登录后,在宝塔“首页 右上角 点击重启,重启一下服务器”清理进程。 5. 若没有手机登录,可使用夜神模拟器模拟手机登录。 6. 一个月内,不要上来就加好友、最好不要私聊聊天。 7. 报错“wxsid”是因为微信未实名,实名即可。 8. Link AI 提供 100 个,合计 3500 万 GPT3.5 Token 的礼品码,可用来实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。 9. 完成机器人搭建,机器人拉群里,领兑换码。 10. 添加微信,拉您进机器人群,先行体验。 如果您之后遇到问题,可以采取以下几种方式来解决: 1. 查阅官方文档和教程:极简未来平台、宝塔面板和 Docker 都有详细的官方文档和教程,可以帮助解决大部分问题。 2. 联系技术支持:极简未来平台提供技术支持服务,可以联系平台的技术团队寻求帮助。 3. 加入技术社群:加入相关的技术社群,向有经验的用户请教,获取问题的解决方案。 4. 在线论坛和社区:在在线论坛和社区发布问题,寻求其他用户的帮助和建议。 为避免长时间不操作后忘记步骤,可以采取以下措施: 1. 制作操作手册:将每一步的操作记录下来,制作成操作手册,方便日后查阅。 2. 定期操作:定期登录服务器,进行简单的操作和维护,保持熟练度。 3. 视频教程:可以录制自己的操作视频,作为教程,日后查看时更直观。 4. 自动化脚本:对于一些常见的运维任务,可以编写自动化脚本,简化操作步骤。
2025-03-11
如何搭建精准回答的本地知识库
搭建精准回答的本地知识库可以参考以下步骤: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入知识库页面,并单击创建知识库。 4. 在弹出的页面配置知识库名称、描述,并单击确认。需注意一个团队内的知识库名称不可重复,必须是唯一的。 5. 在单元页面,单击新增单元。 6. 在弹出的页面选择要上传的数据格式(默认是文本格式),然后选择一种文本内容上传方式完成内容上传。 如果想要对知识库进行更加灵活的掌控,可以使用额外的软件AnythingLLM,其安装地址为:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 1. 第一步:选择大模型。 2. 第二步:选择文本嵌入模型。 3. 第三步:选择向量数据库。 在AnythingLLM中有一个Workspace的概念,可以创建自己独有的Workspace跟其他的项目数据进行隔离。具体操作如下: 1. 首先创建一个工作空间。 2. 上传文档并且在工作空间中进行文本嵌入。 3. 选择对话模式,AnythingLLM提供了两种对话模式: Chat模式:大模型会根据自己的训练数据和我们上传的文档数据综合给出答案。 Query模式:大模型仅仅会依靠文档中的数据给出答案。 4. 测试对话。
2025-03-11
智能客服系统的搭建
智能客服系统的搭建可以参考以下内容: FastGPT 是一个基于大语言模型(LLM)的知识库问答系统,具有以下特点和优势,适用于智能客服系统的搭建: 1. 基于 LLM 的问答:采用先进的 LLM 技术,能理解自然语言并生成高质量答案。 2. 知识库支持:可连接外部知识库获取更全面信息。 3. 可视化工作流:提供可视化工作流编排工具,方便创建复杂问答场景。 4. 开箱即用:提供数据处理和模型调用功能,方便快速上手。 其应用场景包括构建智能客服系统,为客户提供 7x24 小时自动问答服务。 在“Show Me 扣子 AI 挑战赛大消费行业专场”中,有作品帮助企业快速建立产品智能客服体系,通过用户意图识别、知识库检索答案、AI 大模型总结输出答案、多轮对话沟通、对话分析打标、自动更新知识库 FAQ 以及客服效果分析,提供全面的 AI 客服解决方案,提高 AI 客服回答的准确率,降低企业商用 AI 客服的门槛。 AIGC 在客户关系管理(CRM)领域也有相关应用,例如基于 AIGC 的对话模型可开发智能客服系统,通过自然语言交互解答客户咨询、投诉等,缓解人工客服压力。 总之,搭建智能客服系统可以综合利用上述技术和方法,以满足企业和用户的需求。
2025-03-11
推荐一个可以快速搭建的高级个人智能体
以下为您推荐一个可以快速搭建的高级个人智能体: 五津的DeepSeek+扣子:输入人设等信息创建智能体,放上创建的工作流。配置完成后可测试,但工作流中【所有视频片段拼接】节点的api_token不能直接发布,可作为工作流输入让用户购买后使用。 阿里云百炼平台的Deepseek R1模型:无需部署直接使用,有丰富的模型广场和大量免费额度,使用需解锁和授权,实名认证后可通过模型广场的API调用示例连接Chat Box,新建智能体应用可选择模型并调整参数,还能开启互联网搜索。 小众打卡地智能体:输入旅游目的地城市可推荐3个小众打卡地小红书类文案及配图,其搭建思路包括录入小红书文案参考知识库、通过文本模型组成搜索词搜索并提取相关url、滤除部分网站、提取小众地点输出及图片搜索等。
2025-03-11
在本地环境下要搭建一个医疗数据分析的BI智能体,应该怎么做
抱歉,您提供的内容中没有关于在本地环境下搭建医疗数据分析的 BI 智能体的相关有效信息。一般来说,要在本地环境搭建这样的智能体,您可以考虑以下步骤: 1. 明确需求和目标:确定您希望通过智能体实现的具体医疗数据分析功能和目标。 2. 选择合适的技术和工具:例如,选择适合数据分析的编程语言(如 Python)、数据库管理系统(如 MySQL、SQL Server 等)、数据分析库(如 Pandas、NumPy 等)。 3. 数据收集和预处理:获取相关的医疗数据,并进行数据清洗、转换和归一化等预处理操作,以确保数据的质量和可用性。 4. 模型选择和训练:根据需求选择合适的机器学习或深度学习模型,如分类模型、回归模型等,并使用预处理后的数据进行训练。 5. 智能体的开发和集成:使用所选的技术和工具,开发智能体的逻辑和功能,并将其与数据处理和模型预测部分进行集成。 6. 测试和优化:对搭建好的智能体进行测试,根据测试结果对其进行优化和改进。 7. 部署和维护:将智能体部署到本地环境中,并定期进行维护和更新,以适应新的数据和需求变化。
2025-03-11
我想要一个以自己为蓝本,包括人物和声音的数字人,用来录制课程
以下是制作以自己为蓝本,包括人物和声音的数字人用来录制课程的方法: 1. 生成数字人: 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,然后点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到视频轨道中,左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片: 可删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,如一张书架图片,点击图片右下角加号将其添加到视频轨道上(会覆盖数字人)。为让图片在整个视频播放时都显示,点击轨道最右侧竖线向右拖拽至与视频对齐。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 换脸: 若希望数字人换成自己的面孔,需要用另一个工具进行换脸。 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费,点击红框对应的 URL 打开操作界面。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程: 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2025-03-11
有哪些好用的数字人工具,效果好,清晰,不违和,免费
以下是一些好用的数字人工具,效果好、清晰、不违和且免费: 1. 开源且适合小白用户的工具: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub: 官网: 2. Google Veo 2: 效果:生成的视频接近真实,几乎难以分辨。 应用:适合创作和内容制作。 3. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 2. 上传后效果如图所示,My Avatar 处显示上传的照片。 3. 点开大图后,点击 Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击 Submit,就可以得到一段数字人视频。 4. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的 Create vedio。 2. 选择人物形象,你可以点击 ADD 添加你的照片,或者使用 DID 给出的人物形象。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 5. KreadoAI: 优点:免费(对于普通娱乐玩家,这很重要),功能齐全。 缺点:音色很 AI。 使用方法: 1. 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-03-11
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。 增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-11
我想制作AI数字人,如何去寻找相关资料和教程
以下是寻找制作 AI 数字人相关资料和教程的途径: 1. 在线文档和公众号:可以查看。 2. B 站:在 B 站搜索相关视频教程。 3. 具体操作方法: 在剪映中,右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频。剪映会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐。 此外,还有一些开源的算法代码仓库可供参考: 1. ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义,包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌方面。 除了算法,人物建模模型可以通过手动建模实现,但这种简单的构建方式还存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-03-11
视频号数字人
以下是关于视频号数字人的相关内容: 制作方法: 1. 准备内容:先准备一段视频中播放的文字内容,如产品介绍、课程讲解、游戏攻略等,也可利用 AI 生成。 2. 创建视频内容:使用剪映 App 进行简单处理。电脑端打开剪映 App,点击“开始创作”,选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号添加文字内容轨道,将准备好的文字内容替换默认文本内容,为数字人提供语音播放内容及生成相应口型。 3. 生成数字人:在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角的“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,需用另一个工具来进行换脸。 类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(柳夜熙)、内容创作()等。 2. 真人形象数字人:用于直播卖货,营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等。 价值: 1. 代替人说话,提升表达效率和营销效率,如真人无法 24 小时直播,数字人可以。 2. 创造真实世界无法完成的对话或交流,例如 AI talk 的实验探索,复活故去的亲人等。 面临的问题: 1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。如抖音出台一些标准,微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间依赖大模型技术提升。 3. 需求限制:直播带货是落地场景,但不刚需。“懂得都懂”的刚需场景,国内搞不了,目前更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等。
2025-03-11
不能用APP思维、传统数字平台思维去做大模型创业和人工智能创业,二者在底层逻辑和商业模式等方面完全不同
大模型创业和人工智能创业与 APP 思维、传统数字平台思维在底层逻辑和商业模式等方面存在显著差异。大模型和人工智能创业更注重数据的深度处理、算法的优化创新以及对复杂问题的解决能力。相比之下,APP 思维通常侧重于用户界面和功能的设计,以满足特定的用户需求;传统数字平台思维则更多关注平台的搭建和用户流量的获取与运营。在大模型和人工智能领域,技术的突破和创新是关键,需要投入大量资源进行研发,并且要面对更高的技术门槛和不确定性。而 APP 和传统数字平台的创业相对更侧重于市场推广和用户体验的优化。总之,不能简单地用 APP 思维和传统数字平台思维来指导大模型和人工智能创业。
2025-03-07
哪个平台可以教我如何给deepseek发指令?
以下是关于如何给 DeepSeek 发指令的相关信息: 访问网址:www.deepseek.com,点击“开始对话”。 操作步骤: 第一步:搜索 www.deepseek.com,点击“开始对话”。 第二步:将装有提示词的代码发给 DeepSeek。 第三步:认真阅读开场白之后,正式开始对话。 此外,还为您提供了一些关于 DeepSeek 的其他知识: 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对作者来说有难度)和 Markdown(运行下来似乎不是很稳定)。 完整提示词:v 1.3 特别鸣谢:李继刚的【思考的七把武器】在前期为作者提供了很多思考方向;Thinking Claude 这个项目是作者现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源。 同时,为您介绍一些其他相关内容: 集合·DeepSeek 提示词方法论: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道、自动检测 prompt 中的任务类型/输出格式/知识范围、反馈敏感度)。 基础指令框架:如果不知道如何表达,还是可以套用框架指令,如四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-03-07
用哪个ai平台,可以识别图像户型图,给做一个三居改四居的设计方案
目前,市面上还没有专门的 AI 平台能够直接根据图像户型图为您生成三居改四居的设计方案。但是,一些与室内设计相关的软件和平台可能会对您有所帮助,例如酷家乐、三维家等,它们具有一定的户型设计和修改功能,您可以尝试使用这些平台,并结合自己的需求和创意来完成设计方案。
2025-03-06
现在有哪些做音乐的AI平台
以下是一些做音乐的 AI 平台: :前身为“Definite Technologies”,开发使用 AI 处理/生成声音的 VST/AU/AUv3 插件。 :自适应 AI 音乐平台,通过高质量音频样本进行实时细胞组成。 :基于 AI 的音乐助手,包括歌词写作助手。 :实时音乐、音频和视频创作平台。 :为创意媒体应用提供合成歌声。 :数字宇宙的音乐解决方案,Soundtracks、AI Studio、Music Maker JAM 的制作者。 :AI 音乐创作和制作。 :自由定制高质量免版权费音乐。 :一个云平台,让音乐人和粉丝在全球范围内创作音乐、协作和互动。 :使用嵌入式软件、信号处理和 AI 帮助艺术家录制、混音和母带处理他们的现场表演。 :开源音乐生成工具。 :旨在通过 AI 赋能真实艺术家的伦理音频 AI 插件、工具和社区,而非取代他们。 :使用 AI 创作音乐和语音。
2025-03-05
有没有一款智能客服软件,支持同时接入抖音、天猫、淘宝、京东、拼多多、得物等主流平台的售前售后咨询问题,并根据客户关键字自动回复
目前已知以下智能客服算法: 天猫小蜜智能客服算法:由浙江天猫网络有限公司提供,应用于手机天猫(APP)的在线智能客服场景,能识别文字或语音问题,结合智能客服知识库生成回答。 钉钉智能客服算法:由钉钉科技有限公司提供,应用于钉钉(APP)的在线智能客服场景,能根据用户咨询内容结合知识库生成多种形式的回答。 淘票票小蜜智能客服算法:由上海淘票票影视文化有限公司提供,应用于淘票票(APP)的在线智能客服场景,能根据用户咨询生成文本或语音智能回答。 1688 阿牛智能客服算法:由杭州阿里巴巴广告有限公司提供,应用于 1688 工业品(APP)、阿里巴巴(APP、网站)的在线智能客服场景,能结合知识库生成多种形式的回答。 但尚未有一款明确表明能同时接入抖音、天猫、淘宝、京东、拼多多、得物等主流平台售前售后咨询问题,并根据客户关键字自动回复的智能客服软件。
2025-03-05
有没有那款智能客服软件,具备接入全渠道平台的客户咨询能力
以下是为您推荐的一些具备接入全渠道平台客户咨询能力的智能客服软件: 1. 阿里云百炼:可以在几分钟内构建一个 AI 助手,并发布到网站、钉钉或微信公众号中。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,且缺少技术人员开发大模型问答应用的情况。其智能体应用基于大模型,通过集成特定的外部能力,能够弥补大模型的不足,例如回答私有领域问题、获取最新信息等。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 2. COW 框架:是基于大模型搭建的 Chat 机器人框架,可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,支持多平台接入(微信、企业微信、公众号、飞书、钉钉等)、多模型选择(GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等)、多消息类型支持(能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能)和多部署方法(本地运行、服务器运行、Docker 的方式)。但需要注意的是,使用此框架接入大模型 API 需单独付费,且微信端使用可能存在封号危险,操作时需依法合规。 此外,利用 AI 聊天机器人实现客户服务自动化也是常见的做法。通过部署 AI 聊天机器人处理常见的客户咨询,将其集成到企业的网站、社交媒体平台和其他客户服务渠道,能够提高客户服务的效率和可及性。同时,通过机器人提供 24/7 客户支持,定期监控其性能并根据反馈进行优化,能够提升响应速度和服务质量。
2025-03-05