Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

实现基于个人聊天记录的数字分身的最佳实践

Answer

实现基于个人聊天记录的数字分身的最佳实践包括以下方面:

  • 虚拟数字人的类型和驱动方式:
    • 虚拟数字人通过各种技术创造,具有外观、行为和思想等人类特征,呈现为虚拟形象。
    • 从驱动层面可分为中之人驱动和 AI 驱动两类。中之人驱动运用动作捕捉和面部捕捉技术实现交互,有上限且缺乏高并发和量产化能力;AI 驱动使用 AI 技术创建、驱动和生成内容,赋予感知和表达等交互能力。
  • 虚拟数字人的应用类型:
    • 服务型:如虚拟主播、助手、教师、客服和医生等,为物理世界提供服务。
    • 表演型:如虚拟偶像,用于娱乐、影视等场景。
    • 身份型:是物理世界“真人”进入虚拟世界的数字分身,在元宇宙中有广泛应用场景。
  • 相关开源项目:
    • 熊猫大侠基于 COW 框架的 ChatBot 最新版本支持多端部署、基础对话、语音识别、图片生成、丰富插件、Tool 工具和知识库等功能。可接入个人微信、微信公众号、企业微信应用,支持多种模型和个性化插件扩展,通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用。项目地址包括 Github:https://github.com/zhayujie/chatgpt-on-wechat ,Gitee:https://gitee.com/zhayujie/chatgpt-on-wechat 。
Content generated by AI large model, please carefully verify (powered by aily)

References

虚拟数字人,好看的皮囊有什么价值?

虚拟数字人是通过各种技术创造出来的,具有多种人类特征,比如外观、行为和思想,被呈现为虚拟形象。从驱动层面来说,虚拟数字人可以分为两类:中之人驱动和AI驱动。其中,中之人驱动运用动作捕捉和面部捕捉技术实现虚拟人与现实的交互;而AI驱动则使用AI技术创建、驱动和生成虚拟人的内容,从而赋予其感知和表达等交互能力。中之人驱动的数字人有其上限,缺乏高并发和量产化的能力,可以看做是真人“披着虚拟外皮”的产物。ChatGPT的出现催动了新一轮AI技术的浪潮,不少虚拟数字人厂商都在争相宣称自己的产品将会接入ChatGPT,赋予数字人智慧的大脑。只有通过AI技术让虚拟人“虚拟”得彻底,才能够释放出更高的价值。从应用层面来看,虚拟数字人可分为服务型、表演型和身份型三大类。服务型虚拟数字人,如虚拟主播、虚拟助手、虚拟教师、虚拟客服和虚拟医生等,主要为物理世界提供各种服务。典型代表有冯小殊、崔筱盼、观君等。表演型虚拟数字人,如虚拟偶像等,主要用于娱乐、影视等场景,例如虚拟偶像演唱会。典型代表有洛天依、AYAYI、柳夜熙等。身份型虚拟数字人是物理世界的“真人”进入虚拟世界的数字分身,在元宇宙中,数字分身有广泛的应用场景。本文讨论的虚拟数字人是AI驱动的,主要集中于服务型虚拟数字人。强调服务型虚拟数字人具有功能属性,隶属于业务层。文章仅探讨AI创造出的虚拟“皮囊”可以带来什么价值。

熊猫大侠:基于COW框架的ChatBot实现步骤

最新版本支持的功能如下:多端部署:可接入个人微信、微信公众号、企业微信应用基础对话:私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别:可识别语音消息,通过文字或语音回复,支持azure,baidu,google,openai等多种语音模型图片生成:支持图片生成和图生图(如照片修复),可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件:支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具:与操作系统和互联网交互,支持最新信息搜索、数学计算、天气和资讯查询、网页总结,基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库:通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用,基于LinkAI实现项目地址(Github):[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee):[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)

熊猫大侠:基于COW框架的ChatBot实现步骤

最新版本支持的功能如下:多端部署:可接入个人微信、微信公众号、企业微信应用基础对话:私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别:可识别语音消息,通过文字或语音回复,支持azure,baidu,google,openai等多种语音模型图片生成:支持图片生成和图生图(如照片修复),可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件:支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具:与操作系统和互联网交互,支持最新信息搜索、数学计算、天气和资讯查询、网页总结,基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库:通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用,基于LinkAI实现项目地址(Github):[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee):[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)

Others are asking
如何用coze搭建一个总结聊天记录的功能
以下是用 Coze 搭建一个总结聊天记录功能的步骤: 1. 设计 Bot 目的:明确 Bot 的用途,例如作为一个 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,并提供高效的站内信息检索服务。 2. 了解 Coze 平台常用概念和功能:包括提示词(设定 Bot 的身份和目标)、插件(通过 API 连接集成各种平台和服务)、工作流(设计复杂的多步骤任务)、触发器(创建定时任务)、记忆库(保留对话细节,支持外部知识库)、变量(保存用户个人信息)、数据库(存储和管理结构化数据)、长期记忆(总结聊天对话内容)。 3. 进行 Bot 基础设置:根据机器人的作用,设计人设和回复逻辑,限制机器人的功能使其更专注于 AI 相关的知识回答和服务,还可以加入长期记忆功能来总结聊天对话内容以更好地响应用户消息,以及设计更加美观的 Bot 开场白。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问也可以查官方指南。
2024-11-15
搭建一个总结聊天记录的ai
以下是搭建一个总结聊天记录的 AI 的步骤: 1. 整理聊天记录为数据集: 如果导出了多个人的聊天记录,需手动将文件下的内容汇总到一起。 汇总完成后,保存汇总文件为“train.json”。 在当前文件夹下新建一个文本文档,重命名为“1.py”,用记事本打开并粘贴相应代码。注意标红的地方需要修改。 打开命令行窗口,输入“python 1.py”完成聊天记录整理,此步骤在后续第 31 步会用到。 2. 图文原文处理: 微信无法批量复制聊天内容,多选想要复制的聊天内容,转发到群里或文件传输助手。 收藏批量转发的聊天记录,打开收藏,点进笔记,点右上角三个点,转存为笔记,返回即可全选复制所有内容。 可使用能让电脑设备和手机设备剪切板共享的工具,避免在微信文件传输助手间折腾。 3. GPTs: 若重复做同一件事三次以上,应考虑优化步骤,可创建内容排版大师的 GPTs。 GPTs 链接:https://chat.openai.com/g/gt9dIHp4Ntneirongpaibandashi 。 该 GPTs 已加入 webpilot 的 actions,可直接将文章发给它总结内容。 4. 小卡片软件: 使用的卡片软件是小作卡片 app,官网链接:https://kosaku.imxie.club/ 。 操作步骤:打开软件,点击「自制卡片」,在「记录些什么...」中粘贴 AI 生成文本内容,点击右下角保存图标即可导出。
2024-11-15
一个用llm分析微信聊天记录的智能体案例
以下为一个用 LLM 分析微信聊天记录的智能体案例相关内容: 在当今大多数现代人工智能应用程序中,检索增强生成(RAG)是标准架构。以 Sana 的企业搜索用例为例,其过程始于应用程序加载和转换无结构文件(如 PDF、幻灯片、文本文件),跨越企业数据孤岛(如 Google Drive 和 Notion),并通过数据预处理引擎(如 Unstructured)转换为 LLM 可查询格式。这些文件被“分块”成更小的文本块,作为向量嵌入并存储在数据库(如 Pinecone)中。 当用户提出问题时,系统会检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM,然后 LLM 合成答复返回给用户。在生产中,AI 应用程序具有更复杂的流程,包含多个检索步骤和“提示链”,不同类型的任务并行执行,最终综合结果生成输出。 “智能体”(Agent)在人工智能和计算机科学领域是指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以规划、子目标分解、反思完善、记忆(包括短期记忆和长期记忆)、工具使用等关键组成部分。 在开发场景中,有上传客服聊天记录,充当智能客服的案例。此外,还有使用 GPT 的视觉功能和 TTS API 处理和讲述视频、GLM 等大模型外接数据库、开发微信小程序、开发知识库/聊天机器人搭建安全提示词 prompt 等相关案例。
2024-09-30
分析微信聊天记录的智能体
以下是关于分析微信聊天记录的智能体的相关信息: 从维度转换能力的角度来看,将各种问题、业务数据等转化为语言信息与语言模型交流能提高效率,但要注意对维度的理解,避免因语言的一维性导致交流偏差。 在业务助手中,主要有助手方式和业务环方式。助手方式是进行工作辅助,大模型负责优化、检索、启发等;业务环方式是大模型作为主业务流程中的一环,自动处理内容并生成结果。 像 Coze 这样的 Bot 智能体,可以实现多模态资讯的跨平台推送。其初衷是让用户拥有专属助手,精准筛选有价值信息。它以扣子为中心平台,通过自研插件、工作流和 API 链接微信群、企业微信群、飞书云文档多维表格等,能根据用户需求抓取热点资讯,分析处理并以多模态形式自动推送到不同平台。 在基于百川大模型的创作中,可将聊天记录的上下文转换为问答对,并对相邻信息做合并处理,还能根据需求筛选指定群或聊天对象的记录。聊天上下文窗口大小可依场景设置。
2024-09-30
如何制作数字分身
以下是一些制作数字分身的方法和相关信息: 可以在一些网站如 Elevenlabs.io、speechify.com、Heygen 等自助购买服务,以低成本制作自己的数字人分身。 当 Coze 接入飞书后,将自己的知识数据上传到 Coze,基于个人知识库开发 bot,并将其部署到个人订阅号上,这个 bot 可以作为数字分身与粉丝互动。 通过整合知识库,并结合提示词进行情感或行为上的描述,可以创建一个 bot,形成自己的数字分身。
2025-02-20
我想用扣子完成AI数字分身的搭建,应该怎么操作
以下是使用扣子完成 AI 数字分身搭建的步骤: 1. 登录扣子官网(https://www.coze.cn/)并注册。 2. 创建个人 Bot: 点击个人空间。 点击创建 Bot。 填入 Bot 的名字和功能介绍,以及上传或生成对应的头像。如果没想好,可以先随便填,后面可更改。 3. 在搭建生产力工具的过程中,要先深入了解自己的工作内容和需求,做出有针对性的规划。 4. 通过整合知识库,并结合提示词进行情感或行为上的描述,创建一个 Bot,形成自己的数字分身。 5. 构建整个 Flow 时要尽量减少控件使用(非必要不增加),越少的控件代表越少的逻辑,越少的逻辑代表越小的运行风险。 6. 对于复杂的批处理任务,尽量平衡批处理次数和并发,同时还要考虑模型的推理速度,不然会增大推理失败的概率。 需要注意的是,Coze 目前提供的组件,包括 bot 等工具,能满足一些基本的生产力搭建需求。虽然现阶段它还不支持循环等高级功能,但未来有望支持更多工作流的设计模式。自 Coze 推出以来,它已明确面向 C 端用户,这些用户能从中获得实质性好处。
2025-01-24
如何构建一个AI数字人分身
构建一个 AI 数字人分身主要包括以下两个方面: 一、构建数字人躯壳 数字人的躯壳建模有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢。能将喜欢的动漫人物变成数字人的躯壳。代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体。如 NextHuman、Unity,虚幻引擎 MetaHuman 等。但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 二、构建数字人灵魂 有了数字人躯壳,还需要构建数字人的灵魂,让数字人具备各种智能,比如记得个人信息,充当个人助手;在某个领域具备更专业的知识;能处理复杂的任务等等。实现这些能力有以下几个工程关键点: 1. AI Agent:要想数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过接口定义,躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的,效果可以参考 Nvidia 的 Audio2Face。 3. 实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做,比如视觉可以通过添加摄像头数据来获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。
2025-01-03
有什么AI社交产品做相亲交友服务吗?不是AI陪伴类,是AI分身促进真人交友的产品
目前在 AI 社交产品领域,有一些相关的探索和尝试。例如,某 AI 社交 APP 创始人认为,在社交场景中,核心分为陌生人社交和熟人社交。他们尝试过纯 AI 虚拟陪聊产品,但发现用户主要是年龄偏低的人群,商业价值相对较低,且可能被模型侵蚀。有效的用户留存来源于真实的人际关系,越接近熟人社交的场景,平台的用户留存能力越高。 同时,AI 赛道投资人认为,产品不应仅限于情感陪伴,应扩展为类人助手,解决理性严肃场景的问题解决和感性需求的满足。AI 社交软件的开发者认为,为用户打造数字分身、创造社交关系是有价值的,通过 AI Agent 可以在人与人之间创造新的社交关系,用户也愿意为这种新型社交互动支付相当的金额。但目前尚未有明确的专门以 AI 分身促进真人交友的成熟产品。
2024-12-03
数字分身
数字分身是指在虚拟世界中代表物理世界“真人”的存在。在不同的场景中有多种应用: 节目表演方面:如在节目单中,有“猜真人”这样的魔术互动类表演,通过数字分身增加趣味性;还有“亲情的应用场景(逝者)”,例如女儿通过逝者的数字分身再次对话。 实战课程方面:通过课程可以获得一比一数字人分身的定制体验,包括熟练使用多种热门数字人工具,掌握相关技术,了解商业应用场景及行业现状,将数字人融入工作流,还能获得进阶学习的自学路径,并且有交流群方便解决问题和交流心得。 价值探讨方面:身份型虚拟数字人在元宇宙中有广泛应用场景。服务型虚拟数字人具有功能属性,隶属于业务层,AI 创造出的虚拟“皮囊”具有一定价值。
2024-08-27
如何用我的照片建一个数字人分身,不限时长,而且成本低
以下是一些用照片创建数字人分身且成本低、不限时长的方法: 1. 剪映 AI:只要有图就可以制作逼真的说话或唱歌的 UGC 数字人娱乐视频。其亮点包括口型自然,制作效率高,写好口播脚本可批量快速制作内容。可以一键克隆专属形象和声音,生成数字分身,快速生产口播视频。数字人适用于口播自媒体等场景。 2. 实战方法:首先添加新轨道,将背景图片轨道的右侧竖线向右拖拽至与视频对齐。然后调整背景图片的尺寸和数字人的位置。接着点击文本智能字幕识别字幕,软件会自动将文字智能分段并形成字幕。最后点击导出按钮导出视频备用。如果希望数字人换成自己希望的面孔,需要用另一个工具进行换脸。 3. VividTalk:让照片说话的技术,单张照片和一段音频可生成看似真实的说话视频,支持多种语言和风格,如真实和卡通风格。 4. HeyGen 的 Avatar2.0:可在 5 分钟内用手机创建个人虚拟分身,支持多语言和口型同步,免费提供服务。
2024-08-27
音效AI生成 最佳方案
以下是关于音效 AI 生成的一些信息和最佳方案: 音效是 AI 的一个具有吸引力的开放领域。目前已有学术论文探讨使用 AI 在电影中生成“现场效果音”,但在游戏中的商业产品尚属稀少。 在游戏中,为玩家角色生成脚步声音时,传统方法使用少量预先录制的声音,存在繁琐、重复和不真实的问题。更好的方式是使用实时的生成性 AI 模型来制作现场效果音,它能根据游戏参数实时生成略有不同且合适的音效。 在音乐方面,AI 生成音乐存在基于乐理规则的符号生成模型和基于音频数据的音频生成模型两种主流技术路线。开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已支持生成多音轨作品,使用 AI 生成音乐为原型并佐以专业制作人的协调,可使其更快进入游戏制作与发行的生产线。 在实际应用中,如《新哪吒闹海》的配音一开始打算用 AI 但因情绪不够丰满而选择专业声音表演者,音效需求简单时可采用剪映中的音效资源库。同时,为您分享三个音效资源站: 1. https://www.lookae.com/sucai/sfx/ ,大部分免费且分好类的音效包可供下载。 2. https://www.epidemicsound.com/ ,专业的音效站点,Gen48 合作站。 3. https://sc.chinaz.com/yinxiao/ ,适合搜索单个音效下载的站点。
2025-02-08
用Ai进行财务分析的最佳实践
以下是关于用 AI 进行财务分析的最佳实践: 1. 更动态的预测和报告: 生成式 AI 能帮助金融服务团队改进内部流程,简化财务团队日常工作。 可从更多数据源获取数据,并自动化突出趋势、生成预测和报告的过程。 预测方面,能帮助编写公式和查询,发现模式,为预测建议输入并适应模型。 报告方面,能自动创建文本、图表等内容,并根据不同示例调整报告。 会计和税务方面,能帮助综合、总结并提出可能答案。 采购和应付账款方面,能帮助自动生成和调整合同、订单、发票及提醒。 2. 局限性与挑战: 生成式 AI 输出当前有局限性,在需要判断或精确答案的领域,常需人工审查。 面临的挑战包括使用金融数据训练 LLM,新进入者可能先使用公开金融数据微调模型,现有参与者可利用专有数据,但可能过于保守,新进入者有竞争优势。 模型输出准确性至关重要,金融问题答案需尽可能准确,初期人类常作为最终验证环节。 总之,生成式 AI 为金融服务带来巨大变革,有潜力催生多种优势,但也面临挑战,未来消费者将是最终赢家。
2025-02-08
用Ai进行数据分析的最佳实践
以下是关于用 AI 进行数据分析的最佳实践: 流程: 逻辑流程图如下:SQL 分析中,用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验是 SELECT 类型的 SQL 后执行,将结果数据传给 GPT(附带上下文),让其学习并分析数据,最后输出分析结论和建议,与结果数据一起返回给前端页面渲染图表、展示分析结论。个性化分析中,用户上传文件,前端解析后传给 GPT 分析数据,后续步骤与 SQL 分析一致。 个性化分析示例: 上传的数据均为假数据,包括游戏 A 流水数据、游戏产品数据、页面事件统计和用户行为数据等。包括单维度数据、多维度数据(折线图、柱状图)。有时 AI 会误将数据项作为维度分析,可输入提示告诉它用哪个字段作为维度,也可描述其他数据信息使分析更准确。 总结和展望: ChatGPT 在数据分析领域应用前景广泛,本文案例与技巧展示了其在提高效率、降低技能门槛和支持决策等方面的优势。但案例分析结果可能简单,接入业务时可定制多种分析模板,增加分析多样性。实际业务中处理大量数据时,除长类型字段限制,要指定允许查询或解析的字段,对结果数据进行两次校验。随着技术进步,相信其将为数据分析带来更多创新和突破。 问题与技巧: SQL 分析: 反复校验是否为 SELECT SQL 语句,不仅因 AI 不完全可控,还因不能相信用户输入,防止恶意操作。 到 AI 分析步骤拼接上下文,提供表结构信息和 SQL 语句,助 GPT 更好理解数据和字段意义,使分析更准确。 针对表结构长类型字段,不允许直接查询,最好告诉 GPT 允许查询的字段或 SQL 函数,使生成可控。 个性化分析: 用户上传数据解析后判断格式是否符合要求,超长可限制截取前面若干项。 前端解析用户上传数据后可直接用于渲染数据图表,无需后端返回。 支持用户补充输入,描述数据、字段意义或作用辅助 AI 分析。遇到多维度数据,GPT 可能误将其他字段作为维度分析,可输入特定提示帮助分析。
2025-02-08
TTS的最佳解决方案
以下是关于 TTS 的一些最佳解决方案: 在线 TTS 工具推荐: Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为多种平台的应用使用,用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio:https://speech.microsoft.com/portal ,提供了支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型。 Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 TTS 音库制作和文本前端: 录音文本收集:在一个语种的语音合成建设之初,可同步收集该语种对应的大文本。录音文本的选择一般遵循以下原则: 音素覆盖:构建基础的文本前端,确保录音文本的音素或音素组合尽可能覆盖全。 场景定制:根据通用或特定场景需求,确保相关内容有所覆盖,并与需求方紧密沟通。 文本正确性:确保录音文本拼写无误,内容正确。 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi: 接口请求域名:https://open.mobvoi.com/api/tts/v1 。 接口请求频率限制:5 次/秒。 可以将任意文本转化为语音,应用场景广泛,提供多种方言、发音人和风格,实时合成支持 SSML。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-07
企业管理咨询顾问应用AI辅助工作的最佳实践
以下是企业管理咨询顾问应用 AI 辅助工作的一些最佳实践: 对于企业管理者: 1. AI 辅助决策:在小规模决策中运用 AI 分析工具,如利用其分析客户反馈或市场趋势数据,以此作为决策参考。 2. 员工培训计划:制定 AI 工具使用的培训计划,助力团队成员在日常工作中有效利用 AI。 3. 流程优化:识别公司内可能受益于 AI 自动化的重复性任务,先从一个小流程开始测试 AI 解决方案的效果。 4. AI 伦理和政策:着手制定公司的 AI 使用政策,确保 AI 的应用符合伦理标准和法律要求。 对于商业顾问: 1. 工具服务小型企业:生成式 AI 对于小型企业是一个重要的应用场景,如 Sameday 可接电话并预约,Truelark 能处理短信、电子邮件和聊天等。 2. 特定类型企业的垂直化工具:出现了为特定类型企业工作流定制的工具,如 Harvey 和 Spellbook 帮助法律团队自动化任务,Interior AI 和 Zuma 在房地产行业发挥作用。 无论您属于哪个群体,与 AI 协作是一个学习过程。应从小处着手,保持好奇心和开放态度,将 AI 视为强大的工具而非完全依赖的解决方案。同时,始终保持批判性思维,您会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。
2025-02-06
AI阅读书籍的最佳实践是什么?
以下是关于 AI 阅读书籍的一些最佳实践: 1. 方法论萃取: 针对不同类型书籍的阅读和记忆方法进行分类,探讨共性方法论。 研究阅读和记忆的思维模型及小技巧。 思考如何优先选择自己“一定看得下去”的书籍,通过目录大纲确定核心内容。 确定一本书的阅读次数和顺序。 考虑读书过程中做笔记还是读完后回忆做大纲。 探索如何教刚毕业的孩子学会有效读书。 根据上述问题的答案设计“书籍阅读助手”“催我读书”等 Prompt,并不断优化和迭代。 2. 成为博物学家: 了解各个领域的知识,在恰当的时候调用。 参考权威、准确、有框架、成体系且好读的推荐书单,如涵盖心理学、人工智能、经济学等 13 个学科的书单。 3. 批判性思考: 思考在哪些情况下使用和不使用 AI 辅助阅读。 避免将 AI 作为默认选项,例如在使用地图导航时,不应完全依赖,而应注重自身对环境的观察和记忆。
2025-01-31
有哪些在企业内部落地应用AI大模型工具的实践案例?不要营销文案生成、代码开发助手、智能客服问答机器人这种太常见的
以下是一些在企业内部落地应用 AI 大模型工具的实践案例: 1. 阿里云百炼: 智能体应用:能够弥补大模型的不足,如回答私有领域问题、获取实时信息、回答专业问题等。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,以及缺少技术人员开发大模型问答应用的场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 内部业务助手:通过企业内部规章制度、部门结构、产品介绍等文档构建知识库,并借助 RAG 智能体实现内部知识问答功能。系统支持多源异构数据,并通过复杂文档解析和视觉增强技术,提升文档理解的准确性与深度。目前该功能已灰度上线,需提供 UID 并通过白名单进行开启。 2. 达摩院: AI 模特(虚拟换装):支持虚拟换装、姿态编辑。 3. 电商零售: 推广文案写作:通过内置的多样化营销场景的文体模板,基于用户输入的创作主题以及参考素材,大模型即可为您生成对应的营销文案,为营销活动和宣传文案提供灵感和文案写作支持。 4. 泛企业: VOC 挖掘:是一个面向各类企业的 VOC 标签挖掘的工具。不论是用户的长短评论、帖子、还是用户和客服/销售的聊天记录、通话记录,都可以使用。通过选中或自定义标签,即可让大模型针对海量非结构化的 VOC 数据快速打标。相比于人工打标或规则打标准确率更高;对于业务标签变动频繁的情况,也能更敏捷、快速地影响。 5. 通义晓蜜:基于深度调优的对话大模型,为营销服类产品提供智能化升级所需的生成式摘要总结、质检、分析等能力应用。
2025-02-18
coze的deepseek实践
以下是关于 coze 的 deepseek 实践的相关信息: 一个提示词让 DeepSeek 的能力更上一层楼: 效果对比:用 Coze 做了小测试,可对比查看相关视频。 如何使用:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。 设计思路:将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现同时使用联网和深度思考功能,在模型默认能力基础上优化输出质量,设计阈值系统,用 XML 进行规范设定。 完整提示词:v 1.3 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。 字节火山上线了 DeepSeek 系列模型并更改了模型服务价格: 2 月 14 日 8 点有直播,直播结束可看回放,相关学习文档可查看。 重点更新:上线 DeepSeek 系列模型,DeepSeekR1、V3 模型分别提供 50 万免费额度和 API 半价活动,即日起至 2025 年 2 月 18 日 23:59:59 所有用户均可享受价格优惠。 2024 年 7 月 18 日历史更新(归档): 《长文深度解析 Coze 的多 Agent 模式的实现机制》:艾木老师深入研究了 Coze 的多 Agent 模式机制,分析了三种节点跳转模式及应用场景和不足。 《揭秘 DeepSeek: 一个更极致的中国技术理想主义故事》:DeepSeek 以独特技术创新崭露头角,发布颠覆性价格的源模型 DeepSeek V2,创始人梁文锋是技术理想主义者。 《10 万卡集群:通往 AGI 的新门票》:分析了 10 万 GPU 集群建设的相关问题,指出数据中心设计和网络拓扑结构对大型 AI 训练集的重要性。
2025-02-16
ai实践的内容
以下是关于 AI 实践的相关内容: 社区 AI 讲师招募 招募要求: 具有丰富的企业端 AI 实践经验,涵盖以下场景之一或多个: AI 生成爆款内容,如借助 AI 分析挖掘同品类爆款,利用 AI 工具生成电商商品图、小红书图文内容、种草短视频等。 公域阵地场景,基于视频号、抖音、小红书、公众号等平台搭建企业营销推广能力,包括矩阵号和 IP 号,通过短视频、直播等方式获取 leads,涉及矩阵号工具、内容抓取分析、脚本创作、AI 剪辑、自动回复评论、无人直播工具等。 私域阵地场景,如朋友圈、小红书、社群、个人 IP 的获客转化,使用销售企微 SCRM 工具、企业智能体进行 AI 内容抓取和自动回复。 服务自动化工具,包括数据监控和预警、流程优化、自动运营等。 快速搭建数据分析看板。 跨境电商场景,如 tiktok 视频制作及投放、电商图片设计、精准营销、语言翻译、AI 独立站建设、社媒私域、批量混剪、海外达人直播、无人直播(数字人直播)等。 具备良好的表达能力,能清晰阐述技术和业务方面的沉淀。 招募流程:感兴趣的小伙伴提交个人简历(包括基本信息介绍、学历、专业、工作经验,以及 AI 企业端的案例),填写问卷,预约电话面谈,面谈通过后进行公开课试讲。 陈财猫:如何用 AI 写出比人更好的文字? AI+内容创作是现阶段的优质赛道,具有完美的产品模型匹配和产品市场匹配,且发展上限高。 AI 写作的实践成果包括营销、小说和短剧创作,开发了智能营销矩阵平台,参与喜马拉雅短故事和短剧写作课程,推出小财鼠程序版 agent。 好文字能引发人的生理共鸣与情绪,AI 因预训练数据量大能学会引发共鸣从而写出好文字。 用 AI 写出好文字的方法:选择合适的模型,评估模型的文风、语言能力、是否有过度道德说教与正面描述趋势、in context learning 能力和遵循复杂指令的能力;克服平庸,平衡“控制”与“松绑”;显式归纳想要的文本特征,通过 prompt 中的描述与词语映射到预训练数据中的特定类型文本,往 prompt 里塞例子。 对 AI 创作的看法:AI 创作的内容有灵魂,只要读者有灵魂,文本就有灵魂;有人讨厌 AI 是因其未改变多数人生活或自身是受害者,作者期望 AI 能力进一步提升以改变每个人的生活。 熊猫 Jay:用 AI+思维模型探索问题的全新解答 案例实践:利用 AI+六顶思考帽做个人 IP 定位。 推荐使用 GPT4,效果更稳定,内容质量更高。包括初始化提示词、回答每顶帽子对应的问题,最终得到答案和建议。 文心 4.0 同样包括初始化提示词、回答每顶帽子对应的问题,并得到答案和建议。 小结:该案例借助六顶思考帽提供不同思考维度,引导全面思考问题。当把思考后的信息输入给 AI 后,能总结出满意的答案和建议。开头提到人的惰性问题,借助 AI 可以更全面剖析个人决策或团队会议中的问题,找到更正确的决策方式。之后,大家可用六顶思考帽+AI 解决困扰自己的问题,无论是个人决策还是团队讨论。
2025-02-13