直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

英伟达数字员工

回答

以下为一些英伟达数字员工相关的信息及典型案例: |名字|描述|性别|附件|框架|链接| |-|-|-|-|-|-| |Hóng|红杉中国首位数字员工,每秒可看百份商业计划书|女||小冰|https://news.stcn.com/sd/202207/t20220711_4732226.html| |Yumi|SK-II 的品牌虚拟形象|女|||https://www.soulmachines.com/| |冯小殊|北京冬奥会气象播报员,数字孪生人|男||小冰|https://mp.weixin.qq.com/s/SBCMHD2QWnk0ZEeGcNq_Pw| |夏语冰|中央美术学院研究生,师从邱志杰教授|女||小冰|https://mp.weixin.qq.com/s/rTX8xkn1_rsvCXj-J3kDBQ| |屈晨曦|屈臣氏的品牌虚拟形象|男||小冰|| |度晓晓|百度数字人|女||曦灵数字人|| |星瞳|QQ 炫舞系列虚拟代言人|女|||| |柳夜熙|一个会捉妖的虚拟美妆达人|女|||https://weibo.com/u/7431953645?refer_flag=1005055013_| |洛天依|中国内地虚拟歌手|女|||https://baike.baidu.com/item/%E6%B4%9B%E5%A4%A9%E4%BE%9D/6753346| |翎|虚拟偶像|女||魔珐数字人||

另外,句子互动致力于打造大模型驱动的领先数字员工。关于 AI 智能体,个人理解其相当于为个人提效的数字员工,您可以像老板给员工下达任务一样,通过清晰的目标和提示词让其为您工作,并且不断寻求反馈以实现目标。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

1.7 AI 数字人+语音合成

[title]1.7 AI数字人+语音合成[heading2]典型案例|名字|描述|性别|附件|框架|链接|<br>|-|-|-|-|-|-|<br>|Hóng|红杉中国首位数字员工,每秒可看百份商业计划书|女||小冰|[https://news.stcn.com/sd/202207/t20220711_4732226.html](https://news.stcn.com/sd/202207/t20220711_4732226.html)|<br>|Yumi|SK-II的品牌虚拟形象|女|||[https://www.soulmachines.com/](https://www.soulmachines.com/)|<br>|冯小殊|北京冬奥会气象播报员,数字孪生人|男||小冰|[https://mp.weixin.qq.com/s/SBCMHD2QWnk0ZEeGcNq_Pw](https://mp.weixin.qq.com/s/SBCMHD2QWnk0ZEeGcNq_Pw)|<br>|夏语冰|中央美术学院研究生,师从邱志杰教授|女||小冰|[https://mp.weixin.qq.com/s/rTX8xkn1_rsvCXj-J3kDBQ](https://mp.weixin.qq.com/s/rTX8xkn1_rsvCXj-J3kDBQ)|<br>|屈晨曦|屈臣氏的品牌虚拟形象|男||小冰||<br>|度晓晓|百度数字人|女||曦灵数字人||<br>|星瞳|QQ炫舞系列虚拟代言人|女||||<br>|柳夜熙|一个会捉妖的虚拟美妆达人|女|||[https://weibo.com/u/7431953645?refer_flag=1005055013_](https://weibo.com/u/7431953645?refer_flag=1005055013_)|<br>|洛天依|中国内地虚拟歌手|女|||[https://baike.baidu.com/item/%E6%B4%9B%E5%A4%A9%E4%BE%9D/6753346](https://baike.baidu.com/item/%E6%B4%9B%E5%A4%A9%E4%BE%9D/6753346)|<br>|翎|虚拟偶像|女||魔珐数字人||

句子互动:打造大模型驱动的领先数字员工

[title]句子互动:打造大模型驱动的领先数字员工

XAIR:AI 智能体平台对决:腾讯元器与字节扣子的创新之路

[title]XAIR:AI智能体平台对决:腾讯元器与字节扣子的创新之路[heading2]一、概念定义这个观点没找到出处,感觉很适合卖课宣传。个人理解AI智能体是给个人提效的,相当于你拥有了自己的数字员工,在WaytoAGI的分享上大聪明(赛博禅心作者)也表达过这个观点,Agent就是你可以不断PUA你的电脑,让它能不能做的更好呀,来实现你制定的目标(加粗显示)。这和现实中老板给员工下达任务很像,每个员工有不一样的性格和能力,而下达任务目标时,目标是否清晰以及能否让员工get到很重要,这考验你写提示词的能力。而员工会基于它对目标的理解,根据计划去不断尝试完成,并且过段时间来寻求你的反馈。也就是你拥有了一个免费打工人,并且你还可以无限PUA它给你干活,这种感觉爽不爽?(图源:朋友截图,来源未知)

其他人在问
英伟达H200
英伟达 H200 是英伟达推出的一款 AI 芯片。其推理速度是前代 H100 的两倍,使用 HBM3e 内存,显存带宽提升至 4.8TB 。NVIDIA 创始人兼首席执行官黄仁勋在 SIGGRAPH 会议上宣布了相关信息,GH200 已于 5 月份全面投入生产,将具备连接多个 GPU 的能力。Nvidia 还正在与 HuggingFace 合作,帮助开发人员在任何云上创建、测试和微调生成式 AI 模型。 相关链接:https://x.com/xiaohuggg/status/1724239489302974768?s=20
2024-10-29
数字员工
数字员工是一种通过 AI 智能体实现的为个人提效的方式。在 WaytoAGI 的分享中,大聪明(赛博禅心作者)认为,AI 智能体就如同个人拥有的数字员工,您可以不断向其下达任务,就像老板给员工下达任务一样。每个数字员工有不同的特点和能力,下达任务时目标是否清晰以及能否被理解很重要,这考验写提示词的能力。数字员工会基于对目标的理解,按照计划不断尝试完成,并适时寻求反馈。例如句子互动就在打造大模型驱动的领先数字员工。
2024-10-21
我是一名企业任用岗人,需要作一版关于AI在任用管理(包括员工入职管理,员工异动管理,员工转正管理,员工离职管理,员工合同续签管理)工作中的成果展示,进行简易的分享;我不知道如何分享,且分享的表述如何简洁而不失重点。
以下是一些 AI 在不同工作场景中的应用案例,可作为您在任用管理工作成果展示中的参考: 营销:定制营销报告,涵盖汇报对象身份、销售数据、财务报告、市场分析、客户反馈、营销效果评估等方面。 办公:高效做 PPT,利用 ChatGPT 生成 Markdown 语法内容,再借助 MindShow 转换为精美 PPT;编写 Excel 公式,通过交互和迭代获取准确公式;写邮件,满足特定需求。 办公:会议总结,包括会议主题、参与人员、讨论议题、关键观点等要素。 项目管理:通过创建和维护跨团队项目协作计划,明确员工角色和职责。 销售:话术总结优缺点,考虑产品特点、服务优势、目标客户需求等因素;定制销售解决方案,综合企业产品和服务等内容。 客服:定制客服话术,涵盖产品知识、售后服务等 13 个关键词库。 HR:团队绩效管理,根据往期数据分析员工绩效排名并给出考评和改进建议;面试工具,如使用 GPT4 技术的实时转录工具辅助求职者。 科学:研制采摘机器人,如荷兰代尔夫特大学和瑞士洛桑联邦理工学院科学家的探索;设计航天器零部件,提高设计效率和创新度。
2024-10-16
百度有推出数字员工吗?怎样可以根据小冰框架开发数字员工?
百度有推出数字员工,叫做度晓晓。度晓晓是百度公司推出的一款数字人,它可以与用户进行自然语言对话,回答用户的问题,提供信息和服务。度晓晓的特点是它具有高度的智能化和个性化,它可以根据用户的需求和喜好,提供个性化的服务和建议。 如果你想根据小冰框架开发数字员工,可以考虑以下步骤: 1. 了解小冰框架:小冰框架是一个开放的人工智能框架,它提供了一系列的工具和接口,用于开发和部署人工智能应用。你需要了解小冰框架的基本概念和功能,以便更好地使用它。 2. 准备开发环境:你需要准备一个开发环境,包括一台计算机和相关的软件工具。你可以选择使用小冰框架提供的开发工具,也可以使用其他的开发工具。 3. 开发数字员工:你需要使用小冰框架提供的工具和接口,开发一个数字员工。你需要定义数字员工的行为和功能,以及它与用户的交互方式。 4. 部署和测试:你需要将开发好的数字员工部署到服务器上,并进行测试和调试。你需要确保数字员工能够正常工作,并满足你的需求。 5. 优化和改进:你需要根据用户的反馈和需求,对数字员工进行优化和改进。你需要不断提高数字员工的性能和质量,以满足用户的需求。 总的来说,根据小冰框架开发数字员工需要一定的技术和时间投入,但它可以为你提供一个强大的工具,帮助你开发出更加智能和个性化的数字员工。
2024-05-06
数字人聊天
以下是关于数字人聊天的相关信息: 数字人脸创作方式: 1. 使用一系列逼真的照片或插图人脸,这些人脸经过优化,在添加语音和动作时能实现最佳效果。 2. 上传自己、朋友或家人的面部照片进行创作。 3. 利用 DID 自带的 Stable Diffusion 的能力生成想象中的人脸,如描述“一个外星女神”“一个微笑的十九世纪维多利亚绅士”等。 数字人像被添加到人脸库后,可重复使用,只需输入新脚本,就能让其说任何想让它说的话。 数字人说话方式: 1. 利用 GPT3 文本生成技术撰写脚本。 2. 先选好脸,再输入脚本。 3. 输入准备好的脚本,DID 中有数百种语言和口音,可选择想要使用的声音,并调整角色说话风格。 4. 上传自己的音频记录,或从电影、电视剧中剪辑喜欢的台词,甚至吟唱自编的歌曲。 AI 数字人类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(如柳夜熙)、内容创作()等。 2. 真人形象数字人:用于直播卖货、营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等。 AI 数字人的价值: 1. 代替人说话,提升表达效率和营销效率,如真人无法 24 小时直播,数字人可以。 2. 创造真实世界无法完成的对话或交流,例如 AI talk 的实验探索,复活故去的亲人等。 AI 数字人面临的问题: 1. 平台限制:数字人水平参差不齐,平台担心直播观感,有一定打压限制。如抖音出台一些标准,微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间依赖大模型技术提升。 3. 需求限制:直播带货是落地场景,但不够刚。“懂得都懂”的刚需场景,国内搞不了。目前更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等。 面对大厂竞争的策略: 1. 大厂做产品有很多部门利益牵扯,法务合规等问题,不敢用野路子,开发上线产品效率低。 2. 大厂人工成本高,不少方向和领域都不会做,内部决策不一定靠谱。 3. 在电商领域,数字人不能也无法成为壁垒,跟数字人配套的运营服务才是,大厂一般不愿做重运营的事。
2024-11-04
有哪些制作数字人的网站和软件
以下是一些制作数字人的网站和软件: 1. HeyGen:这是一个 AI 驱动的平台,能够创建逼真的数字人脸和角色。它运用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等领域。 2. Synthesia:这是一个 AI 视频制作平台,允许用户创建虚拟角色并实现语音和口型同步。它支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意对生成内容的版权和伦理责任。 此外,在剪映中也可以制作数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中。还可以为数字人增加背景图片等进行美化。
2024-11-03
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时,也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人: 算法开源代码仓库: ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition(语音识别接口集合):https://github.com/Uberi/speech_recognition AI Agent:大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可用 LangChain 模块自定义,包含 Agent 实现的几个组件(https://www.langchain.com/) TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用预设人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注于唱歌,如前段时间很火的 AI 孙燕姿。 人物建模模型可通过手动建模(音频驱动)或 AIGC 方式生成人物动态效果(如 wav2lip 模型),但简单构建方式存在一些问题,如生成指定人物声音、TTS 生成音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等。
2024-11-03
数字人平台
以下是关于数字人平台的相关信息: 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等。 Synthesia:AI 视频制作平台,能创建虚拟角色并进行语音和口型同步,支持多种语言,用于教育视频、营销内容和虚拟助手等。 DID:上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的会开口说话的视频。 更多工具可访问网站查看:https://www.waytoagi.com/category/42 。使用时请遵守相关条款和政策,注意版权和伦理责任。 7 月 2 日张晟、汗青的讨论: AI 数字人类型和应用场景:二维/三维虚拟人用于游戏、IP 品牌、内容创作等;真人形象数字人用于直播卖货、营销/投流广告视频录制、语言学习等。 AI 数字人的价值:代替人说话,提升表达和营销效率;创造真实世界无法完成的对话或交流。 AI 数字人面临的问题:平台限制,如水平参差不齐,平台有打压限制;技术限制,形象依赖大模型技术提升;需求限制,直播带货是落地场景但不够刚需,更多是体验新鲜感;伦理/法律限制,如声音、影像版权等。 延伸阅读报告: ,东方证券,2023/04/26 。 ,广发证券,2023/06/18 。 ,亿邦智库,2023/09/01 。 ,西南证券,2023/08/12 。 ,清华大学新闻与传播学院,2023/07/29 。 ,国盛证券,2023/03/13 。 ,中国网络视听协会人民日报智慧媒体研究院中国传媒大学动画与数字艺术学院元力趋势网,2024/01/01 。 ,上海市人工智能技术协会、零壹智库、增强现实核心技术产业联盟、商汤科技,2024/04/11 。
2024-11-02
数字人直播
以下是关于数字人直播的相关信息: 会议讨论要点: 目前做数字人电商直播,可能只是因为前期宣传及未发现其他更好场景。 数字人配套的运营服务才是电商领域的关键,续费客户多因服务而非数字人本身。 数字人直播在店播场景效果较好,数据能与真人相当。 不建议商家依赖数字人,现阶段数字人服务多为辅助。 盈利方式: 直接卖数字人工具软件,分实时驱动(一年 4 6 万往上)和非实时驱动(一个月 600 元,效果差,市场价格混乱)两类。 提供数字人运营服务,按直播间成交额抽佣。 适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,过品快且衣服建模成本高。 适用于虚拟商品,如门票、优惠券等。 不适用于促销场景,涉及主播话术、套路及调动直播间氛围能力等。 店播场景效果最佳,数据基本能保持跟真人一样。 壁垒和未来市场格局: 长期看技术上无壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 能把客户服务好、规模化扩张的公司更有价值,疯狂扩代理割韭菜的公司售后问题多。 有资源、有业务的大平台下场可能带来降维打击,如全环节打通会绑定商家。 数字人简介: 数字人是运用数字技术创造出来的,虽现阶段不能高度智能,但在生活各类场景中已常见。业界尚无准确定义,一般按技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,应用于影视和直播带货,表现质量与建模精细度及动捕设备精密程度相关,视觉算法进步使无昂贵设备也能有不错效果。
2024-11-01
实景数字人
以下是关于实景数字人的相关信息: AI 数字人类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(如柳夜熙)、内容创作()等。 2. 真人形象数字人:用于直播卖货,营销/投流广告视频录制(如 Heygen)、语言学习(如 CallAnnie)等。 AI 数字人的价值: 1. 代替人说话,提升表达效率和营销效率。例如真人无法 24 小时直播,但数字人可以。 2. 创造真实世界无法完成的对话或交流。比如 AI talk 的实验探索,复活故去的亲人等。 AI 数字人面临的问题: 1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。比如抖音出台一些标准,微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间依赖大模型技术提升。 3. 需求限制:直播带货是落地场景,但不够刚。“懂得都懂”的刚需场景,国内搞不了。目前更多是体验新鲜感。 4. 伦理/法律限制:存在声音、影像版权等问题,比如换脸、数字永生等。 如何构建高质量的 AI 数字人: 1. 构建数字人灵魂:让数字人具备各种智能,如记住个人信息、充当个人助手、在某个领域具备专业知识、处理复杂任务等。实现这些能力有几个工程关键点,包括写像人一样思考的 AI Agent,面临记忆模块、工作流模块、工具调用模块的构建挑战;灵魂部分驱动躯壳的实现,要定义灵魂部分的接口,躯壳通过 API 调用,注意包含情绪的语音表达以及保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做逻辑判断来播放预设,语音驱动口型相对成熟但闭源;要解决实时性问题,由于算法部分庞大,几乎不能单机部署,特别是大模型部分,会涉及网络耗时和模型推理耗时,低延时是亟需解决的问题;实现多元跨模态,不仅是语音交互,还可根据需求添加其他感官,如视觉通过添加摄像头数据和 CV 算法做图像解析等;处理拟人化场景,如插话、转移话题等情况,实现工程上的丝滑处理。 2. 虚拟数字人的分类和驱动方式:从驱动层面分为中之人驱动和 AI 驱动。中之人驱动运用动作捕捉和面部捕捉技术实现交互,有上限,缺乏高并发和量产化能力。AI 驱动使用 AI 技术创建、驱动和生成内容,赋予交互能力。从应用层面分为服务型、表演型和身份型。服务型虚拟数字人如虚拟主播、助手、教师、客服和医生等,为物理世界提供服务。表演型如虚拟偶像用于娱乐、影视等。身份型是物理世界“真人”的数字分身,在元宇宙中有广泛应用。 以上讨论的虚拟数字人是 AI 驱动的,主要集中于服务型虚拟数字人,强调其具有功能属性,隶属于业务层。
2024-11-01