Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

近期数字人比较成熟的应用有哪些

Answer

数字人目前有以下较为成熟的应用:

  1. 影视行业:真人驱动的数字人通过动捕设备或视觉算法还原真人动作表情,用于影视制作。
  2. 直播带货:真人驱动的数字人在直播带货领域发挥作用。
  3. 家庭:未来可能会有数字人管家,全面接管智能家居或其他设备。
  4. 学校:未来可能会有数字人老师,为学生答疑解惑。
  5. 商场:未来可能会有数字人导购,为顾客提供指路、托管个人物品等服务。

数字人的构建方式包括:

  1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表如 Live2D Cubism。
  2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表如 UE、Unity、虚幻引擎 MetaHuman 等。
  3. AIGC:虽然省去建模流程,但在数字人 ID 一致性和帧连贯性上存在弊端,不过算法发展迅速,未来可能会有改善。AIGC 还有直接生成 2D/3D 引擎模型的探索方向。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人-定义数字世界中的你

这类数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

数字人在未来肯定会有很多的应用场景,比如家庭中有数字人管家,全面接管智能家居或其他设备;学校中有数字人老师,孜孜不倦的为学生答疑解惑;商场里有数字人导购,为顾客提供指路、托管个人物品等悉心服务...数字人在未来肯定还有很多的技术突破,比如可以将五感数据作为输入(例如声音、图像、气味、震动等等),将所有可以控制躯壳的参数也作为输入(例如躯壳骨骼节点,面部混合形状参数等);次世代的算法可以自我迭代升级,也可以拿到感官输入以及躯壳控制方法后,自行演化躯壳控制方式...笔者希望通过Dify搭建数字人的开源项目,给大家展现低门槛高度定制数字人的基本思路,但数字人的核心还是在于我们的Agent,也就是数字人的灵魂,怎样在Dify上面去编排专属自己的数字人灵魂是值得大家自己亲自体验的。真诚的希望看到,随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,用户在需要使用AI的能力时,AI既可以给你提供高质量的信息,也能关注到你的情绪,给你一个大大的微笑,也许到了那时,数字世界也开始有了温度。

Others are asking
我能否借助开源社区力量构建高质量的 AI 数字人
您可以借助开源社区力量构建高质量的 AI 数字人。 构建数字人的躯壳有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表是 UE、Unity、虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:省去建模流程直接生成数字人的展示图片,但存在算法生成的数字人很难保持 ID 一致性、帧与帧连贯性差等弊端。如果对人物模型真实度要求不高,可以使用,典型项目有 wav2lip、videoretalking 等。AIGC 还有直接生成 2D/3D 引擎模型的方向,但仍在探索中。 构建数字人的灵魂需要注意以下几个工程关键点: 1. AI Agent:要让数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过定义接口由躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 实时性:由于算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:不仅仅是语音交互,还可以通过添加摄像头数据获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流时不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。 如果都要自建代码实现各模块,开发工作量巨大,迭代难度也很高,对于个人开发者来讲不现实。因此推荐借助开源社区的力量,现在开源社区已经有了像 dify、fastgpt 等等成熟的高质量 AI 编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等等。我们可以通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。在笔者的开源项目中,使用了 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于这个两个接口就可以将数字人的语音识别和语音生成都交由 Dify 控制,从而低门槛做出来自己高度定制化的数字人。具体的部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。此外,数字人 GUI 工程中仍然保留了 LLM、ASR、TTS、Agent 等多个模块,能够保持更好的扩展,比如实现更加真实性感的语音转换、或者如果有更加 Geek 的 Agent 实现也可以选择直接后端编码扩展实现。 使用 Dify 接口需要注意: 1. 必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,这里可以自行选择自己方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可以根据个人喜好添加。
2025-01-21
方案一生成的数字人效果怎么样
生成数字人的效果因使用的工具和方法而异。以下是一些常见的情况: 在剪映中生成数字人: 打开“数字人”选项,选择免费且适合的形象,如“婉婉青春”,软件会播放其声音,可判断是否需要,点击“添加数字人”将其添加到视频中,剪映会根据提供的内容生成对应音视频并添加到轨道中。左下角会提示渲染完成时间,可点击预览按钮查看效果。 腾讯的 MimicMotion 项目: 效果显著优于阿里,支持面部特征和唇形同步,不仅用于跳舞视频,也可应用于数字人。其优化包括基于置信度的姿态引导机制确保视频连贯流畅、基于姿态置信度的区域损失放大技术减少图像扭曲变形、创新的渐进式融合策略实现任意长度视频生成。项目地址:https://github.com/tencent/MimicMotion 节点地址:https://github.com/AIFSH/ComfyUIMimicMotion 此外,还有适合小白用户的开源数字人工具,如: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub: 官网:
2025-01-21
我想组织一个团队,完成属于自己的一套数字人制作技术
以下是组织一个团队完成属于自己的一套数字人制作技术的相关内容: 方案一:剪映数字人“个性化“—无限免费私模数字人 1. 准备谷歌账号(可在淘宝或“”购买)。 2. 第一步:打开谷歌浏览器,点击链接https://github.com/facefusion/facefusioncolab 并点击 open colab 进入程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 3. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 4. 第三步:等待专属数字人视频出炉。 方案二:借助开源社区力量构建高质量的 AI 数字人 1. 推荐借助开源社区的像 dify、fastgpt 等成熟的高质量 AI 编排框架,它们有大量开源工作者维护,集成各种主流模型供应商、工具及算法实现等。 2. 可通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。 在开源项目中,使用 dify 框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,实现相对复杂功能,如知识库搭建、工具使用等,无需编码和重新部署工作。 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于此可将数字人的语音识别和语音生成都交由 Dify 控制,低门槛做出高度定制化的数字人。具体部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。 若有更高度定制的模型,也可在 Dify 中接入 XInference 等模型管理平台部署自己的模型。 数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块,能保持更好的扩展。 注意事项: 1. 使用 Dify 接口时,必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,可自行选择方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可根据个人喜好添加。 制作数字人的工具: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-01-21
ai数字人怎么生成
生成 AI 数字人主要有以下步骤: 1. 在剪映中生成数字人: 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片: 删除先前导入的文本内容,因为视频音频已包含文字。 点击左上角“媒体”菜单并“导入”,选择本地图片上传,如一张书架图片,点击图片右下角加号添加到视频轨道(会覆盖数字人)。 拖动轨道最右侧竖线使图片与视频对齐,选中轨道,拖动图片角放大到合适尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。 4. 算法驱动的数字人实现流程: 核心算法包括 ASR(语音识别),能将用户音频数据转化为文字,便于数字人理解和生成回应。 AI Agent(人工智能体)充当数字人大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音)将数字人依靠 LLM 生成的文字输出转换为语音。 完成上述步骤后,点击右上角“导出”按钮导出视频备用。若希望数字人换脸,则需使用其他工具。
2025-01-20
数字人
数字人是运用数字技术创造出来的人,虽现阶段不能如科幻作品中的人型机器人般高度智能,但已在生活各场景中常见,且随 AI 技术发展迎来应用爆发。目前业界对其无准确定义,一般按技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视行业及直播带货,表现质量与手动建模精细度及动捕设备精密程度直接相关,不过视觉算法进步使无昂贵动捕设备时,通过摄像头捕捉人体骨骼和人脸关键点信息也能有不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,能创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,可创建虚拟角色并进行语音和口型同步,支持多种语言,用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音并合成逼真说话视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请遵守相关使用条款和隐私政策,注意生成内容的版权和伦理责任。 以下是一些包含数字人的节目单示例: 1. 节目“猜真人”:魔术互动类表演,2 个、8 个数字分身,猜哪个是真正的我,需求技术为 AI 数字人。 2. 节目“亲情的应用场景(逝者)”:女儿打扫房间扫到去世父亲二维码再次对话,涉及 AI 分身积累准备。 3. 节目“AI 转绘”:经典电影混剪,涉及短片素材、AI 转绘、Lora 等。 4. 节目“AI 贺岁”:晚会中场致谢,包括共创团队记录、新年祝福等。 5. 节目“打工人共情”:涉及 AI 素材、共情脚本、炫技视频剪辑等。
2025-01-20
数字人带货怎么做
数字人带货的相关内容如下: 1. 数字人直播盈利方式: 直接卖数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动价格一年 4 6 万往上,非实时驱动一个月 600 元,效果差且市场价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 2. 数字人直播卖货适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料,不适用于服装,因衣服建模成本高。 适用于虚拟商品,如门票、优惠券等。 不适用于促销场景,涉及主播话术、套路和调动直播间氛围能力等。 电商直播分达播跟店播,数字人直播效果最好的是店播,数据基本能保持跟真人一样。 3. 数字人直播的壁垒和未来市场格局: 时间拉长,技术上没壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 真正把客户服务好,能规模化扩张的公司更有价值。 有资源、有业务的大平台下场,可能会带来降维打击。 此外,还有关于数字人带货的具体操作案例: 1. 用 ChatGPT 生成短视频选题文案,表明身份、描述需求和回答要求,以美妆行业为例。 2. 用 ChatGPT 生产短视频文案,将需求与框架结合。 3. 生成虚拟数字人短视频: 打开网站 https://studio.did.com/editor 。 在右侧文字框输入 ChatGPT 生成的内容,选择想要的头像、不同的国家和声音。 点击右上角的 Create Video ,等待生成。生成后结合产品做讲解即可发布去做视频带货。 数字人的简介:数字人是运用数字技术创造出来的人,目前业界没有准确定义,一般根据技术栈不同分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业和直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关,随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。
2025-01-19
市场有哪些成熟的AI应用案例
以下是一些成熟的 AI 应用案例: 彩云天气 APP:这是一个 AI 天气预报预警系统,使用数据分析和机器学习技术,市场规模达数亿美元。它能提供准确的天气预报预警,保障生命财产安全,例如在暴雨来临前推送预警信息,提醒用户避免外出。 腾讯觅影:作为 AI 医疗影像分析平台,运用数据分析和机器学习,市场规模达数十亿美元。它可以分析医疗影像,辅助医生诊断,比如检测肺部结节、乳腺病变等,提高诊断效率和准确性。 钉钉会议管理功能:这是一个 AI 会议管理系统,采用自然语言处理和数据分析技术,市场规模达数亿美元。它能够管理会议流程,提高会议效率,比如自动记录会议内容,生成会议纪要,方便参会人员回顾。 微拍堂书法作品拍卖频道:此为 AI 书法作品销售平台,借助图像识别和数据分析技术,市场规模达数亿美元。它为书法爱好者提供作品销售渠道,比如用户可以在平台上拍卖自己的书法作品,也可以购买其他用户的作品。 宝宝树安全座椅推荐:AI 儿童安全座椅推荐系统,运用数据分析和机器学习,市场规模达数亿美元。它能根据儿童年龄、体重等信息为家长推荐合适的儿童安全座椅。 途虎养车保养推荐:AI 汽车保养套餐推荐系统,使用数据分析和机器学习,市场规模达数十亿美元。它会根据车辆情况推荐保养套餐,如更换机油、滤清器等。 丰巢快递柜管理系统:AI 物流快递柜管理系统,利用数据分析和物联网技术,市场规模达数十亿美元。它能优化快递柜使用效率,比如分配柜子、通知取件等。 智联招聘面试模拟功能:AI 招聘面试模拟平台,采用自然语言处理和机器学习技术,市场规模达数亿美元。它可以帮助求职者进行面试模拟。 酷家乐装修设计软件:AI 房地产装修设计平台,借助图像生成和机器学习技术,市场规模达数十亿美元。它能为用户提供装修设计方案,用户可根据自己的喜好进行选择和调整。 摄影 APP 参数调整功能:AI 摄影参数调整助手,运用图像识别和数据分析技术,市场规模达数亿美元。它能根据场景自动调整摄影参数,如曝光、对焦、感光度等。 音乐情感分析软件:AI 音乐情感分析平台,使用机器学习和音频处理技术,市场规模达数亿美元。它可以分析音乐的情感表达。 小米智能照明系统:AI 家居智能照明系统,利用物联网技术和机器学习,市场规模达数十亿美元。它能实现家居照明的智能化控制,根据用户的习惯和环境变化自动调整灯光亮度和颜色。 金融风险预警软件:AI 金融风险预警平台,运用数据分析和机器学习技术,市场规模达数十亿美元。它可以提前预警金融风险,比如股市下跌、汇率波动等。 马蜂窝路线优化功能:AI 旅游路线优化平台,采用数据分析和自然语言处理技术,市场规模达数亿美元。它能根据用户需求优化旅游路线,提高旅行体验。
2025-01-05
假设我建立一个针对中小企业的Ai落地赋能服务中心,结合目前中国市场比较成熟的Ai产品、技术、服务、培训等等内容,应该怎么设计这个中心
目前中国市场上成熟的 AI 产品、技术、服务和培训内容丰富多样。要设计针对中小企业的 AI 落地赋能服务中心,以下是一些建议: 产品方面: 引入适合中小企业业务流程的自动化软件,如智能客服系统、智能办公软件等。 提供基于 AI 的数据分析工具,帮助企业进行市场预测和客户洞察。 技术方面: 配备专业的技术团队,能够为企业提供 AI 技术的集成和定制化开发服务。 关注前沿的 AI 技术,如机器学习、深度学习、自然语言处理等,并将其转化为可应用的解决方案。 服务方面: 提供一站式的服务,包括需求评估、方案设计、实施部署和后续维护。 建立快速响应机制,及时解决企业在使用 AI 过程中遇到的问题。 培训方面: 设计针对不同层次员工的培训课程,涵盖基础知识普及、操作技能提升和高级应用开发等。 采用线上线下相结合的培训方式,满足企业员工的多样化学习需求。 同时,服务中心还需要建立良好的沟通渠道,与中小企业保持密切联系,了解他们的实际需求和反馈,不断优化和完善服务内容和方式。
2024-12-19
AI应用于测试领域 哪些有比较成熟的、稳定的应用
目前在测试领域,AI 有一些较为成熟和稳定的应用。例如,利用机器学习算法进行自动化测试用例生成,能够提高测试效率和覆盖度;基于深度学习的图像识别技术可用于界面测试,检测界面元素的准确性和一致性;还有自然语言处理技术在测试文档的自动分析和理解方面发挥作用,帮助快速提取关键信息。但整体而言,AI 在测试领域的应用仍在不断发展和完善中。
2024-12-13
私人助理领域,如今有没有成熟的产品
在私人助理领域,目前有一些相关产品,但成熟的产品相对较少。 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品少之又少。一方面是高度智能化的 Agent 能力需要打磨,概念落地还有较长一段距离;另一方面是 AI 和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。 Dots 是目前看到的最接近理想 AI Agent 形态的 C 端私人助理。它支持用户发送文本和图像、音频信息并理解内容,能够为用户制定计划、进行文件管理、推荐咖啡店,帮助用户访问互联网中的最新工具和服务。不过,该产品需要排队较久的 waitlist,官方也较少更新动态。其官方 twitter 为:https://twitter.com/newcomputer ,官网介绍:https://new.computer/about 。
2024-12-12
企业内部知识库和 AI 问答结合,有哪些成熟的解决方案,或者产品推荐?
以下是企业内部知识库和 AI 问答结合的一些成熟解决方案和产品推荐: Contextual Answers:这是一个端到端的 API 解决方案,其答案完全基于组织知识,能避免“幻觉”。全球信息服务提供商 Clarivate 与其合作,将其应用于图书馆解决方案套件,为学生、教师和研究人员提供基于策划和可信学术内容的问题答案。 职业规划类产品:结合用户个人情况和市场需求制定详细职业发展计划,包括短、中、长期目标,帮助用户在 AI 时代找到职业定位。其核心构思在于利用企业已有知识积累结合大模型能力,为用户提供准确简洁答案。具体通过创建企业私有知识库收录问答记录和资料,利用大模型处理用户咨询问题,确保回答准确一致,必要时提供原回答完整版,还能对接人工客服,在智能助手无法解决问题时快速转接,提升服务质量和客户满意度。
2024-09-14
类似 智能驾驶、智能客服 等,AI 在各大行业的主要应用(成熟一点的)有哪些
以下是 AI 在各大行业的一些主要成熟应用: 智能办公: 快速总结群聊内容或会议信息。 为写公文提供结构模板参考。 智能客服: 借助 agent 接入企业的 QA 知识库,回应用户信息,并依据回答下达诸如取消订单、催快递之类的 action 指令。 AI 导购: 依据用户问题,结合产品介绍和评论信息等,为用户推荐更准确、精准的产品。 医疗保健: 医学影像分析,辅助诊断疾病。 加速药物研发,识别潜在药物候选物和设计新治疗方法。 个性化医疗,分析患者数据提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 金融服务: 风控和反欺诈,识别和阻止欺诈行为。 信用评估,帮助金融机构做出贷款决策。 投资分析,分析市场数据辅助投资决策。 提供 24/7 客户服务,回答常见问题。 零售和电子商务: 产品推荐,分析客户数据推荐可能感兴趣的产品。 改善搜索结果和提供个性化购物体验。 动态定价,根据市场需求调整产品价格。 汽车行业: 自动驾驶技术,利用 AI 进行图像识别、传感器数据分析和决策制定。 车辆安全系统,如自动紧急制动、车道保持辅助和盲点检测。 个性化用户体验,根据驾驶员偏好和习惯调整车辆设置。 预测性维护,分析车辆实时数据预测潜在故障和维护需求。 生产自动化,用于自动化生产线,提高生产效率和质量控制。 销售和市场分析。
2024-09-05
扣子应用搭建示例
以下是关于扣子应用搭建的相关内容: 白嫖 Groq 平台算力的落地应用: 通过扣子工作流,用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,可参考梦飞大佬教程将扣子接入微信机器人(有微信封号风险)。 由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品填 APIKEY 调用的场景,以沉浸式翻译为例。 接入手机类 APP,比如通过快捷方式接入 Siri。 接入扣子工作流:搭建细节可移步 WaytoAGI 自学。建立工作流只需一个代码节点,需配置代码节点的输入引用、输出等。可建立 Bot 调用工作流,但建议不发布,以免代理流量被他人使用。 在扣子调用已有的 API 制作插件: Body:用于传递请求主体部分,GET 方法中通常不用于传递参数。 Path:用于定义请求路径部分,GET 方法中可传递参数,常编码为 URL 一部分。 Query:用于定义请求查询部分,是 GET 方法中常用的参数传递方式。 Header:用于定义 HTTP 请求头信息部分,GET 方法中通常不用于传递参数。配置输出参数,填对后可点击自动解析,调试与校验工具是否能正常运行。 搭建邮票收藏馆应用: 业务背景与逻辑梳理:源于客户需求,功能包括生成邮票、收藏邮票、收藏列表、查看藏品详情,规划了生成和查看两个页面。 页面设计: 第一页:导航栏有应用名称、查看收藏入口、用户头像;陈列展示生成的图片;生成和收藏部分可输入关键字生成并收藏。 第二页:收藏列表会加载用户所有收藏,数量超 100 需优化加翻页;收藏详情可查看大图、关键字、收藏时间。
2025-01-21
国内哪款AI应用在咨询解答方面比较好
以下是国内在咨询解答方面表现较好的一些 AI 应用: 1. 抖音搜索:是一个独立 App,增加了 AI 问答功能。字节旗下还有“豆包”这一国民级的 AI 应用入口。 2. 小红书: 点点:独立的 AI 搜索 App,基于小红书和少量外部数据,回答用户提出的攻略、美食、经验等问题。 问点点:小红书 App 内的 AI 问答页面,从检索框可以进入。 3. 作业帮智能辅导:为学生提供个性化学习辅导,使用机器学习、自然语言处理技术,市场规模百亿美元以上。 4. 法信智能法律咨询:解答法律问题提供法律咨询,使用自然语言处理、知识图谱技术,市场规模数亿美元。 此外,国内免费的大模型 APP 有 Kimi 智能助手(Moonshot AI 出品)、文心一言(百度出品)、通义千问(阿里云开发)。
2025-01-21
在医疗场景,现在有哪些应用
在医疗场景中,AI 有以下应用: 1. 医学影像分析:可用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:能够加速药物研发过程,比如识别潜在的药物候选物和设计新的治疗方法。 3. 个性化医疗:通过分析患者数据,为每个患者提供个性化的治疗方案。 4. 机器人辅助手术:用于控制手术机器人,提高手术的精度和安全性。 5. 疾病的诊断与预测:例如利用大模型进行疾病的早期诊断和病情发展预测。 6. 新药物发现:如麻省理工学院利用 AI 发现新型广谱抗生素 Halicin。 7. 中医应用:将人工智能与中医结合,辅助看诊,提高诊疗效率,未来有望实现 24 小时独立问诊开药。 8. 医学问答:像 DoctorGPT 这样的模型,能够准确回答各种医学问题。
2025-01-20
目前在各个应用领域,主流的AI工具有哪些,请分别介绍.
以下是一些主流的 AI 工具及其应用领域的介绍: 1. AI 菜谱口味调整工具:如“下厨房口味调整功能”,使用自然语言处理和数据分析技术,市场规模达数亿美元。它能根据用户反馈调整菜谱口味,例如增加甜度、减少辣味等。 2. AI 语言学习纠错平台:像“英语流利说纠错功能”,运用自然语言处理和机器学习,市场规模达数十亿美元。可帮助语言学习者纠正发音、语法等错误,并提供纠正建议和练习。 3. AI 电影剧情分析系统:例如“豆瓣电影剧情分析工具”,借助数据分析和自然语言处理,市场规模达数亿美元。能够分析电影剧情,为用户提供深度解读。 4. AI 办公文件分类系统:比如“腾讯文档分类功能”,采用数据分析和机器学习,市场规模达数亿美元。可自动分类办公文件,方便管理。 5. AI 美容护肤方案定制平台:“美丽修行定制方案功能”,利用图像识别和数据分析,市场规模达数亿美元。能根据用户肤质定制护肤方案,包括产品推荐和使用顺序。 6. AI 游戏道具推荐系统:在一些游戏中的“游戏内商城推荐功能”,通过数据分析和机器学习,市场规模达数亿美元。可根据玩家需求推荐游戏道具,如武器、装备等。 7. AI 天气预报分时服务:“彩云天气分时预报”,运用数据分析和机器学习,市场规模达数亿美元。提供精准的分时天气预报,帮助用户更好地安排出行和活动。 8. AI 医疗病历分析平台:“医渡云病历分析系统”,借助数据分析和自然语言处理,市场规模达数十亿美元。可分析医疗病历,为医生提供辅助诊断建议。 9. AI 会议发言总结工具:“讯飞听见会议总结功能”,使用自然语言处理和机器学习,市场规模达数亿美元。能够自动总结会议发言内容,方便回顾和整理。 10. AI 书法作品临摹辅助工具:“书法临摹软件”,利用图像识别和数据分析,市场规模达数亿美元。帮助书法爱好者进行临摹,提供临摹指导和评价。 11. 超级简历优化助手:“AI 简历优化工具”,运用自然语言处理,市场规模达数亿美元。帮助用户优化简历,提高求职成功率。 12. 酷家乐等设计软件:“AI 室内设计方案生成”,借助图像生成和机器学习,市场规模达数十亿美元。能快速生成个性化室内设计方案。 13. Amper Music:“AI 音乐创作辅助工具”,采用机器学习和音频处理,市场规模达数亿美元。协助音乐创作者进行创作,可根据用户需求生成旋律和编曲。 14. 松果倾诉智能助手:“AI 情感咨询助手”,通过自然语言处理和情感分析,市场规模达数亿美元。为用户提供情感支持和建议,通过文字或语音交流。 15. 小佩宠物智能设备:“AI 宠物健康监测设备”,利用传感器数据处理和机器学习,市场规模达数十亿美元。可实时监测宠物健康状况,提供健康预警。 16. 马蜂窝智能行程规划:“AI 旅游行程规划器”,借助数据分析和自然语言处理,市场规模达数十亿美元。能根据用户需求生成个性化旅游行程。
2025-01-20
学习编程对应用AI有帮助吗
学习编程对应用 AI 有很大帮助。以下是一些具体方面: 1. 借助 AI 学习编程时,要打通学习与反馈循环。例如从“Hello World”起点开始,验证环境、建立信心、理解基本概念,形成“理解→实践→问题解决→加深理解”的循环。 2. 学习流行的语言和框架(如 React、Next.js、TailwindCSS),先运行再优化,小步迭代,一次解决一个小功能,借助 AI 生成代码后请求注释或解释以帮助理解。遇到问题可采取复现、精确描述、回滚三步走。 3. 如果希望在应用 AI 方面继续精进,最好体系化地了解编程,至少熟悉以下内容: Python 基础:包括基本语法规则(如变量命名、缩进)、数据类型(如字符串、整数、浮点数、列表、元组、字典)、控制流(如条件语句、循环语句)。 函数:定义和调用函数,理解参数和返回值,以及作用域和命名空间。 模块和包:学会导入模块和使用包来扩展程序功能。 面向对象编程:了解类和对象、属性和方法、继承和多态。 异常处理:理解异常及如何使用 try 和 except 语句处理错误。 文件操作:掌握文件读写和文件与路径操作。 总之,AI 虽强大,但仍需人工主导,掌握每次可运行的小成果才能实现持续提升。
2025-01-19
目前最高效的ai编程应用是什么
以下是一些目前高效的 AI 编程应用: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,帮助更快、更少地编写代码。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供多种编程辅助能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研基础大模型微调。 7. Codeium:一个由 AI 驱动的编程助手工具,通过提供代码建议等帮助提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。 生成性 AI 作为程序员的助手是最早的应用之一,其在大量代码库上训练,在程序员编码时给出建议,效果出色。但在编程中正确性至关重要,如研究发现 40%的 AI 生成代码包含漏洞,用户需在生成足够代码提升生产力和检查正确性之间找到平衡。Copilot 帮助提高了开发人员的生产力,估计增长在 2 倍或更少的范围内。 在写作方面,最佳免费选项有 Bing 和 Claude 2,付费选项有带有插件的 ChatGPT 4.0/ChatGPT 。目前 GPT4 仍是功能最强的人工智能写作工具,可在 Bing(选择“创新模式”)免费访问或购买 ChatGPT 订阅访问。Claude 紧随其后,也有有限免费选项。这些工具也被集成到常见办公应用程序中,如 Microsoft Office 将包括由 GPT 提供支持的副驾驶,Google Docs 将整合 Bard 的建议。
2025-01-19
近期AI界有什么重大事件吗
以下是 2024 年 AI 界的一些重大事件: 1. 1 月:斯坦福大学 Mobile Aloha、LumaAl Genie 文生 3D、GPT store 上线、MagnificAl 高清放大爆火、苹果 Vision Pro 宣布发售等。 2. 10 月:9 月 27 日 Reecho 睿声●三只羊录音事件涉及 AI 公司出面回应;9 月 28 日 TeleAI●正式开源 TeleChat2115B;10 月 1 日快手●可灵 AI 全面开放 API、OpenAI DevDay;10 月 2 日 Black Forest Labs●发布 FLUX1.1、苹果●推出多模态大模型 MM1.5;10 月 3 日 OpenAI●发布 ChatGPT Canvas;10 月 8 日 2024 年诺贝尔物理学奖;10 月 9 日 2024 年诺贝尔化学奖;10 月 10 日字节●发布首款 AI 智能体耳机 Ola Friend、Vivo●增加蓝心端侧大模型 3B、谷歌●图像生成模型 Imagen 3 开放使用、智源●BGE 登顶 Hugging Face 月榜、State of AI 2024 报告发布;10 月 11 日智谱●GLM4Flash 与「沉浸式翻译」合作、北大&北邮&快手●👑开源高清视频生成模型 Pyramid Flow;10 月 12 日 OpenAI●👑开源多智能体协作框架 Swarm、深势科技●完成数亿元人民币新一轮融资、苹果●质疑当前 LLM 缺乏真正的逻辑推理能力;10 月 14 日。 3. 关于 AI 在未来一年的 10 个预测:一个主权国家向美国大型人工智能实验室投资 100 亿美元以上,需要国家安全审查;没有任何编码能力的人独自创建的应用程序或网站将会迅速走红(例如 App Store Top100);案件开始审理后,前沿实验室对数据收集实践实施有意义的改变;由于立法者担心权力过度,欧盟人工智能法案的早期实施最终比预期更为缓慢;OpenAl o1 的开源替代品在一系列推理基准测试中超越了它;挑战者未能对 NVIDIA 的市场地位造成任何重大打击;由于公司难以实现产品与市场的契合,对人形机器人的投资水平将会下降;苹果设备上研究的强劲成果加速了个人设备上 AI 的发展势头;人工智能科学家撰写的研究论文被大型机器学习会议或研讨会接受;一款以与 GenAI 元素交互为基础的视频游戏将取得突破性进展。
2025-01-17
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25
AI领域近期新闻
以下是 AI 领域近期的一些新闻: 2024 年,在全球芯片出口管制下,中国仍是重要市场。美国商务部长吉娜·雷蒙多警告英伟达,中国在美芯片制造商中所占份额减少,但当地分支机构目前未受控制。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,阿里巴巴和腾讯与 NVIDIA 就在美国建立数据中心进行谈判,谷歌和微软向中国大型企业推销云服务。 模型提供成本下降,如 OpenAI 提供强大模型的推断成本下降 100 倍,Google Gemini 相关产品价格下降且性能强劲。由于计算成本高,模型构建者越来越依赖与大型科技公司合作,反垄断监管机构对此表示担忧。 10 月的 AI 行业大事记包括:9 月 27 日 Reecho 睿声三只羊录音事件涉及的 AI 公司出面回应;9 月 28 日 TeleAI 正式开源 TeleChat2115B;10 月 1 日快手可灵 AI 全面开放 API;10 月 2 日 Black Forest Labs 发布 FLUX1.1,苹果推出多模态大模型 MM1.5;10 月 3 日 OpenAI 发布 ChatGPT Canvas;10 月 8 日 2024 年诺贝尔物理学奖;10 月 9 日 2024 年诺贝尔化学奖;10 月 10 日字节发布首款 AI 智能体耳机 Ola Friend,Vivo 增加蓝心端侧大模型 3B,谷歌图像生成模型 Imagen 3 开放使用,智源 BGE 登顶 Hugging Face 月榜,State of AI 2024 报告发布;10 月 11 日智谱 GLM4Flash 与“沉浸式翻译”合作,北大、北邮和快手开源高清视频生成模型 Pyramid Flow;10 月 12 日 OpenAI 开源多智能体协作框架 Swarm,深势科技完成数亿元人民币新一轮融资,苹果质疑当前 LLM 缺乏真正的逻辑推理能力;10 月 14 日。
2024-12-13
近期典型的企业大模型应用案例有什么
以下是近期典型的企业大模型应用案例: 彭博发布了金融领域的大模型 BloombergGPT,应用于其所在的垂直领域。 医联发布了内首款医疗大语言模型 MedGPT,可在真实医疗场景中发挥实际诊疗价值。 在解决大模型落地难的问题方面: 提高内容可信:如周伯文认为应做具备通用能力的大模型,并通过商业交付、反馈和评测来解决;中国科学院院士张钹指出 ChatGPT 没有自我学习能力,需用更多数据优化以解决实际应用问题;旷视科技物流业务事业部的负责人徐庆才提到大模型走向垂直化以提高内容精准度。 解决算力成本高、训练重复和资源紧缺的问题:一家 AI 算力公司联合创始人张新提到以 GPT3 模型为例,训练成本高昂,且全行业训练卡涨价,目前仍无法用商业化的国产芯片进行大模型训练。 此外,2024 年 7 月 12 日的《》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用,案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场,AI 智能体和知识库成为提升大模型落地实效的关键手段。 相关报告还有: 《》 《》 《》
2024-12-02
近期有什么新的AI软件?
以下是近期一些新的 AI 软件: You.com:是一款具有多种搜索模式且注重隐私的搜索引擎。 Genspark:通过 Sparkpages 来满足用户个性化的搜索需求。 Rockset:刚被 OpenAI 收购,提供实时搜索和分析数据库服务。 Butterflies AI:人类与 AI 共存的社交软件。 MeetRecord:可以对销售通话进行记录和辅导的 AI 助手。 此外,还有以下一些 AI 应用: 超级简历优化助手:AI 简历优化工具,使用自然语言处理技术,帮助用户优化简历提高求职成功率。 酷家乐等设计软件:AI 室内设计方案生成,结合图像生成、机器学习技术,快速生成个性化室内设计方案。 Amper Music:AI 音乐创作辅助工具,运用机器学习、音频处理技术,协助音乐创作者进行创作。 松果倾诉智能助手:AI 情感咨询助手,基于自然语言处理、情感分析技术,为用户提供情感支持和建议。 小佩宠物智能设备:AI 宠物健康监测设备,借助传感器数据处理、机器学习技术,实时监测宠物健康状况。 马蜂窝智能行程规划:AI 旅游行程规划器,利用数据分析、自然语言处理技术,根据用户需求生成个性化旅游行程。 作业帮智能辅导:AI 在线教育个性化辅导,通过机器学习、自然语言处理技术,为学生提供个性化学习辅导。 另外还有: AI 游戏道具推荐系统:利用数据分析、机器学习技术,根据玩家需求推荐游戏道具。 AI 天气预报分时服务:基于数据分析、机器学习技术,如彩云天气分时预报,提供精准的分时天气预报。 AI 医疗病历分析平台:运用数据分析、自然语言处理技术,如医渡云病历分析系统,分析医疗病历,辅助诊断。 AI 会议发言总结工具:借助自然语言处理、机器学习技术,如讯飞听见会议总结功能,自动总结会议发言内容。 AI 书法作品临摹辅助工具:通过图像识别、数据分析技术,如书法临摹软件,帮助书法爱好者进行临摹。
2024-11-10
Way to AGI 近期更新
以下是关于 Way to AGI 的近期更新信息: Runway 官方镜头提示词相关: 官方镜头指南:https://help.runwayml.com/hc/enus/ 相关文章:articles/30586818553107Gen3AlphaPromptingGuide 生图官网:https://app.runwayml.com/videotools/teams/aimwisetonix/aitools/generativevideo 小互动:最下面一起生文字“WaytoAGI”回头剪辑到一起 此次更新适合参加本期 video battle 官方效果: Gen3 Alpha 上线,具有无限潜力,可将艺术视野带入生活。创建传达场景的强烈提示是生成与概念一致视频的关键,涵盖不同示例结构、关键字和提示帮助使用 Gen3 Alpha,鼓励实践时大胆实验。 知识库介绍: 原文《WaytoAGI:找到了 AI 知识付费的免费源头,让更多人因 AI 而强大!》 WayToAGI 是由热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,大家贡献并整合各种 AI 资源,方便大家学习 AI 知识、应用工具和实战案例等。 提供一系列开箱即用的工具,如文生图、文生视频、文生语音等详尽教程,将文字化为视觉与听觉现实。 追踪 AI 领域最新进展,时刻更新,每次访问都有新收获。 无论初学者还是行业专家,都能发掘有价值内容。 链接:https://waytoagi.com/(通往 AGI 之路) 即刻体验:https://waytoagi.com/
2024-11-04