直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

虚拟数字人技术沿革

回答

虚拟数字人技术的沿革如下:

  • 虚拟主播在电商直播间面临挑战,如真实商品展示、试用和评测等方面,虚拟人较难让消费者共情,且与商品互动困难。但随着技术发展,未来虚拟主播肉身化可能使其在直播间站稳脚跟。
  • 虚拟数字人的发展经历三个阶段:拟人化,由计算机虚拟合成高度逼真的三维动画人物,初步基于 AI 实现驱动和实时信息沟通反馈;同人化,从外观模拟进阶到情感可交互;超人化,虚拟人的能力超越自然人,“虚拟”实体化。
  • 虚拟直播间的场景搭建成本因多种因素而异,绿幕虚拟直播场景方案成本较低。未来 MR 设备的普及将带动技术迭代,提供更沉浸式的互动购物体验。
  • 虚拟数字人从驱动层面可分为中之人驱动和 AI 驱动。中之人驱动通过动作和面部捕捉实现交互,有上限且缺乏高并发和量产能力;AI 驱动使用 AI 技术赋予虚拟人感知和表达等交互能力。从应用层面可分为服务型、表演型和身份型,服务型如虚拟主播、助手、教师、客服和医生等,表演型如虚拟偶像,身份型是物理世界真人的数字分身。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

虚拟主播,能在电商直播间站稳脚跟吗?

直播间的特点在于真实性,其中包括真实的商品展示、试用以及真实的评测,然而这也是虚拟主播面临的致命挑战。比如虚拟网红翎Ling的美妆带货翻车案例,没有皮肤问题困扰的虚拟人很难让消费者共情。尽管SLAM等3D交互技术可以完善数字人与真实空间的交互,但要想实现与商品的互动,则较为困难,更何况用户还希望能够尽可能多的了解到商品的细节。在《2022虚拟数字人综合评估指数报告》中指出虚拟数字人发展的三个阶段:拟人化:由计算机虚拟合成的高度逼真的三维动画人物,动作形态声音等与真人吻合,初步基于AI实现虚拟人驱动,实时进行信息沟通和反馈。同人化:从外观的形态模拟进阶到情感的可交互,情感算法技术实现与人类高质量情感互动。超人化:虚拟人的能力超越自然人,“虚拟”实体化,机器人承载虚拟人意识回到现实世界。或许再过十余载,虚拟主播肉身化,具备了真实的身体,他就真的能在直播间站稳脚跟了。[heading3]场景变幻,无限可能[content]相比于“人”与“货”,直播场景虽然没有那么重要,但优质的直播视觉效果也是促进观众停留的因素。绿幕的虚拟直播场景方案是一个比较低成本的直播样式。选择绿幕作为背景,通过抠图技术打造虚拟背景,可以低成本的快速打造一个直播间。手机上就有相关绿幕视频抠图App,288元就能购买永久会员,解锁所有功能。虚拟直播间的场景搭建成本也因多种因素而异,包括场景规模、复杂度、细节程度、互动特效等,更大、更复杂、更详细的直播间就需要更多的投入了。MR设备在未来的普及,也会带动新的一轮技术迭代,届时用户可以身临其境,还能与场景、主播、观众联动,更加沉浸式的互动购物体验。

1.7 AI 数字人+语音合成

[title]1.7 AI数字人+语音合成[heading2]延伸阅读|标题与链接|发布者|摘要|发表日期|类别|<br>|-|-|-|-|-|<br>|[2022虚拟数字人综合评估指数报告](https://www.aliyundrive.com/s/rjYUP2pgcEa)|清华大学新闻与传播学院|虚拟数字人的三个阶段<br> <br>拟人化:由计算机虚拟合成的高度逼真的三维动画人物,动作形态声音等与真人吻合,初步基于AI实现虚拟人驱动,实时进行信息沟通和反馈<br> <br>同人化:从外观的形态模拟进阶到情感的可交互,情感算法技术实现与人类高质量情感互动<br> <br>超人化:虚拟人的能力超越自然人,“虚拟”实体化,机器人承载虚拟人意识回到现实世界。<br> <br>从虚拟数字人的“三身”框架,提炼出虚拟人分析指标<br> <br>肉身:人类的躯体属性,是自然主义身体观范畴,如外形、语音、驱动等<br> <br>社身:人类的社会属性,是社会建构论身体观范畴,如社会价值、营销、传播、美誉等<br> <br>具身:人类的功能属性,如互动娱乐、专业服务、情感陪伴等<br> |2023/02/21|报告|<br>|[虚拟数字人的人格权](https://mp.weixin.qq.com/s/9SioHbxiM4jocRcGkN9iuw)|汉坤||2022/06/22|文章|<br>|[浙江省元宇宙产业发展行动计划(2023—2025年)](https://fzggw.zj.gov.cn/art/2022/12/15/art_1229123366_2451471.html)|浙江省发展和改革委员会||2022/12/25|政策|

虚拟数字人,好看的皮囊有什么价值?

虚拟数字人是通过各种技术创造出来的,具有多种人类特征,比如外观、行为和思想,被呈现为虚拟形象。从驱动层面来说,虚拟数字人可以分为两类:中之人驱动和AI驱动。其中,中之人驱动运用动作捕捉和面部捕捉技术实现虚拟人与现实的交互;而AI驱动则使用AI技术创建、驱动和生成虚拟人的内容,从而赋予其感知和表达等交互能力。中之人驱动的数字人有其上限,缺乏高并发和量产化的能力,可以看做是真人“披着虚拟外皮”的产物。ChatGPT的出现催动了新一轮AI技术的浪潮,不少虚拟数字人厂商都在争相宣称自己的产品将会接入ChatGPT,赋予数字人智慧的大脑。只有通过AI技术让虚拟人“虚拟”得彻底,才能够释放出更高的价值。从应用层面来看,虚拟数字人可分为服务型、表演型和身份型三大类。服务型虚拟数字人,如虚拟主播、虚拟助手、虚拟教师、虚拟客服和虚拟医生等,主要为物理世界提供各种服务。典型代表有冯小殊、崔筱盼、观君等。表演型虚拟数字人,如虚拟偶像等,主要用于娱乐、影视等场景,例如虚拟偶像演唱会。典型代表有洛天依、AYAYI、柳夜熙等。身份型虚拟数字人是物理世界的“真人”进入虚拟世界的数字分身,在元宇宙中,数字分身有广泛的应用场景。本文讨论的虚拟数字人是AI驱动的,主要集中于服务型虚拟数字人。强调服务型虚拟数字人具有功能属性,隶属于业务层。文章仅探讨AI创造出的虚拟“皮囊”可以带来什么价值。

其他人在问
照片人物与虚拟人合成
以下是关于照片人物与虚拟人合成的相关内容: 使用 Midjourney(MJ)生成人物图片: 确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。可使用垫图 URL 及相关提示词,如“In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,其中“iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为了确保人物一致性,取 iw 2”。 合成人物和场景: 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),在 MJ 中重新生图,提示词如“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 在 StableDiffusion(SD)中绘制一致性多角度头像: 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图都是 512×512px。加上网格图,通过 lineart 来分割不同的块面。设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区,为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-10-28
绿幕虚拟拍摄与AI技术结合
绿幕虚拟拍摄与 AI 技术的结合在多个领域都有应用: 在电影制作方面,如首部 AI 长电影中,对于武打等动作幅度较大的场景,常采用真人绿幕实拍结合 Kaiber 等 AI 视频生成工具的工作流。影片制作会运用多种传统影视制作方法与 AIGC 工具相结合的方式,几乎使用了当时市面上所有的 AI 视频制作工具。 在电商直播领域,绿幕的虚拟直播场景方案是一种低成本的选择。通过抠图技术打造虚拟背景,手机上也有相关绿幕视频抠图 App。虚拟直播间的场景搭建成本受多种因素影响,未来 MR 设备的普及可能带动新的技术迭代,提供更沉浸式的互动购物体验。 在动画制作中,有通过绿幕动作捕捉,在虚幻中制作虚拟场景,然后通过 Stable Diffusion 生成的动漫。其制作步骤包括训练模型复制特定风格、训练 LoRA 模型认识角色、处理绿屏动捕视频、减少闪烁、添加 3D 元素、进行最终 VFX 合成编辑等,并添加大量老式视觉特效和设计声音。
2024-10-08
我想要找到一个能够自动生成虚拟头像的AI
以下是为您找到的能够自动生成虚拟头像的 AI 相关信息: 生成式 AI 不仅将推动更多游戏的创造,而且将推动一种新型游戏的发展,这种游戏将更具动态性,并能根据每个玩家的偏好进行个性化定制。比如在某些游戏中,仅需几句话就能设计一个精致的自定义头像,最终可能扩展到整个虚拟世界的创建。 在 AI 绘画中,让角色保持一致最好的方法是使用 LoRA。但要训练一个 LoRA,首先要有至少 15 到 20 张图片的训练集。对于虚构角色,要让其能稳定输出多张不同角度的图片才能达到训练集的要求。 有的游戏开发商正在使用人工智能让玩家在游戏中创建自己的头像,根据玩家的描述来自动生成头像图片。从用户端的体验来看,让玩家通过人工智能生成内容,能让玩家感知到更大的所有权。
2024-09-12
近期更新的虚拟陪伴产品
以下是近期更新的一些虚拟陪伴产品: 1. Character.ai:这是一个 AI 虚拟陪伴平台,用户可与数百个 AI 驱动的角色交流,包括名人、动漫角色等,还能创建自己的角色并赋予其描述、图像、个性等特性。 2. Replika:一款 AI 虚拟陪伴应用,用户能设计理想伴侣,其会存储记忆并在未来对话中参考,甚至可发送照片。 3. Talkie:主打情感路线的 AI 虚拟陪伴应用,设计有大量 npc,游戏和休闲娱乐体验感更强,每个 npc 带有自己的剧情体系,交流中会触发抽取卡牌机会。 享受型虚拟陪伴方面:享受是人不用付出就能得到想要的。过去 20 年,互联网产品在让用户享受上有成熟方法论,如交互简便、流程便利、连接畅通、内容无限。但用这些标准衡量 AI 产品,尤其是虚拟陪伴产品时,能经受审视的不多。当前虚拟陪伴产品本质上是角色扮演对话工具,用户核心体验是和 AI 扮演的虚拟角色通过文字消息、图片消息、语音消息、语音通话、视频通话等方式聊天。 此外,主流虚拟陪伴产品以一问一答的多轮对话作为基础交互方式,通过更产品化的信息收集方式降低高质量 Prompt 获得的门槛。但仍有人表示不会使用此类产品。推荐大家收听如等播客。 以上内容由 AI 大模型生成,请仔细甄别。
2024-09-10
如何运用虚拟人提高销售业绩
运用虚拟人提高销售业绩可以通过以下几个策略实现: 1. 个性化推荐:利用虚拟人进行个性化的产品推荐,根据客户的历史购买记录和偏好,提供定制化的产品建议。 2. 24/7客户服务:虚拟人可以提供全天候的客服支持,解答客户的咨询,提供产品信息,从而提高客户满意度和销售转化率。 3. 社交媒体互动:通过虚拟人在社交媒体上与消费者互动,增强品牌形象,提升用户参与度和品牌忠诚度。 4. 直播带货:虚拟人可以作为直播销售的主播,展示产品特点,回答观众问题,增加直播的吸引力,提高销售量。 5. 品牌代言:虚拟人作为品牌代言人,通过其独特的形象和故事背景,吸引目标消费群体,提高品牌知名度和产品销量。 6. 虚拟试穿/试用:在时尚、美妆等行业,虚拟人可以提供虚拟试穿或试用服务,让消费者在线上体验产品效果,促进购买决策。 7. 教育和培训:虚拟人可以用于产品教育和培训,帮助消费者更好地了解产品特性和使用方法,增加产品吸引力。 8. 跨平台营销:虚拟人可以跨越不同的平台进行营销活动,包括线上商城、社交媒体、直播平台等,扩大品牌影响力。 9. 数据收集与分析:虚拟人在与消费者互动的过程中,可以收集用户反馈和行为数据,帮助企业分析消费者需求,优化产品和服务。 10. 创新体验:利用AR技术结合虚拟人,为消费者提供创新的购物体验,如AR试妆、虚拟店铺等,吸引消费者参与并提高购买意愿。 通过这些策略,虚拟人可以有效地提升消费者的购物体验,增强品牌与消费者之间的互动,从而提高销售业绩。
2024-05-23
虚拟试衣的ai
虚拟试衣的 AI 技术是一种利用计算机视觉、机器学习和图形学等技术,让用户在虚拟环境中试穿服装的技术。这种技术可以通过对用户的身体进行扫描或拍摄,然后将其与虚拟服装进行匹配和渲染,让用户在屏幕上看到自己穿上不同服装的效果。以下是一些关于虚拟试衣的 AI 技术的介绍: 1. 基于图像的虚拟试衣技术:这种技术通过对用户的照片或视频进行分析和处理,然后将其与虚拟服装进行匹配和渲染。这种技术的优点是不需要用户进行身体扫描,但是缺点是不够精确和真实。 2. 基于模型的虚拟试衣技术:这种技术通过对用户的身体进行扫描或拍摄,然后建立一个数字化的身体模型,然后将其与虚拟服装进行匹配和渲染。这种技术的优点是非常精确和真实,但是缺点是需要用户进行身体扫描,而且处理时间较长。 3. 基于深度学习的虚拟试衣技术:这种技术通过使用深度学习算法对用户的身体进行分析和处理,然后将其与虚拟服装进行匹配和渲染。这种技术的优点是不需要用户进行身体扫描,而且处理时间较短,但是缺点是不够精确和真实。 总的来说,虚拟试衣的 AI 技术是一种非常有前途的技术,它可以让用户在虚拟环境中试穿服装,提高购物体验和效率。随着技术的不断发展和成熟,虚拟试衣的 AI 技术将会越来越精确和真实,为用户带来更好的购物体验。
2024-05-07
数字人软件
以下是一些制作数字人的工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入要说的内容,平台的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。使用时请遵守相关条款和政策,并注意版权和伦理责任。 此外,关于数字人的一些实战操作: 剪映数字人“个性化”:可用 AI 换脸软件完成,如: 1. 第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 2. 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 3. 第三步:等待专属数字人视频出炉。 用剪映制作数字人视频: 1. 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”添加到视频中,软件会生成对应音视频并添加到轨道中,左下角提示渲染完成,可点击预览查看效果。 2. 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道,可通过拖拽轨道右侧竖线使其与视频对齐,选中轨道可调整图片大小和数字人位置。
2024-11-12
数字营销是什么
数字营销是指借助数字技术和渠道来推广产品、服务或品牌的营销方式。以下为您介绍一些相关的数字营销工具和案例: Adsby:这是一个针对初创企业和小型企业的谷歌搜索广告转换工具。它利用人工智能创建、分析和扩展广告,为广告新手提供简化工具,也为专业人士提供强大功能,如通过智能 AI 驱动策略最大化广告支出回报(ROAS),提供每日优化、AI 生成的关键词建议、秒级的广告内容创作等服务,还有 14 天免费试用,以简单直观的平台指导用户设置广告活动。 【甲子光年】Web 3.0 之数字人营销白皮书(2022)33 页:提供了关于数字营销的相关研究和分析。 【国信证券】领先布局数字人营销,AIGC 赋予成长机遇:从证券角度探讨了数字人营销的布局和发展机遇。
2024-11-11
AI数字人工具,哪个好用?
以下是一些好用的 AI 数字人工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的会开口说话的视频。 此外,还有以下相关工具: 1. MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。 2. Rodin Gen1:拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。 在算法方面,开源代码仓库有: 1. ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 2. AI Agent:大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可使用 LangChain 的模块自定义(https://www.langchain.com/)。 3. TTS:微软的 edgetts(https://github.com/rany2/edgetts),只能使用预设人物声音,目前接口免费;VITS(https://github.com/jaywalnut310/vits)及其分支版本;sovitssvc(https://github.com/svcdevelopteam/sovitssvc),专注于唱歌。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42
2024-11-11
能够读取文本数字最多的大模型是哪一个
目前能够读取文本数字较多的大模型有以下几种: Claude2 模型的上下文上限是 100,000 个 token。 ChatGPT16k 模型的上下文上限是 16,000 个 token。 ChatGPT432k 模型的上下文上限是 32,000 个 token。 需要注意的是,token 限制会同时对一次性输入和一次对话的总体上下文长度生效。例如,一次性输入的文本长度以及一次对话中累计的上下文长度都受到相应的限制。当达到上限时,并非停止对话,而是会遗忘最前面的对话内容。
2024-11-08
有哪些开源或者免费的数字人工具
以下是一些开源或者免费的数字人工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的说话视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 此外,还有一些相关的开源代码仓库: ASR 语音识别: openai 的 whisper: https://github.com/openai/whisper wenet: https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition AI Agent: 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分:可使用 LangChain 的模块自定义,https://www.langchain.com/ TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用预设人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc: https://github.com/svcdevelopteam/sovitssvc,专注于唱歌。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-11-07
有哪些开源免费的数字人工具
以下是一些开源免费的数字人工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人将自动转换成语音并合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会变化。使用时请遵守相关使用条款和隐私政策,并注意生成内容的版权和伦理责任。 此外,以下是一些与数字人相关的开源代码仓库: ASR 语音识别: openai 的 whisper: https://github.com/openai/whisper wenet: https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition AI Agent: 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块自定义,包含了 Agent 实现的几个组件:https://www.langchain.com/ TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc: https://github.com/svcdevelopteam/sovitssvc,专注于唱歌。 人物建模模型可通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型)实现。 以下是部分摊位信息中与数字人相关的内容: |编号|摊位活动主题和内容|摊位区域|摊位编号| ||||| |54|AI 数字人的技术以及应用场景|D|D4| |59|百度数字人试拍|D|D3|
2024-11-07
Ai技术现在的发展状况
AI 技术的发展状况如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型:如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包含量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 需要注意的是,无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2024-11-09
AI技术发展状态
AI 技术的发展状态如下: 发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 当前前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 对于新手学习 AI,建议: 持续学习和跟进:AI 是快速发展的领域,新成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 使用 AI 做事时需要注意: AI 是一种工具,并不总是正确的工具。要考虑其弱点,仔细思考是否适合计划应用的目的。 要了解许多道德问题。AI 可能被用于侵犯版权、作弊、窃取他人工作或操纵。特定 AI 模型的构建方式以及谁从其使用中受益,通常是复杂且不特别清楚的问题。最终,使用者有责任以道德的方式使用这些工具。
2024-11-09
非技术背景的产品经理如何快速掌握AI相关知识
对于非技术背景的产品经理,要快速掌握 AI 相关知识,可以从以下几个方面入手: 1. 理解产品核心技术:了解基本的机器学习算法原理,有助于更好地理解 AI 产品的核心技术,从而做出更合理的产品决策。 2. 与技术团队有效沟通:掌握一定的算法知识,能够与开发团队进行更有效的沟通,减少信息不对称带来的误解。 3. 评估技术可行性:在产品规划阶段,评估某些功能的技术可行性。了解算法知识可以帮助做出更准确的判断。 4. 把握产品发展方向:AI 技术发展迅速,了解算法前沿可以更好地把握产品的未来发展方向。 5. 提升产品竞争力:了解算法可以帮助发现产品的独特优势,提出创新的产品特性,从而提升产品的竞争力。 6. 增强数据分析能力:很多 AI 算法都涉及到数据处理和分析,掌握相关知识可以提升数据分析能力。 在实际应用中,比如在商业化问答场景中,非技术从业者需要了解一些落地的配置,如问答机器人的配置包括 AI 模型、提示词、知识库等。 此外,在成为 AI 摊主方面,不同的人群有不同的优势。技术背景丰富的人具备扎实的技术基础,产品开发与管理经验丰富的人能推动产品落地与优化,AI 爱好者与学习者渴望提升技能,内容创作与营销能力强的人能将 AI 技术与商业化需求结合。
2024-11-06
非技术背景的产品经理如何快速上手AI
对于非技术背景的产品经理快速上手 AI ,可以参考以下建议: 1. 从基础小任务开始: 让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,学会必备的调试技能。 若使用 o1mini ,可在提示词最后添加“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(Windows 机器则是 create.cmd),它会为您生成代码并给出提示,方便一次性生成多个目录和文件。 2. 明确项目需求: 通过和 AI 的对话,逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,包含影响技术方案选择的细节,后续开发时每次新起聊天就把文档发给 AI 并告知在做第几点功能。 此外,在将 AI 大模型能力接入微信等应用场景时,非技术从业者需要注意解决模型存在幻觉、胡乱回答的问题。在配置问答机器人时,要关注左侧的 AI 模型、提示词、知识库这三处配置。 对于 AI 产品经理,个人划分仅供娱乐和参考: 1. 入门级:能通过 WaytoAGI 等开源网站或一些课程了解 AI 概念,使用 AI 产品并尝试动手实践应用搭建。 2. 研究级:有技术研究和商业化研究两个路径,能根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用级:有成功落地应用的案例并产生商业化价值。 总之,AI 产品经理要懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。产品经理要关注的还是场景、痛点、价值。
2024-11-06
从哪个部分开始学习ai技术
对于新手学习 AI 技术,建议您从以下几个方面入手: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您可以找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 如果您想了解 AI 的技术历史和发展方向,以及目前最前沿的技术点,以下是一些学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2024-11-04
你是一名课程开发专家,现在要以“AI技术在课程设计中在应用“现金箱管理”,课程对象是银行柜员,时长2小时。
对于“AI 技术在课程设计中应用于‘现金箱管理’,课程对象是银行柜员,时长 2 小时”的需求,目前暂时没有相关的具体内容。但可以考虑以下课程设计思路: 首先,在课程开始的前 30 分钟,介绍 AI 技术的基本概念和在金融领域的应用概况,引出其在现金箱管理中的潜在作用。 接下来的 40 分钟,详细讲解 AI 技术如何优化现金箱管理的流程,例如通过智能监控系统实现对现金箱的实时监控和风险预警。 然后用 30 分钟进行案例分析,展示实际应用中 AI 技术成功提升现金箱管理效率和安全性的案例。 最后 20 分钟,组织学员进行小组讨论和交流,让他们分享自己对 AI 技术应用于现金箱管理的理解和想法,并进行总结和答疑。
2024-11-02