直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

近期数字人比较成熟的应用有哪些

回答

数字人目前有以下较为成熟的应用:

  1. 影视行业:真人驱动的数字人通过动捕设备或视觉算法还原真人动作表情,用于影视制作。
  2. 直播带货:真人驱动的数字人在直播带货领域发挥作用。
  3. 家庭:未来可能会有数字人管家,全面接管智能家居或其他设备。
  4. 学校:未来可能会有数字人老师,为学生答疑解惑。
  5. 商场:未来可能会有数字人导购,为顾客提供指路、托管个人物品等服务。

数字人的构建方式包括:

  1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表如 Live2D Cubism。
  2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表如 UE、Unity、虚幻引擎 MetaHuman 等。
  3. AIGC:虽然省去建模流程,但在数字人 ID 一致性和帧连贯性上存在弊端,不过算法发展迅速,未来可能会有改善。AIGC 还有直接生成 2D/3D 引擎模型的探索方向。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AI 数字人-定义数字世界中的你

这类数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

数字人在未来肯定会有很多的应用场景,比如家庭中有数字人管家,全面接管智能家居或其他设备;学校中有数字人老师,孜孜不倦的为学生答疑解惑;商场里有数字人导购,为顾客提供指路、托管个人物品等悉心服务...数字人在未来肯定还有很多的技术突破,比如可以将五感数据作为输入(例如声音、图像、气味、震动等等),将所有可以控制躯壳的参数也作为输入(例如躯壳骨骼节点,面部混合形状参数等);次世代的算法可以自我迭代升级,也可以拿到感官输入以及躯壳控制方法后,自行演化躯壳控制方式...笔者希望通过Dify搭建数字人的开源项目,给大家展现低门槛高度定制数字人的基本思路,但数字人的核心还是在于我们的Agent,也就是数字人的灵魂,怎样在Dify上面去编排专属自己的数字人灵魂是值得大家自己亲自体验的。真诚的希望看到,随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,用户在需要使用AI的能力时,AI既可以给你提供高质量的信息,也能关注到你的情绪,给你一个大大的微笑,也许到了那时,数字世界也开始有了温度。

其他人在问
公司数字化转型对于客户服务增值有什么好处?如何平衡技术和个性化,人性化服务
公司数字化转型对客户服务增值的好处包括: 1. 个性化服务:利用 AI 分析客户行为数据,深入了解客户需求和偏好,为其提供定制化的产品推荐和服务,如电子商务网站根据用户购物历史和浏览习惯推荐相似产品,在线零售商利用客户购买数据推荐新产品或补充产品,从而提升客户体验和忠诚度。 2. 定制化沟通和推广:通过更具针对性的沟通和营销活动加强与客户的关系,提高忠诚度。根据客户偏好和行为数据定制营销活动,在客户支持和沟通中采用个性化方法,定期收集客户反馈并用于优化服务和产品,监控效果并不断优化推荐和营销策略。 3. 提升操作效率:Token 化在自然语言处理中应用,将大段文本分解成小块处理单元,便于管理和分析复杂文本数据,使 AI 模型快速识别关键信息,加速决策过程,提升业务响应速度。 4. 优化客户服务:Token 化使客户服务自动化成为可能,通过自动响应系统快速准确处理客户请求,极大提升客户满意度和品牌忠诚度。 5. 个性化营销:利用 Token 化分析用户行为和偏好,提供高度个性化的营销内容,增加销售转化率。 在平衡技术和个性化、人性化服务方面,可以采取以下措施: 1. 深入挖掘客户数据,同时注重保护客户隐私和数据安全。 2. 结合人工干预和监督,确保服务的人性化和温度。 3. 持续收集客户反馈,根据反馈调整技术应用和服务策略。 4. 培训员工,使其在运用技术的同时能够提供贴心的服务。
2024-10-16
我想找一个免费生成数字人的软件
以下为您介绍几款免费生成数字人的软件及使用方法: 剪映:在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,可点击预览查看效果。还可为视频增加背景图片,删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”本地图片,将图片添加到视频轨道上,调整图片位置和大小。 HEYGEN:优点是人物灵活、五官自然、视频生成快;缺点是中文人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片,上传后效果在My Avatar处显示,点开大图后点击Create with AI Studio进入制作,写上视频文案并选择配音音色或自行上传音频,最后点击Submit得到数字人视频。 DID:优点是制作简单、人物灵活;缺点是免费版下载后有水印。使用方法为点击网址,点击右上角Create vedio,选择人物形象,可点击ADD添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击Generate vedio生成视频,打开生成的视频可下载或分享。 KreadoAI:优点是免费、功能齐全;缺点是音色较AI。使用方法为点击网址注册后获得120免费k币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。 此外,还有通过AI换脸软件完成数字人“私有化”的方法:需要谷歌账号(可在淘宝或“”购买)。第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusioncolab 并点击open colab进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,点击红框对应的URL打开操作界面;第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成;第三步等待专属数字人视频出炉。有关数字人使用问题可在评论区留言交流,对数字人课程感兴趣可查看通往AGI之路X AI沃茨的《克隆你自己》课程。在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 。
2024-10-16
数字贸易属于数字经济的范畴吗
数字贸易属于数字经济的范畴。 在相关的资料中提到,数据是数字经济的核心组成部分,且大多数数据未被充分利用或其价值集中在少数大型公司手中。同时,国家实施大数据战略,推进数据基础设施建设,鼓励和支持数据在各行业、各领域的创新应用,省级以上人民政府也应将数字经济发展纳入规划。此外,国家还在推进数据开发利用技术和数据安全标准体系建设,促进数据安全检测评估、认证等服务的发展,建立健全数据交易管理制度,支持开展相关教育和培训等,这些都表明数字贸易与数字经济密切相关,属于其范畴。
2024-10-15
好用的数字人国内的产品
以下是一些国内好用的数字人产品: 1. 硅基科技:南京硅基科技公司的销售公司介绍,相关资料为掌福科技介绍(介绍版本).pptx。 2. 特看科技:超级写实换脸及数字人,可参考。 3. 迈吉客:虚拟数字人,相关方案为迈吉客科技智能虚拟直播解决方案,资料为。 4. 奇妙元:出门问问出品,方案为。 5. 烽火:相关资料为烽火 AIGC 数字人介绍.pptx。 此外,还有以下一些数字人工具: 1. HEYGEN:优点是人物灵活,五官自然,视频生成很快;缺点是中文的人声选择较少。使用方法为:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果如图所示,My Avatar 处显示上传的照片,点开大图后,点击 Create with AI Studio,进入数字人制作,写上视频文案并选择配音音色,也可以自行上传音频,最后点击 Submit,就可以得到一段数字人视频。 2. DID:优点是制作简单,人物灵活;缺点是为了防止侵权,免费版下载后有水印。使用方法为:点击上面的网址,点击右上角的 Create vedio,选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象,配音时,可以选择提供文字选择音色,或者直接上传一段音频,最后,点击 Generate vedio 就可以生成一段视频,打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI:优点是免费(对于普通娱乐玩家很重要),功能齐全;缺点是音色很 ai。使用方法为:点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能,点击开始创作,选择自定义照片,配音时,可以选择提供文字选择音色,或者直接上传一段音频,打开绿幕按钮,点击背景,可以添加背景图,最后,点击生成视频。 剪映数字人也具有一定优势: 剪映作为字节跳动旗下的产品,在抖音平台上被广泛应用。其海外版 CapCut 登顶过美国 App Store,在全球各国 App Store 和 Google Play 平台上的安装总量已超过 2.5 亿次,在美国市场内的安装总量接近 950 万次。剪映的六大 AI 功能解决了用数字人做视频的痛点,不需要反复跳出剪映,在编辑器里就能完成脚本生成→语音克隆→数字人口播的环节。 制作流程为:首先打开剪映,添加一个文本到文字轨道,并修改好需要朗读的文字;然后点击朗读,并进行声音克隆,剪映的声音克隆现在只用念一句话就可以完成克隆;克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去;最后,一键智能生成字幕,再自行调整文字样式并校准就完成了。 剪映下载地址: capcut 下载地址:
2024-10-09
免费的AI数字人模型。
以下为您介绍一些免费的 AI 数字人模型及相关生成方法: 算法开源代码仓库: ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition(这是一个语音识别的接口集合,里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognition TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 大模型:包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。 Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 在剪映中生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”将其添加到当前视频中。剪映 App 会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 为让视频更美观,可增加背景图片。点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,可调整图片位置和大小。 数字人“私有化”: 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。
2024-10-08
AI数字人
AI 数字人是运用数字技术创造出来的人,虽现阶段不能如科幻作品中的人型机器人般高度智能,但已在各类生活场景中出现,且随着 AI 技术发展正迎来应用爆发。目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时,也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程包含三个核心算法: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应。开源代码如 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 AI Agent(人工智能体):充当数字人大脑,可接入大语言模型,如 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可用 LangChain 模块自定义(https://www.langchain.com/)。 TTS(文字转语音):将数字人依靠 LLM 生成的文字输出转换为语音。开源代码如微软的 edgetts(https://github.com/rany2/edgetts),只能使用预设人物声音且接口免费;VITS(https://github.com/jaywalnut310/vits)及其分支版本,可自己训练想要的人声;sovitssvc(https://github.com/svcdevelopteam/sovitssvc)专注于唱歌。 除算法外,人物建模模型可通过手动建模(音频驱动)或 AIGC 方式生成人物动态效果(如 wav2lip 模型)来实现一个最简单的数字人。但这种简单构建方式存在诸多问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型及动作、数字人如何使用知识库做出某领域专业性回答等。
2024-10-08
企业内部知识库和 AI 问答结合,有哪些成熟的解决方案,或者产品推荐?
以下是企业内部知识库和 AI 问答结合的一些成熟解决方案和产品推荐: Contextual Answers:这是一个端到端的 API 解决方案,其答案完全基于组织知识,能避免“幻觉”。全球信息服务提供商 Clarivate 与其合作,将其应用于图书馆解决方案套件,为学生、教师和研究人员提供基于策划和可信学术内容的问题答案。 职业规划类产品:结合用户个人情况和市场需求制定详细职业发展计划,包括短、中、长期目标,帮助用户在 AI 时代找到职业定位。其核心构思在于利用企业已有知识积累结合大模型能力,为用户提供准确简洁答案。具体通过创建企业私有知识库收录问答记录和资料,利用大模型处理用户咨询问题,确保回答准确一致,必要时提供原回答完整版,还能对接人工客服,在智能助手无法解决问题时快速转接,提升服务质量和客户满意度。
2024-09-14
类似 智能驾驶、智能客服 等,AI 在各大行业的主要应用(成熟一点的)有哪些
以下是 AI 在各大行业的一些主要成熟应用: 智能办公: 快速总结群聊内容或会议信息。 为写公文提供结构模板参考。 智能客服: 借助 agent 接入企业的 QA 知识库,回应用户信息,并依据回答下达诸如取消订单、催快递之类的 action 指令。 AI 导购: 依据用户问题,结合产品介绍和评论信息等,为用户推荐更准确、精准的产品。 医疗保健: 医学影像分析,辅助诊断疾病。 加速药物研发,识别潜在药物候选物和设计新治疗方法。 个性化医疗,分析患者数据提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 金融服务: 风控和反欺诈,识别和阻止欺诈行为。 信用评估,帮助金融机构做出贷款决策。 投资分析,分析市场数据辅助投资决策。 提供 24/7 客户服务,回答常见问题。 零售和电子商务: 产品推荐,分析客户数据推荐可能感兴趣的产品。 改善搜索结果和提供个性化购物体验。 动态定价,根据市场需求调整产品价格。 汽车行业: 自动驾驶技术,利用 AI 进行图像识别、传感器数据分析和决策制定。 车辆安全系统,如自动紧急制动、车道保持辅助和盲点检测。 个性化用户体验,根据驾驶员偏好和习惯调整车辆设置。 预测性维护,分析车辆实时数据预测潜在故障和维护需求。 生产自动化,用于自动化生产线,提高生产效率和质量控制。 销售和市场分析。
2024-09-05
text to SQL有哪些成熟的应用?
texttoSQL 技术在以下几个方面有较为成熟的应用: 1. 数据库自然语言查询 允许用户使用自然语言提出数据库查询,无需掌握 SQL 语法 可以将自然语言问题转换为可执行的 SQL 语句 2. 智能问答系统 结合知识库和数据库,提供基于自然语言的问答服务 通过 texttoSQL 技术将自然语言问题转换为数据库查询 3. 业务分析辅助 帮助非技术人员通过自然语言进行数据分析和报表生成 提高数据分析的效率和可访问性 4. 对话式数据管理 允许用户通过对话的方式管理和查询数据库 提升数据操作的便捷性和用户体验 5. 自然语言编程 将自然语言转换为可执行的代码或脚本 降低编程门槛,让非技术人员也能进行简单的编程 总的来说,texttoSQL 技术在数据库查询、智能问答、业务分析、对话式数据管理以及自然语言编程等领域都有较为成熟的应用,为用户提供了更加自然和便捷的数据交互方式。随着技术的不断进步,这些应用场景也将进一步拓展和深化。
2024-04-19
目前比较 成熟的通过图片生成类似图片的AI有哪些,请你列举几款
目前比较成熟的通过输入图片生成类似图片的 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-04-19
我的app应用想要对接大语言模型,结合APP用户自身的数据,实现更精准的对话,是否有行业比较成功的案例可以借鉴
以下是一些在 APP 应用对接大语言模型方面比较成功的案例,可供您借鉴: 1. Poe: 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用。 支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导真的能够启发到用户,midjourney prompt 扩写 Chatbot 能力很惊人。 2. Perplexity.ai: 本质是个可联网的搜索引擎,完全免费,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。 网页版能力全面,能够根据提问从互联网上搜寻信息并给出总结后的答案。 很多 Chat GPT 中调用插件才能解决的事情(联网查询、旅行、住宿、商品推荐)靠 Perplexity 就可以解决。 能给出信息来源网址,并根据搜索内容给出继续对话的问题建议。 最新推出的 Copilot 能力支持根据搜索内容进行信息补充,每 4h 内使用 5 次,调用 GPT4。 支持分享聊天内容到多渠道。 首页推荐当下流行的新闻、搜索内容。 支持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。 Chrome 插件可针对当前页面给出即时摘要。 访问地址:
2024-10-18
我如何应用AI进行高效学习
以下是应用 AI 进行高效学习的方法: 英语学习: 1. 智能辅助工具:利用如 Grammarly 这样的 AI 写作助手进行英语写作和语法纠错,改进英语表达和写作能力。 2. 语音识别和发音练习:使用如 Call Annie 这样的语音识别应用进行口语练习和发音纠正,获取实时反馈和建议。 3. 自适应学习平台:使用如 Duolingo 这样的自适应学习平台,借助 AI 技术为您量身定制学习计划,提供个性化的学习内容和练习。 4. 智能导师和对话机器人:利用如 ChatGPT 这样的智能对话机器人进行英语会话练习和对话模拟,提高交流能力和语感。 数学学习: 1. 自适应学习系统:使用如 Khan Academy 这样的自适应学习系统,结合 AI 技术为您提供个性化的数学学习路径和练习题,进行精准推荐。 2. 智能题库和作业辅助:利用如 Photomath 这样的智能题库和作业辅助工具,通过图像识别和数学推理技术为您提供数学问题的解答和解题步骤。 3. 虚拟教学助手:使用如 Socratic 这样的虚拟教学助手,借助 AI 技术为您解答数学问题、提供教学视频和答疑服务,帮助理解和掌握数学知识。 4. 交互式学习平台:参与如 Wolfram Alpha 这样的交互式学习平台的数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 学习一门外语的通用方法: 1. 设定目标:明确学习目标和时间表,分阶段完成学习任务。 2. 多样化练习:结合听、说、读、写多种方式进行练习,全面提升语言技能。 3. 模拟真实环境:尽量多与母语者交流,或使用 AI 对话助手模拟真实对话场景。 4. 定期复习:使用 AI 工具的复习功能,根据记忆曲线定期复习已学内容,巩固记忆。 通过结合 AI 技术和传统学习方法,可以更高效、更个性化地进行学习,并取得更好的学习效果。但请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-16
我如何学会AI应用
要学会 AI 应用,您可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 学习 Python 编程: 至少熟悉以下内容: Python 基础: 基本语法:了解 Python 的基本语法规则,比如变量命名、缩进等。 数据类型:熟悉 Python 中的基本数据类型,如字符串(String)、整数(Integer)、浮点数(Float)、列表(List)、元组(Tuple)、字典(Dictionary)等。 控制流:学习如何使用条件语句(if)、循环语句(for 和 while)来控制程序的执行流程。 函数: 定义和调用函数:学习如何定义自己的函数,以及如何调用现有的函数。 参数和返回值:理解函数如何接收参数和返回结果。 作用域和命名空间:了解局部变量和全局变量的概念,以及它们是如何在 Python 中工作的。 模块和包: 导入模块:学习如何导入 Python 标准库中的模块或者第三方库。 使用包:理解如何安装和使用 Python 包来扩展程序的功能。 面向对象编程(OOP): 类和对象:了解面向对象编程的基本概念,包括类的定义和实例化。 属性和方法:学习如何为类定义属性和方法,以及如何通过对象来调用它们。 继承和多态:了解类之间的继承关系以及如何实现多态。 异常处理: 理解异常:了解什么是异常,以及它们在 Python 中是如何工作的。 异常处理:学习如何使用 try 和 except 语句来处理程序中可能发生的错误。 文件操作: 文件读写:学习如何打开文件、读取文件内容以及写入文件。 文件与路径操作:理解如何使用 Python 来处理文件路径,以及如何列举目录下的文件。 希望以上内容对您有所帮助。
2024-10-16
AI在高中生中有哪些应用
AI 在高中生中的应用主要包括以下方面: 1. 医疗领域: AI 提前三年诊断胰腺癌。 两名高中生与医疗技术公司合作,发现与胶质母细胞瘤相关的新靶基因。 AI 帮助抗衰老,筛查高效的药物候选物。 使用 AI 寻找阿尔兹海默症的治疗方法。 AI 帮助早期诊断帕金森。 2. 生成式 AI: 能使产品个性化用户体验,例如在教育科技和搜索中,对八岁儿童和高中生使用不同的语言进行解释。 3. 思维培养: 尽管 AI 能在象棋等领域超越人类,但高中生仍能因热爱而参与,这有助于培养兴趣和思维。 写作方面,虽然可以使用 AI 总结关键信息,但手写笔记更有助于深入思考和学习。
2024-10-16
AI在信息检索领域的应用
AI 在信息检索领域有广泛的应用,以下为您详细介绍: 1. 存在能联网检索的 AI,它们通过连接互联网,实时搜索、筛选并整合所需数据,为用户提供更精准和个性化的信息。例如: ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。 Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 Bing Copilot 作为一个 AI 助手,旨在简化您的在线查询和浏览活动。 还有如 You.com 和 Neeva AI 等搜索引擎,提供基于人工智能的定制搜索体验,并保持用户数据的私密性。 2. Notion CEO 认为,AI 是 Notion 的机会。在 language model 出现之前,在知识库搜索内容通常需要很精确的关键词,甚至要询问同事信息存放的数据库。但现在可以直接询问 Notion AI 想要搜寻的问题,很快就能得到答案。 3. 在信息爆炸的时代,AI 技术极大地提升了信息检索和处理的效率。近期热门融资的 AI 产品中,有多种在信息检索方面表现出色的,比如: You.com:多种搜索模式且重隐私的搜索引擎。 Genspark:通过 Sparkpages 来满足用户个性化的搜索需求。 Rockset:刚被 OpenAI 收购的提供实时搜索和分析数据库服务的公司。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-16
有没有帮助产品经理设计产品原型和交互的AI应用
目前有一些基于人工智能生成内容的工具(AIGC)可以用于产品经理设计产品原型和交互,以下是相关介绍: 1. UIzard:是一个利用 AI 技术生成用户界面的工具,可根据提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的一些 AI 插件可增强设计流程。 3. Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作,如自动生成设计元素。 以下是一些适用于产品经理的 AI 工具集: 1. 用户研究、反馈分析:Kraftful(kraftful.com) 2. 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 3. 画原型:Uizard(https://uizard.io/autodesigner/) 4. 项目管理:Taskade(taskade.com) 5. 写邮件:Hypertype(https://www.hypertype.co/) 6. 会议信息:AskFred(http://fireflies.ai/apps) 7. 团队知识库:Sense(https://www.senseapp.ai/) 8. 需求文档:WriteMyPRD(writemyprd.com) 9. 敏捷开发助理:Standuply(standuply.com) 10. 数据决策:Ellie AI(https://www.ellie.ai/) 11. 企业自动化:Moveworks(moveworks.com) 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-15
Way to AGI 近期更新
以下是 Way to AGI 的近期更新: Runway 官方镜头提示词相关: 官方镜头指南:https://help.runwayml.com/hc/enus/ 相关文章:articles/30586818553107Gen3AlphaPromptingGuide 生图官网:https://app.runwayml.com/videotools/teams/aimwisetonix/aitools/generativevideo 互动:最下面有个小互动,一起生文字“WaytoAGI”回头剪辑到一起 适合参加本期 video battle:https://waytoagi.feishu.cn/wiki/CufGwGyeXiomZnkiLTwcIgd3nnb 官方效果: https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r Gen3 Alpha 上线,具有无限潜力,创建传达场景的强烈提示是生成与概念一致视频的关键,涵盖不同示例结构、关键字和提示。 观点方面: 作者 Allen 认为热爱与行动是通往 AGI 之路。 更新日志:补充对共创模式的思考,删减部分内容。 端午假期实践了三篇教程,难度从低到高排序为: 1. https://waytoagi.feishu.cn/wiki/QWQ0w1QOZiNZz9kreQecY4hYn4c (入门级网速好的话,一个小时能搞定) 2. https://waytoagi.feishu.cn/wiki/XnvIwd8NkiDefHkmbobcCfsBnKg 3. https://waytoagi.feishu.cn/wiki/YeBiwZx2TiyNLMk8pdjcmdQfnjd 关于加强写作能力的训练,准备调整工作流,先把初稿发在飞书上(可能是原来 2 篇或 3 篇的集合,有一些不方便说的也先发在初稿,后续再删),获取大家反馈后再拆分细化。 自我介绍:Allen,一个小镇青年,是 WaytoAGI 共创者。
2024-10-12
近期更新的虚拟陪伴产品
以下是近期更新的一些虚拟陪伴产品: 1. Character.ai:这是一个 AI 虚拟陪伴平台,用户可与数百个 AI 驱动的角色交流,包括名人、动漫角色等,还能创建自己的角色并赋予其描述、图像、个性等特性。 2. Replika:一款 AI 虚拟陪伴应用,用户能设计理想伴侣,其会存储记忆并在未来对话中参考,甚至可发送照片。 3. Talkie:主打情感路线的 AI 虚拟陪伴应用,设计有大量 npc,游戏和休闲娱乐体验感更强,每个 npc 带有自己的剧情体系,交流中会触发抽取卡牌机会。 享受型虚拟陪伴方面:享受是人不用付出就能得到想要的。过去 20 年,互联网产品在让用户享受上有成熟方法论,如交互简便、流程便利、连接畅通、内容无限。但用这些标准衡量 AI 产品,尤其是虚拟陪伴产品时,能经受审视的不多。当前虚拟陪伴产品本质上是角色扮演对话工具,用户核心体验是和 AI 扮演的虚拟角色通过文字消息、图片消息、语音消息、语音通话、视频通话等方式聊天。 此外,主流虚拟陪伴产品以一问一答的多轮对话作为基础交互方式,通过更产品化的信息收集方式降低高质量 Prompt 获得的门槛。但仍有人表示不会使用此类产品。推荐大家收听如等播客。 以上内容由 AI 大模型生成,请仔细甄别。
2024-09-10
近期有哪些新的AI产品
近期有以下新的 AI 产品: 1. 4 月下半月有 78 个 AI 新产品,包括 15 个初创企业的新产品(从开源和闭源角度划分)、39 个有用的和 10 个好玩的新产品(有用的部分从通用场景及垂直场景划分,并单列了模型训练、AI 安全、代码学习和 AI 代理等关注度较高的类别)、14 个大公司的新产品(如微软、谷歌、英伟达、苹果、Palantir 等)。 2. Google 在 I/O 大会上推出的新产品,如新一代 LLM PaLM2(在常识推理、数学和逻辑方面有所改进,编程能力好于 ChatGPT)、多模态大模型 Gemini、基于 PaLM2 运行的 Bard(向所有用户全面放开,并将逐步增加适配语言,具备多种功能)、Duet AI(Office Copilot 的竞品)。 3. 3 月底有 23 个 AI 新产品,包括 5 个来自大公司和成熟创业公司的新产品、9 个有用的、4 个有趣的和 5 个华人开发者所搭建的小产品。
2024-09-07
Way to AGI 近期更新
WaytoAGI 近期有以下更新活动: 1. 8 月 1 日更新: 【线下⬇️】Founder Park,WaytoAGI 专属优惠为全票种八折(优惠码:WH87),Workshop 七折(优惠码:YP9X)。 【线上⬆️】,8 月 6 日截止,在即梦创作剧场,图片和视频片段作品都可投稿,获奖作品将获得 600 积分,活动链接:https://jimeng.jianying.com/aitool/activity?weekly_act_key=2024015dreaminaweeklychallenge 。 2. 8 月 15 日更新:,2024 年 7 月 26 日 9 月下旬,由中国科学技术馆和网易新闻发起,WaytoAGI 作为特别支持社区,即日起向全球征集 AI 音乐歌曲作品,通过专业评审评选出 10 首歌曲,将在 9 月下旬进行线下汇演,活动链接:https://waytoagi.feishu.cn/wiki/YEmhwULvUiRyp8k9noQchrJGnEh 。
2024-08-21
近期有哪些有趣的大模型应用
大模型因其强大的语言理解和生成能力,在以下领域有比较火的应用场景: 1. 文本生成和内容创作:能够生成连贯、有逻辑的文本,用于撰写文章、新闻报道、诗歌和故事等。 2. 聊天机器人和虚拟助手:凭借自然语言处理能力,实现与人类自然对话,提供客户服务、日常任务提醒和信息咨询等。 3. 编程和代码辅助:可进行代码自动补全、bug 修复和代码解释,提升开发者编程效率。 4. 翻译和跨语言通信:理解和翻译多种语言,便于不同语言背景用户的沟通和信息共享。 5. 情感分析和意见挖掘:分析社交媒体、评论和反馈中的文本,识别用户情感和观点,为市场研究和产品改进提供支持。 6. 教育和学习辅助:创建个性化学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型能根据文本描述生成相应图像,未来可能拓展到视频内容生成。 此外,根据当前市场状况和分析,在企业中真正实施的模型解决方案主要集中在应用层面,利用模型强大功能发展出多种“模型应用”。尽管大型模型是一个综合体,但人们习惯从逻辑上分类和定义,寻找应用场景实际是为其能力寻找适当逻辑划分,明确在特定领域或范围的具体应用方向,并针对特定需求设定功能进行有目标的开发。基于大模型的产品(确切说是大型语言模型),都是“简约但不简单”。
2024-08-21
大家近期有遇到 电脑版的GPT 图片显示不了的问题的不
电脑版的 GPT 图片显示不了的问题可能存在以下情况: 1. 对于 GPTs 试用链接,如果最后没有展示图片,可以问 GPT:“你没有展示图片给我!”或者“你没有把图片下载链接给我”。 2. 除了最后生成图片的过程中,有时候没法展示给用户,需要再多要一次,其他的问题基本调好了。如果觉得难度过于简单,可以试试让他加大难度等方法(在创作代码的时候就要求加大难度)。 3. 制作新春贺卡时,D3 画图时候“2024”这种数字显示不好。最后去掉了“2024”的数字,GPTs 字体图片显示的时候,有个 bug 不能显示图片预览,最后绕了一下,在提示词中使用 Markdown 语法来显示图片,同时图片存在了 github 的服务器上,没有存在 knowledge 中。但据说存在 knowledge 中也可以,次数到了还没测试。文字生成时,没法做到垂直和水平居中,目前依然有点小问题,可能得调整下代码。 中间还遇到过关于低于 13 岁孩子相关的判定,但原因不明,有待进一步摸透。
2024-08-12