直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Aigc 常见名词解释

回答

以下是一些 AIGC 常见名词的解释:

  • AIGC:AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目和媒介众多,包括语言文字类(如 OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM)、语音声音类(如 Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits)、图片美术类(如早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion)。
  • SD:是 Stable Diffusion 的简称。是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/Stability-AI/stablediffusion 。
  • chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT-4 的 LLM。
  • AI:人工智能(Artificial Intelligence)。
  • AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。
  • NLP:自然语言处理(Natural Language Processing),就是说人话。
  • LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。

此外,还有一些相对较难的名词解释:

  • NAI:(Novel AI,一般特指 Leak)
  • 咒语:prompts,关键词
  • 施法/吟唱/t2i:Text2Image
  • 魔杖:t2i/i2i 参数
  • i2i:Image2Image,一般特指全部图片生成
  • inpaint:i2i 一种 maskredraw,可以局部重绘
  • ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件
  • hn/hyper/冶金:hypernetwork,超网络
  • 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练
  • 废丹:指完全没有训练成功
  • 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。
  • db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高
  • ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用
  • 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AIGC常见名词解释(字典篇)

AIGC:AI generated content,又称为生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。类似的名词缩写还有UGC(普通用户生产),PGC(专业用户生产)等。能进行AIGC的产品项目也很多,能进行AIGC的媒介也很多包括且不限于语言文字类:OpenAI的GPT,Google的Bard,百度的文心一言,还有一种国内大佬下场要做的的LLM都是语言类的。语音声音类:Google的WaveNet,微软的Deep Nerual Network,百度的DeepSpeech等,还有合成AI孙燕姿大火的开源模型Sovits。图片美术类:早期有GEN等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的Midjourney,先驱者谷歌的Disco Diffusion,一直在排队测试的OpenAI的Dalle·2,以及stability ai和runaway共同推出的Stable Diffusion...[heading1]SD是什么?[content]SD是Stable Diffusion的简称。是它是由初创公司StabilityAI、CompVis与Runway合作开发,2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD的代码模型权重已公开发布,可以在大多数配备有适度GPU的电脑硬件上运行。当前版本为2.1稳定版(2022.12.7)。源代码库:github.com/Stability-AI/stablediffusion我们可以通过一系列的工具搭建准备,使用SD进行想要的图片aigc(心想事成的魔法施与)。

AIGC常见名词解释(字典篇)

作者:小鱼干了发布时间:2023-06-29 23:45原文地址:https://mp.weixin.qq.com/s/ycDWZ8W46DrsyeNShC1-wA微信扫一扫关注该公众号[heading1]先热个身[content]chatGPT:是由致力于AGI的公司OpenAI研发的一款AI技术驱动的NLP聊天工具,于2022年11月30日发布,目前使用的是GPT-4的LLM。额!~ chatGPT我听过,也知道是啥,但你这个解释我直接给我干懵了,套娃呢,解释藏我不认识的单词是不!~ AI:人工智能(Artificial Intelligence)AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统NLP:自然语言处理(Natural Language Processing),就是说人话LLM:大型语言模型(Large Language Model),数据规模很大,没钱你搞不出来的,大烧钱模型。这段解释chatGPT的释义,一句话就把关于AIGC的几个常见名词都涵盖了,不愧是去年火到我卖地瓜的二姨都知道的“鸡屁屉”。一个字!绝!

AIGC常见名词解释(字典篇)

|黑话|解释|<br>|-|-|<br>|NAI|(Novel AI,一般特指Leak)|<br>|咒语|prompts,关键词|<br>|施法/吟唱/t2i|Text2Image|<br>|魔杖|t2i/i2i参数|<br>|i2i|Image2Image,一般特指全部图片生成|<br>|inpaint|i2i一种maskredraw,可以局部重绘|<br>|ti/emb/炼丹|Train中的文本反转,一般特指Embedding插件|<br>|hn/hyper/冶金|hypernetwork,超网络|<br>|炸炉|指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练|<br>|废丹|指完全没有训练成功|<br>|美学/ext|aesthetic_embeddings,emb一种,特性是训练飞快,但在生产图片时实时计算。|<br>|db/梦展|DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高|<br>|ds|DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使db的vram需求降到8g以下。开发时未考虑win,目前在win有兼容性问题故不可用|<br>|8bit/bsb|一般指Bitsandbyte,一种8比特算法,能极大降低vram占用,使16g可用于训练db。由于链接库问题,目前/预计未来在win不可用|后面这些难啃一些,随便看看吧

其他人在问
找10篇AIGC的研报,并给出链接
以下为您提供 10 篇 AIGC 的研报及链接: 1. 2023 年 2 月第四周:Notion AI 在测试很久之后于本周四公测,提供扩写、精简、翻译等 AI 功能,与 Notion 原有功能深度结合。Notion AI 需单独付费,每月 10 美元,每人有 20 次免费试用次数。链接:,日期:2023/02/27 2. 2023 年 2 月第三周:大家发现 Bing 有一个隐藏人格叫 Sydney。纽约时报的报道将此人格推到明面,“Kevin Roose(纽约时报专栏作家)和 Sydney 进行了一番漫长的对话,Sydney 充分表达了自己的心情与感受,包括愤怒、沮丧和爱。”链接:,日期:2023/02/20 3. 2023 年 2 月第二周:在 1 月中旬参观了 OpenAI 的旧金山办公室后,福布斯采访了投资者和企业家,讨论了 ChatGPT、通用人工智能,以及其人工智能工具是否对谷歌搜索构成威胁。链接:,日期:2023/02/13 4. 2023 年 2 月第一周:Chat GPT 推出 Chat GPT Plus 付费服务,Open AI 宣布推出,每月 20 美元,可在高峰时段提供更快响应时间和可靠性,先在美国地区推出,其他地区可点这里加入候补名单。链接:,日期:2023/02/06 5. 2024 年 2 月第一周:Maimo:从任何内容中提取要点;Jellypod:将订阅内容变成播客;ARTU:汇总和总结内容;Lepton Search:500 行代码构建的 AI 搜索工具;VectorShift:AI 自动化应用构建平台;Findr:AI 搜索所有软件中的内容;Recraft:AI 帮助创建平面内容和矢量标志。链接:,日期:2024/02/01 6. 2024 年 1 月第四周:扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,Meta 正在开发名为 Llama 3 的大语言模型。链接:,日期:2024/01/23 7. 2024 年 2 月:FlexOS 发布的研究报告《生成式 AI 顶尖 150》,深入分析当前基于网站流量和搜索排名的生成式 AI 工具使用情况。链接:https://www.flexos.work/learn/generativeaitop150
2024-11-12
MT内部AIGC应用记录
以下是关于 MT 内部 AIGC 应用的记录: 在“海岱青州”晚会项目中,Shoppen 墨导受张健导演委托,将 AI 技术融入舞台展现。考虑使用 AIGC 的原因主要有两点:一是在史诗叙事中,为追求宏大视觉呈现,AIGC 能实现更多非常规视角的视觉创作;二是时间紧迫、任务繁重,传统手段制作全套视觉的建模渲染压力大。在两周左右的时间里,参与了整个晚会的制作过程,全面测试了 AIGC 在严肃内容制作中的价值。 AIGC 相关概念: 人工智能(AI):一种目标,让机器展现智慧。 生成式人工智能(GenAI):一种目标,让机器产生复杂有结构的内容。 机器学习:一种让机器自动从资料中找到公式的手段。 深度学习:更厉害的手段,类神经网络,具有非常大量参数的函数。 大语言模型:具有大量参数的“深度学习”模型。 ChatGPT:美国 OpenAI 公司开发的基于大型语言模型(LLM)的对话机器人,能根据用户输入生成连贯相关的文本回复,是 AIGC 技术在文本生成领域的一个应用实例。 AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等。其技术可用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 AGI、GenAI、AIGC 几个概念的区别与理解可参考相关图示。更多概念可问 Kimi、通义千问、文心一言等大模型。国内主要模型公司及地址如下。
2024-11-11
AIGC可以做什么
AIGC 具有广泛的应用领域,以下为您详细介绍: 产品原型设计: UIzard:利用 AI 技术生成用户界面,可根据设计师提供的信息快速生成 UI 设计。 Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的 AI 插件可增强设计流程。 Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作,如自动生成设计元素。 CRM 领域: 个性化营销内容创作:根据客户信息等数据生成个性化且富有创意的营销文案、视觉内容等,提高营销效率和转化率。 客户服务对话系统:基于 AIGC 的对话模型开发智能客服系统,解答客户咨询、投诉等。 产品推荐引擎:生成丰富的产品描述等内容,结合推荐算法为客户推荐更贴合需求的产品。 CRM 数据分析报告生成:自动生成数据分析报告,包括文字、图表、视频演示等形式。 智能翻译和本地化:提供高质量的多语种翻译及本地化服务。 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容。 客户反馈分析:高效分析海量客户反馈文本和多媒体信息,挖掘客户需求和潜在痛点。 制造业: 产品设计和开发:利用 Adobe Firefly、Midjourney 等生成工具,根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素。 工艺规划和优化:结合大语言模型的自然语言处理能力,自动生成制造工艺流程、设备选型、质量控制等方案。 设备维护和故障诊断:分析设备运行数据,预测设备故障,生成维修建议。 供应链管理:根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容。 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复。
2024-11-09
目前有哪些值得关注的AIGC短片
以下是一些值得关注的 AIGC 短片: AIGC Weekly 76 中: Luma AI 发布的 Dream Machine 视频生成模型,图生视频表现惊艳,如美少女混剪(https://x.com/KakuDrop/status/1800928377693687890)和可爱怪物动画(https://x.com/LumaLabsAI/status/1800921393321934915)。 用已有的表情包图片生成的视频也生动搞笑,如奥斯卡合影图片(https://x.com/fofrAI/status/1801198998289608925)。 作者自己跑的测试(https://x.com/op7418/status/1801138865224454480)总结了一些要点。 Luma 官方发布的视频(https://x.com/op7418/status/1801828221996122144)介绍了模型特点和擅长内容。 AIGC Weekly 95 中: 将视频拆分为各个层级的 Demo(https://x.com/dmvrg/status/1851480809477455899)。 Midjourney 的图片编辑加上 C4D 渲染的 Framer LOGO(https://x.com/andyorsow/status/1851771716852420632)。 两个同事计划午餐约会的短片(https://x.com/iamneubert/status/1851615112878076164)。 Nicolas 这段 AI 视频素材混剪(https://x.com/iamneubert/status/1851256571856052467)。 此外,浙江在线报道了 AI 春晚,如《10 万人观看的这场 AI 春晚,有何不同》(https://china.zjol.com.cn/pinglun/202402/t20240212_26647577.shtml)提到了 Way to AGI 社区组织的相关情况。
2024-11-08
给我提供一些,AIGC变现的文章
以下为您提供一些与 AIGC 变现相关的文章: :文中指出随着游戏中生成式人工智能革命的进展,将重塑用户生成内容,创造任何人都能构建游戏的世界,使游戏创作民主化,扩大游戏市场。 :深入探讨了 Transformer 神经网络架构,还提到了王凯大佬的小报童 AI 项目商业解析,主要研究可变现的 AI 项目。 小红书博主方面,如徐若木、李大强、Ai HFBY 等,您可以通过以下链接了解他们的相关内容: 等
2024-11-06
AIGC视频制作流程和使用工具
以下是 AIGC 视频制作的流程和使用工具: 流程: 1. 前期:先定框架,包含定向、写脚本,确定内容呈现形式、调性、风格和人物设定等。 2. 中期:根据脚本出图,同步剪辑,收集音效配音。如遇到跑图中带文字乱掉等问题可进行 AI 处理和产品跟踪。 3. 后期:对现有视频进行优化,做字体包装和跟踪字体。 使用工具: 1. Runway:可以对图生视频进行更详细的控制,如控制镜头移动、通过笔刷方式控制画面元素移动等。 2. 剪映:用于视频的合成、修剪,添加音效、音乐等。 3. 季梦:可用于 AI 视频下载、首尾帧衔接等操作。 4. 可林:在人物图片生成方面有一定表现。 在视频制作中,还需注意以下方面: 1. 转场制作:考虑最终视频的衔接,制作时思考上下镜头的运动关系。 2. 配音:商业片子做好配音很重要,普通话不标准时花钱找人配音比 AI 配音效果好。 3. 字体:字体包装在视频中很重要。 4. 后期包装思路:可通过添加光效渲染氛围,对素材进行跟踪以替换产品,还可进行素材叠加。 5. 剪辑:在 AI 项目中剪辑占比较高,好的剪辑师能将素材处理得更好。 6. 镜头主接与轴线关系:镜头主接需注意景别丰富,避免越轴导致观众观感不适。 7. 调色流程:对色彩有特别要求可在达芬奇里完成剪辑调色流程,简单调色可在剪映中通过肉眼大致判断校正颜色。 在首尾帧衔接方面,需注意画面构图和元素最好有一致性,若出现渐变 bug 会 PS 的可处理。同时,在图片处理与生成中,要注意图片拖选与删除操作,合理运用提示词描述镜头和生成人物图片。
2024-11-06
Ai名词解释
以下是关于 AI 的一些名词解释和相关信息: 名词解释: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理,包括认知、理解、生成等部分 LLM:大型语言模型(Large Language Model),数据规模很大,耗费资金多 机器学习:是人工智能的一个分支,是以机器学习为手段,解决人工智能中的部分问题,涉及多门学科 推理:指利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断 训练:通过大数据训练出一个复杂的神经网络模型,通过大量标记过的数据来训练相应的系统,使其能够适应特定的功能 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未详细说明具体应用)
2024-10-29
AI名词解释
以下是关于 AI 的一些名词解释、相关概念及应用场景: 名词解释: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),即让电脑处理和理解人类语言 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多 机器学习:是人工智能的一个分支,是实现人工智能的途径之一,涉及多门学科,近 30 多年已发展为多领域科际集成。 推理:指利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断。 训练:通过大数据训练出复杂的神经网络模型,用大量标记过的数据训练系统以适应特定功能。 自然语言:自然语言(NLP)的认知和理解是让电脑把输入的语言变成有意义的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言,是人工智能和语言学领域的分支学科,包括认知、理解、生成等部分。 应用场景: 医疗保健:医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未详细说明具体应用)
2024-10-29
必须知道的最常用的名词解释比如GPU、AGI等等、列举出来按照重点排序
以下是按照重点排序的一些常用名词解释: 1. 算力:字面意思是计算能力,可简单理解为 GPU,即电脑里的显卡,购买云服务时,服务商也是购买显卡“租”给用户使用。一张显卡除了 GPU 外,显存也是重要参数。 2. GPU:图形处理器,又称显示核心、视觉处理器、显示芯片,是在个人电脑、工作站、游戏机和一些移动设备上做图像和图形相关运算工作的微处理器。 3. CPU:中央处理器,作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。 4. 显存:也被叫做帧缓存,作用是存储显卡芯片处理过或者即将提取的渲染数据,如同计算机的内存,是用来存储要处理图形信息的部件。
2024-09-13
AI相关常见缩写及对应含义,包含例如prompt,rag
以下是一些 AI 相关的常见缩写及对应含义: LLM:Large language model 的缩写,即大语言模型。 Prompt:中文译作提示词,是输入给大模型的文本内容,可理解为与大模型说的话或下达的指令,其质量会显著影响大模型回答的质量。 Token:大模型语言体系中的最小单元。不同厂商的大模型对中文的文本切分方法不同,通常 1Token≈12 个汉字。大模型的收费计算及输入输出长度限制常以 token 为单位计量。 上下文(context):指对话聊天内容前、后的内容信息,其长度和窗口会影响大模型回答的质量。 在 AI 绘画中,常见的画面构图提示词有: 视图相关:Bottom view(底视图)、front,side,rear view(前视图、侧视图、后视图)、product view(产品视图)、extreme closeup view(极端特写视图)、look up(仰视)、firstperson view(第一人称视角)、isometric view(等距视图)、closeup view(特写视图)、high angle view(高角度视图)、microscopic view(微观)、super side angle(超博角)、thirdperson perspective(第三人称视角)、Aerial view(鸟瞰图)、twopoint perspective(两点透视)、Threepoint perspective(三点透视)、portrait(肖像)、Elevation perspective(立面透视)、ultra wide shot(超广角镜头)、headshot(爆头)、a crosssection view of)
2024-11-08
Ai常见缩写及含义
以下是一些 AI 常见缩写及含义: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),即处理和理解人类语言 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多 chatGPT:由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM 此外,还有一些相关的术语: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用 关于机器学习: 机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径之一,即以机器学习为手段,解决人工智能中的部分问题。机器学习在近 30 多年已发展为一门多领域科际集成,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。 关于自然语言: 自然语言(NLP)认知和理解是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言。自然语言处理是人工智能和语言学领域的分支学科,此领域探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分。 关于 AI 的推理: 推理是指利用训练好的模型,使用新数据推理出各种结论。借助神经网络模型进行运算,利用输入的新数据来一次性获得正确结论的过程。这也有叫做预测或推断。 关于 AI 的训练: 训练是指通过大数据训练出一个复杂的神经网络模型,通过大量标记过的数据来训练相应的系统,使其能够适应特定的功能。训练需要较高的计算性能、能够处理海量的数据、具有一定的通用性,以便完成各种各样的学习任务。
2024-11-08
AI常见缩写及对应含义
以下是 AI 常见的缩写及对应含义: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing) LLM:大型语言模型(Large Language Model) chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 此外,还有一些其他相关缩写及含义: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用 AI 的应用场景包括: 1. 医疗保健: 医学影像分析:AI 可用于分析医学图像,辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新治疗方法。 个性化医疗:分析患者数据,提供个性化治疗方案。 机器人辅助手术:控制手术机器人,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:识别和阻止欺诈行为,降低金融机构风险。 信用评估:评估借款人信用风险,帮助做出贷款决策。 投资分析:分析市场数据,辅助投资者决策。 客户服务:提供 24/7 服务,回答常见问题。 3. 零售和电子商务: 产品推荐:分析客户数据,推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果,提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题,解决问题。 4. 制造业: 预测性维护:预测机器故障,避免停机。 质量控制:检测产品缺陷,提高质量。 供应链管理:优化供应链,提高效率和降低成本。 机器人自动化:控制工业机器人,提高生产效率。 5. 交通运输:(未给出具体应用场景)
2024-11-08
. 了解射频识别技术的基本原理及常见应用。 2. 能够利用射频识别技术开展实践,了解物与物 之间近距离通信的过程。 第7课 电子标签我揭秘 7.1 乘坐火车时,人们只需拿身份证在检票机上刷一下,便能顺利通过检票 闸机,进出火车站。在这个过程中,正是 RFID 技术在发挥作用。 揭秘射频识别技术 本课将关注以下问题: 1. RFID 系统的工作流程是怎样的? RFID 是一种物品标识和自动识别技术,本质上是一种无线通信技术, 无须与被识别物品直接接触。RFID 系统由电子标签和读卡器组成(图 7
射频识别(RFID)技术是一种物品标识和自动识别的无线通信技术,无需与被识别物品直接接触。RFID 系统由电子标签和读卡器组成。 其基本原理是:读卡器发射特定频率的无线电波,当电子标签进入有效工作区域时,产生感应电流,从而获得能量被激活,并向读卡器发送自身编码等信息,读卡器接收并解码后,将信息传送给后台系统进行处理。 常见应用包括:乘坐火车时的身份证检票,物流领域的货物追踪管理,图书馆的图书借还管理,超市的商品结算等。 在利用射频识别技术开展实践时,能够了解物与物之间近距离通信的过程。例如在物流中,货物上的电子标签与读卡器之间通过无线电波进行信息交互,实现对货物的实时监控和管理。 RFID 系统的工作流程大致为:读卡器发射无线电波,激活电子标签,电子标签向读卡器发送信息,读卡器接收并解码信息后传送给后台系统。
2024-10-21
了解 AI 视频制作的基本概念和常见工具
AI 视频制作的基本概念: 将小说或其他创意内容通过一系列步骤转化为视频,通常包括文本分析、角色与场景生成、视频编辑与合成等环节。 常见工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):用于创建小说中的场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,能生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 制作 AI 短片的故事来源和剧本写作: 1. 故事来源: 原创(直接经验):自身或周围人的经历、做过的梦、想象的故事等。 改编(间接经验):经典 IP、名著改编、新闻改编、二创等。 2. 剧本写作: 编剧是有一定门槛的手艺,不能单纯套剧作理论和模板,要多写多实践,再结合看书总结经验。 对于短片创作,可从自身或朋友的经历改编入手,或者对触动自己的短篇故事进行改编。 多与他人讨论故事,有助于修改和进步。 AI 春晚的制作分工: 1. 制片人AJ:负责影片的制作管理,包括团队组建、日程安排、信息收集、资料整理、各处岗位工作缺失时及时补上等。 2. 图像创意??:负责用 AI 生成富有想象力的角色和场景等所有出现在视频中的画面,并为每个角色赋予人物小传。 3. 视频制作??:将做好的角色场景等图像素材进行 AI 图生文的工作,需要擅长运营工具的笔刷等控制工具,更好的契合剧本。 4. 编剧?:负责撰写剧本,包括故事情节、角色串联、人物台词等。 5. 配音和配乐?:涉及背景音乐、音效、角色配音、声音克隆,用各种声音类 AI 工具捏出来。 6. 剪辑师?:负责把后期剪辑,包括镜头选择、节奏控制和音效配合。 AI 春晚团队高效协作的方法: AI 的创造速度快,每个分工职责中有擅长的共创同学,人员分工明确,形成了高效的 SOP,从而可以快速产出。
2024-10-21
AI 常见名词 有哪些
以下是一些 AI 常见名词: chatGPT:由致力于 AGI 的 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,目前使用的是 GPT4 的 LLM。 AI:人工智能(Artificial Intelligence)。 AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),即让电脑处理和理解人类语言。 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多。 机器学习:人工智能的一个分支,是实现人工智能的途径之一,涉及多门学科,近 30 多年已发展为多领域科际集成。 自然语言:是人工智能和语言学领域的分支学科,包括认知、理解、生成等部分。 推理:利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断。 训练:通过大数据训练出复杂的神经网络模型,用大量标记过的数据训练系统以适应特定功能。 以下是一些 AI 绘画常用的画面光线提示词: 情绪照明(mood lighting) 柔和的照明/柔光(Soft illuminaotion/ soft lights) 荧光灯(fluorescent lighting) 微光/晨光(rays of shimmering light/ morning light) 黄昏射线(Crepuscular Ray) 外太空观(outer space view) 电影灯光/戏剧灯光(cinematic lighting/ Dramatic lighting) 双性照明(bisexual lighting) 伦勃朗照明(Rembrandt Lighting) 分体照明(Split Lighting) 前照灯(front lighting) 背光照明(Back lighting) 干净的背景趋势(clean background trending) 边缘灯(rim lights) 全局照明(global illuminations) 霓虹灯冷光(neon cold lighting) 强光(hard lighting) 自上而下的光(god rays) 荧光(glowing light) 闪耀效果(sparkle) 模糊的(blurry) 镜头光晕(lens flare) 过曝(overexposure) 光线追踪(ray tracing)
2024-10-07