Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Aigc 常见名词解释

Answer

以下是一些 AIGC 常见名词的解释:

  • AIGC:AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目和媒介众多,包括语言文字类(如 OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM)、语音声音类(如 Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits)、图片美术类(如早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion)。
  • SD:是 Stable Diffusion 的简称。是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/Stability-AI/stablediffusion 。
  • chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT-4 的 LLM。
  • AI:人工智能(Artificial Intelligence)。
  • AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。
  • NLP:自然语言处理(Natural Language Processing),就是说人话。
  • LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。

此外,还有一些相对较难的名词解释:

  • NAI:(Novel AI,一般特指 Leak)
  • 咒语:prompts,关键词
  • 施法/吟唱/t2i:Text2Image
  • 魔杖:t2i/i2i 参数
  • i2i:Image2Image,一般特指全部图片生成
  • inpaint:i2i 一种 maskredraw,可以局部重绘
  • ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件
  • hn/hyper/冶金:hypernetwork,超网络
  • 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练
  • 废丹:指完全没有训练成功
  • 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。
  • db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高
  • ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用
  • 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用
Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC常见名词解释(字典篇)

AIGC:AI generated content,又称为生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。类似的名词缩写还有UGC(普通用户生产),PGC(专业用户生产)等。能进行AIGC的产品项目也很多,能进行AIGC的媒介也很多包括且不限于语言文字类:OpenAI的GPT,Google的Bard,百度的文心一言,还有一种国内大佬下场要做的的LLM都是语言类的。语音声音类:Google的WaveNet,微软的Deep Nerual Network,百度的DeepSpeech等,还有合成AI孙燕姿大火的开源模型Sovits。图片美术类:早期有GEN等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的Midjourney,先驱者谷歌的Disco Diffusion,一直在排队测试的OpenAI的Dalle·2,以及stability ai和runaway共同推出的Stable Diffusion...[heading1]SD是什么?[content]SD是Stable Diffusion的简称。是它是由初创公司StabilityAI、CompVis与Runway合作开发,2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD的代码模型权重已公开发布,可以在大多数配备有适度GPU的电脑硬件上运行。当前版本为2.1稳定版(2022.12.7)。源代码库:github.com/Stability-AI/stablediffusion我们可以通过一系列的工具搭建准备,使用SD进行想要的图片aigc(心想事成的魔法施与)。

AIGC常见名词解释(字典篇)

作者:小鱼干了发布时间:2023-06-29 23:45原文地址:https://mp.weixin.qq.com/s/ycDWZ8W46DrsyeNShC1-wA微信扫一扫关注该公众号[heading1]先热个身[content]chatGPT:是由致力于AGI的公司OpenAI研发的一款AI技术驱动的NLP聊天工具,于2022年11月30日发布,目前使用的是GPT-4的LLM。额!~ chatGPT我听过,也知道是啥,但你这个解释我直接给我干懵了,套娃呢,解释藏我不认识的单词是不!~ AI:人工智能(Artificial Intelligence)AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统NLP:自然语言处理(Natural Language Processing),就是说人话LLM:大型语言模型(Large Language Model),数据规模很大,没钱你搞不出来的,大烧钱模型。这段解释chatGPT的释义,一句话就把关于AIGC的几个常见名词都涵盖了,不愧是去年火到我卖地瓜的二姨都知道的“鸡屁屉”。一个字!绝!

AIGC常见名词解释(字典篇)

|黑话|解释|<br>|-|-|<br>|NAI|(Novel AI,一般特指Leak)|<br>|咒语|prompts,关键词|<br>|施法/吟唱/t2i|Text2Image|<br>|魔杖|t2i/i2i参数|<br>|i2i|Image2Image,一般特指全部图片生成|<br>|inpaint|i2i一种maskredraw,可以局部重绘|<br>|ti/emb/炼丹|Train中的文本反转,一般特指Embedding插件|<br>|hn/hyper/冶金|hypernetwork,超网络|<br>|炸炉|指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练|<br>|废丹|指完全没有训练成功|<br>|美学/ext|aesthetic_embeddings,emb一种,特性是训练飞快,但在生产图片时实时计算。|<br>|db/梦展|DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高|<br>|ds|DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使db的vram需求降到8g以下。开发时未考虑win,目前在win有兼容性问题故不可用|<br>|8bit/bsb|一般指Bitsandbyte,一种8比特算法,能极大降低vram占用,使16g可用于训练db。由于链接库问题,目前/预计未来在win不可用|后面这些难啃一些,随便看看吧

Others are asking
请问还有哪些AIGC活动还未到截止日期
以下是一些尚未到截止日期的 AIGC 活动: 2024 上海国际公益广告大赛:截止 10 月 31 日。作品提交:sipsac.cn,主题为“潮起东方创益未来”,板块包括美丽世界、文化中国、科技生活,类型有平面、音视频、数字创新,金奖 3 万、银奖 1 万、铜奖 5 千,还有全场大奖 10 万。 首届“海丝之光”AI 青瓷设计大赛:截止 2024 年 11 月 10 日。报名链接:,团队参赛最多 5 人,网络投票+专家评审,一等奖 10000 元,二等奖 5000 元,三等奖 1000 元。 百万奖金池重磅赛事“2024 AIGC 营销视频生态创新大赛 '真 AI 牛奶,真 AI 创意'”:作品提交时间为 10 月 11 日 11 月 30 日,专家评审时间为 12 月 1 日 12 月 9 日,成果发布时间为 12 月 10 日。 中国神兽复兴计划 AI 创作大赛开启:9 月 1 日 9 月 24 日。利用 AI 复原《山海经》中的经典神兽,赢取 35 万元现金和实体大奖,获奖作品将获得全网流量曝光,由中央美术学院等权威高校支持。 生成式人工智能(AIGC)网络微短剧、微电影大赛征集评选活动:9 月 3 日 11 月 3 日。一等奖 2 名,奖杯、荣誉证书 10000;二等奖 2 名,奖杯、荣誉证书 8000;三等奖 6 名,奖杯、荣誉证书 3000。 ComfyUI 共学 WaytoAGI 共学计划:8 月 20 23 日每晚 8 点,会议链接:。 全球 AI 视觉创意大赛(瓦卡奖 VACAT):8 月 22 日 9 月 22 日。全球 AI 视觉创意大赛(瓦卡奖 VACAT Vision Arts Created by AI Technology),致力于构建 AI 视觉创意界的“奥斯卡”平台,推动 AI 视觉技术的应用与创新。
2025-01-30
请联网搜索近期有什么AIGC相关的比赛活动
以下是近期的 AIGC 相关比赛活动: 【线上⬆️】,时间为 9 月 1 日 9 月 24 日。利用 AI 复原《山海经》中的经典神兽,赢取 35 万元现金和实体大奖,获奖作品将获得全网流量曝光,由中央美术学院等权威高校支持。 ,时间为 9 月 3 日 11 月 3 日。一等奖 2 名,奖杯、荣誉证书及 10000 元奖励;二等奖 2 名,奖杯、荣誉证书及 8000 元奖励;三等奖 6 名,奖杯、荣誉证书及 3000 元奖励。 【线上⬆️】 。 【线上⬆️】,时间为 8 月 22 日 9 月 22 日。全球 AI 视觉创意大赛(瓦卡奖 VACAT Vision Arts Created by AI Technology),致力于构建 AI 视觉创意界的“奥斯卡”平台,推动 AI 视觉技术的应用与创新。 ,截止时间为 10 月 31 日。作品提交:sipsac.cn,主题为“潮起东方创益未来”,板块包括美丽世界、文化中国、科技生活,类型有平面、音视频、数字创新,金奖 3 万、银奖 1 万、铜奖 5 千,另外有全场大奖 10 万。 ,截止时间为 2024 年 11 月 10 日。让创意点亮传统,传承经典,一等奖 10000 元,二等奖 5000 元,三等奖 1000 元。 ,作品提交时间为 10.11 11.30,专家评审时间为 12.1 12.9,成果发布时间为 12.10 。 ,时间为 1 月 24 日 2 月 28 日。需用魔搭平台【AIGC 专区】麦橘超然模型作底模训练 LORA 模型,描绘心中理想世界,风格不限。提交 LoRA 及 6 张以上高质量作品,单张图片分辨率不低于 1024x1024 像素,每组作品展现一个世界观场景;避免鲜血、骷髅等敏感元素。一等奖 1 名,奖金 5000 元 + 证书;二等奖 3 名,奖金 3000 元 + 证书;三等奖 10 名,奖金 1000 元 + 证书。魔搭社区 AIGC 代言人奖:作品发小红书带一丹一世界话题并@魔搭 ModelScope 社区官方,浏览量满 800,前 20 名可得 300 元天猫超市卡。
2025-01-30
AIGC和AGI的区别
AIGC(人工智能生成内容)是利用人工智能技术生成各种类型内容的应用方式,包括文字、图像、视频等。它在内容创作、广告、媒体等领域广泛应用。 AGI(通用人工智能)则是一种让机器具备像人类一样的通用智能的目标,能够理解、学习和处理各种不同的任务和领域。 AIGC 侧重于内容的生成,是通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容。而 AGI 追求的是更广泛和通用的智能能力。 例如,AIGC 可以生成文章、艺术作品、短视频等具体的内容形式;AGI 则是期望机器能够像人类一样进行思考、推理、解决复杂的综合性问题等。 总的来说,AIGC 是 AGI 在内容生成方面的一种具体应用,而 AGI 是更宏观和高远的人工智能发展目标。
2025-01-19
什么是AIGC
AIGC 即 AI generated content,又称为生成式 AI,是一种利用人工智能技术生成各种类型内容的应用方式。 AIGC 能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,例如 AI 文本续写、文字转图像的 AI 图、AI 主持人等。其应用领域广泛,包括内容创作、广告、媒体等。 能进行 AIGC 的产品项目和媒介众多。在语言文字类,有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等;在语音声音类,有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等;在图片美术类,有早期的 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了 Midjourney、谷歌的 Disco Diffusion、OpenAI 的 Dalle·2 以及 stability ai 和 runaway 共同推出的 Stable Diffusion 等。 AIGC、UGC 和 PGC 都是内容生成的不同方式。UGC 是由用户生成的内容,反映用户的真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 是由专业人士或机构生成的内容,内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。AIGC 的优势在于可以快速、大规模地生成内容,适用于需要大量内容的场景,如自动化新闻、广告创作等。
2025-01-19
什么是AIGC
AIGC 即 AI generated content,又称为生成式 AI,是一种利用人工智能技术生成各种类型内容的应用方式。 AIGC 能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,其应用领域广泛,包括但不限于内容创作、广告、媒体等。 例如,在文字生成方面,可使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容;在图像生成方面,可使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等;在视频生成方面,可使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 与 UGC(普通用户生产)、PGC(专业用户生产)都是内容生成的不同方式。UGC 是由用户生成的内容,优势在于内容丰富多样,能反映用户真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 是由专业人士或机构生成的内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。 能进行 AIGC 的产品项目众多,媒介也多样。语言文字类有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等;语音声音类有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits;图片美术类有早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火了生成质量很高的 Midjourney、先驱者谷歌的 Disco Diffusion、一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。Stable Diffusion 是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型,代码模型权重已公开发布,当前版本为 2.1 稳定版(2022.12.7),源代码库为 github.com/StabilityAI/stablediffusion。
2025-01-10
AIGC是什么
AIGC 即 AI generated content,又称为生成式 AI,是一种利用人工智能技术生成各种类型内容的应用方式。 这种技术能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容。AIGC 的应用非常广泛,例如 AI 文本续写、文字转图像的 AI 图、AI 主持人等。 在内容生成方面,AIGC 包括文字生成(如使用大型语言模型 GPT 系列模型生成文章、故事、对话等)、图像生成(如使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等)、视频生成(如使用 Runway、KLING 等模型生成动画、短视频等)。 AIGC 与 UGC(普通用户生产)、PGC(专业用户生产)都是内容生成的不同方式。UGC 由用户生成内容,优势在于内容丰富多样,能反映用户真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 由专业人士或机构生成内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。 能进行 AIGC 的产品项目众多,能进行 AIGC 的媒介也很多,包括且不限于: 语言文字类:OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM 都是语言类的。 语音声音类:Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2025-01-08
Ai名词解释
以下是关于 AI 的一些名词解释和相关信息: 名词解释: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理,包括认知、理解、生成等部分 LLM:大型语言模型(Large Language Model),数据规模很大,耗费资金多 机器学习:是人工智能的一个分支,是以机器学习为手段,解决人工智能中的部分问题,涉及多门学科 推理:指利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断 训练:通过大数据训练出一个复杂的神经网络模型,通过大量标记过的数据来训练相应的系统,使其能够适应特定的功能 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未详细说明具体应用)
2024-10-29
AI名词解释
以下是关于 AI 的一些名词解释、相关概念及应用场景: 名词解释: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),即让电脑处理和理解人类语言 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多 机器学习:是人工智能的一个分支,是实现人工智能的途径之一,涉及多门学科,近 30 多年已发展为多领域科际集成。 推理:指利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断。 训练:通过大数据训练出复杂的神经网络模型,用大量标记过的数据训练系统以适应特定功能。 自然语言:自然语言(NLP)的认知和理解是让电脑把输入的语言变成有意义的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言,是人工智能和语言学领域的分支学科,包括认知、理解、生成等部分。 应用场景: 医疗保健:医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未详细说明具体应用)
2024-10-29
必须知道的最常用的名词解释比如GPU、AGI等等、列举出来按照重点排序
以下是按照重点排序的一些常用名词解释: 1. 算力:字面意思是计算能力,可简单理解为 GPU,即电脑里的显卡,购买云服务时,服务商也是购买显卡“租”给用户使用。一张显卡除了 GPU 外,显存也是重要参数。 2. GPU:图形处理器,又称显示核心、视觉处理器、显示芯片,是在个人电脑、工作站、游戏机和一些移动设备上做图像和图形相关运算工作的微处理器。 3. CPU:中央处理器,作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。 4. 显存:也被叫做帧缓存,作用是存储显卡芯片处理过或者即将提取的渲染数据,如同计算机的内存,是用来存储要处理图形信息的部件。
2024-09-13
常见的AI变现途径有哪一些
常见的 AI 变现途径主要包括以下几种: 1. 开发智能体:例如像 May 用 coze 捏了一个口语陪练 bot,并在豆包 APP 上随时使用。 2. AI 绘画相关: 用 AI 制作服装,如单价 239 元的 AI 小绿裙卖了 1160 多份,销售额达 27 万。熟练者可用 sd 或 mj 制作,新手可用 mewxai 或幻火。 用 AI 定制萌娃的头像,单价 19.9 元,卖了 2675 份,销售额达 5 万。 3. 针对特定群体的服务:如针对宝妈群体的婴儿四维彩超 AI 预测,后续还包括头像定制、绘画收徒、宝宝起名字、售胎毛纪念品、母乳纪念品、宝宝出生后的相关产品等。如果懂得私域的精细化运营,做好朋友圈运营,宝妈群体具有超高经济价值。
2025-01-15
常见GPU卡介绍与比较
以下是常见 GPU 卡的介绍与比较: 在选择 GPU 作为 AI 基础设施时,需要考虑多个因素: 训练与推理方面:训练大型 Transformer 模型通常需要在机器集群上完成,最好是每台服务器有多个 GPU、大量 VRAM 以及服务器之间的高带宽连接。许多模型在 NVIDIA H100 上最具成本效益,但获取较难且通常需要长期合作承诺。如今,NVIDIA A100 常用于大多数模型训练。对于大型语言模型(LLM)的推理,可能需要 H100 或 A100,而较小的模型如 Stable Diffusion 则对 VRAM 需求较少,初创公司也会使用 A10、A40、A4000、A5000 和 A6000 甚至 RTX 卡。 内存要求方面:大型 LLM 的参数数量众多,无法由单张卡容纳,需要分布到多个卡中。 硬件支持方面:虽然绝大多数工作负载在 NVIDIA 上运行,但也有公司开始尝试其他供应商,如谷歌 TPU 和英特尔的 Gaudi2,但这些供应商面临的挑战是模型性能高度依赖软件优化。 延迟要求方面:对延迟不太敏感的工作负载可使用功能较弱的 GPU 以降低计算成本,而面向用户的应用程序通常需要高端 GPU 卡来提供实时用户体验。 峰值方面:生成式 AI 公司的需求经常急剧上升,在低端 GPU 上处理峰值通常更容易,若流量来自参与度或留存率较低的用户,以牺牲性能为代价使用较低成本资源也有意义。 此外,算力可以理解为计算能力,在电脑中可直接转化为 GPU,显卡就是 GPU,除了 GPU 外,显存也是重要参数。GPU 是一种专门做图像和图形相关运算工作的微处理器,其诞生是为了给 CPU 减负,生产商主要有 NVIDIA 和 ATI。
2025-01-06
常见GPU卡介绍与比较
以下是常见 GPU 卡的介绍与比较: 在 AI 基础设施的考虑因素中,比较 GPU 时需要关注以下几个方面: 训练与推理: 训练 Transformer 模型除了模型权重外,还需要存储 8 字节的数据用于训练。内存 12GB 的典型高端消费级 GPU 几乎无法用于训练 40 亿参数的模型。 训练大型模型通常在机器集群上完成,最好是每台服务器有多个 GPU、大量 VRAM 以及服务器之间的高带宽连接。 许多模型在 NVIDIA H100 上最具成本效益,但截至目前很难找到在 NVIDIA H100 上运行的模型,且通常需要一年以上的长期合作承诺。如今,更多选择在 NVIDIA A100 上运行大多数模型训练,但对于大型集群,仍需要长期承诺。 内存要求: 大型 LLM 的参数数量太多,任何卡都无法容纳,需要分布到多个卡中。 即使进行 LLM 推理,可能也需要 H100 或 A100。但较小的模型(如 Stable Diffusion)需要的 VRAM 要少得多,初创公司也会使用 A10、A40、A4000、A5000 和 A6000,甚至 RTX 卡。 硬件支持: 虽然绝大多数工作负载都在 NVIDIA 上运行,但也有一些公司开始尝试其他供应商,如谷歌 TPU、英特尔的 Gaudi2。 这些供应商面临的挑战是,模型的性能往往高度依赖于芯片的软件优化是否可用,可能需要执行 PoC 才能了解性能。 延迟要求: 对延迟不太敏感的工作负载(如批处理数据处理或不需要交互式 UI 响应的应用程序)可以使用功能较弱的 GPU,能将计算成本降低多达 3 4 倍。 面向用户的应用程序通常需要高端 GPU 卡来提供引人入胜的实时用户体验,优化模型是必要的,以使成本降低到可管理的范围。 峰值: 生成式 AI 公司的需求经常急剧上升,新产品一经发布,请求量每天增加 10 倍,或者每周持续增长 50%的情况并不罕见。 在低端 GPU 上处理这些峰值通常更容易,因为更多的计算节点可能随时可用。如果这种流量来自于参与度较低或留存率较低的用户,那么以牺牲性能为代价使用较低成本的资源也是有意义的。 此外,算力可以直接转化成 GPU,电脑里的显卡就是 GPU。一张显卡除了 GPU 外,显存也是很重要的参数。GPU 的生产商主要有 NVIDIA 和 ATI。GPU 作为一种专门在个人电脑、工作站、游戏机和一些移动设备上做图像和图形相关运算工作的微处理器,其诞生源自对 CPU 的减负,使显卡减少了对 CPU 的依赖,并进行部分原本 CPU 的工作。
2025-01-06
提示词的常见结构
提示词常见的结构包括以下几种: 1. 视频模型 Vidu 的提示词结构: 基本构成:主体/场景——场景描述——环境描述——艺术风格/媒介。需调整句式和语序,避免主体物过多/复杂、分散的句式描述,避免模糊术语表达,使用流畅准确的口语化措辞,避免过度文学化叙述,丰富、准确和完整的描述以生成特定艺术风格、满足需求的视频。 与画面联想程度的说明:以单帧图像为例,通过具体详实的位置描述/环境描述进行构图,帮助构建画面基本呈现效果;通过艺术风格描述进一步提升效果和氛围,统一画面风格。 2. DALL·E 自动优化提示词结构: 提示词生成指南:强调使用精确、视觉化的描述而非难以捉摸的概念,清晰明确的指示有助于生成高质量图像。 提示词结构:是一个包括媒介、主题、背景、风格特点等多个元素的模板。媒介指定图像应模仿的艺术形式;主题是图像焦点,包括颜色、姿势和视角等;背景描述主题与环境的关系,包括时间、光线方向等;风格特点包括图像的独特艺术特点。还提供了生成图像和提出新想法的具体步骤和要求,默认设置除非另有说明会使用默认宽高比和风格,同时提醒避免使用违反服务条款的词语或概念。 3. Runway 提示词结构: 基本提示:纯文本提示遵循清晰结构,将相机运动、场景和主题的细节划分为单独部分时最有效。非纯文本提示为图片+基本提示词结构,使用输入图像时应专注描述希望在输出中看到的动作,而非图像内容。
2025-01-06
面试AI岗位的,常见面试题
以下是面试 AI 岗位常见的面试题相关内容: 1. 关于 AI 面试官的相关产品: 用友大易 AI 面试产品:具有强大技术底座、高度场景贴合度、招聘全环节集成解决方案、先进防作弊技术和严密数据安全保障,能完成面试、初筛和自动发送面试邀约。 海纳 AI 面试:在线方式自动面试、评估,精准度高达 98%,面试效率提升 5 倍以上,候选人到面率提升最高达 30%。 InterviewAI:在线平台提供面试职位相关问题和 AI 生成的推荐答案,候选人用麦克风回答,会收到评估、建议和得分。使用时需考虑数据安全性和隐私保护问题。 2. 成为“AI 提示词工程师”的岗位技能要求: 市场调研、观察目标群体工作流、创造并拆解需求、选型现有 AI 解决方案做成产品来解决需求、抽象集成互联网 APP 产品、写 PRD、画 APP 产品原型图、组织团队进行 APP 产品开发。 对于零基础小白,建议找网上教程,看科普类教程,阅读 OpenAI 文档,理解参数作用,推荐练手的 Prompt 工具和相关教程文档。 3. AI 产品案例: 销售:话术总结优缺点、定制销售解决方案。 客服:定制客服话术。 HR:团队绩效管理、面试工具。
2024-12-13
AI在办公领域的常见应用有哪些
以下是 AI 在办公领域的一些常见应用: 1. 腾讯文档分类功能:利用数据分析和机器学习,自动分类办公文件,方便管理,市场规模达数亿美元。 2. WPS Office 中的智能排版、语法检查等功能:借助自然语言处理和机器学习,提高办公效率,实现自动化办公流程,市场规模达数十亿美元。 3. 联想设备管理平台:通过数据分析和物联网技术,对企业办公设备进行管理,包括设备状态监测、故障预警、软件更新等,提高设备利用率,市场规模达数亿美元。
2024-11-22