直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

倒推图像关键词

回答

在图像创作中,倒推图像关键词有以下几种方式和相关要点:

  • 对于图生图功能,除了文本提词框外还有图片输入口,可通过图片给与 AI 创作灵感。随便照一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能通过图片反推出完整含义的句子,DeepBooru 能反推出关键词组。但两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充后调整宽度和高度,使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。
  • 关键词接龙时,将润色后的关键词组合起来形成完整的图像描述,确保每个关键词都能在最终图像中得到体现。
  • 在视频转绘制作中,因为要对所有图片进行转换,关键词编写尽可能描述大概画面即可,推荐的公式是质量词+人物描述+环境描述+Lora。例如赛博风格转绘用到的正向提示词和反向提示词。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】真人转二次元?图生图如此强大

[title]【SD】真人转二次元?图生图如此强大作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-02 20:00原文网址:https://mp.weixin.qq.com/s/l-O9vT9-_xzy0uvxnkjV-w相比于文生图,图生图功能除了文本提词框以外还多了一个图片框的输入口,因此,我们还可以通过图片来给与AI创作的灵感。我们随便照一张照片,直接拖入进来。然后可以看到,在文本输入框的旁边有两个反推提示词的按钮:CLIP是可以通过图片反推出完整含义的句子;DeepBooru是可以反推出关键词组。上面的那一张图,我们通过两种反推方式得到的提示词分别为:CLIP——a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art。(一个小男孩坐在长凳上,旁边的地板上放着一辆玩具火车和一辆乐高火车,亚当·雷克斯,详细的产品照片,一张库存照片,莱科艺术,)DeepBooru——shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers。(鞋子,独奏,帽子,橙色背景,黄色背景,微笑,袜子,黑发,坐着,运动鞋)可以看到两种方式生成的提示词都有些瑕疵,比如第一组里面没有描述小孩的穿着,第二组里面没有描述小孩的性别和周围的物品,所以我们需要手动来补充提示词的信息。写好提示词之后,我们再调整一下宽度和高度,让这个红框刚好匹配我们的图片即可。接下来,最重要的是这两个参数:提示词相关性和重绘幅度。

关键词接龙

现在我们将这些润色后的关键词组合起来,形成一个完整的图像描述,确保每个关键词都能在最终的图像中得到体现。例如:中文:我们可以创建一个场景,描述一个韩流风格的猴子在禅宗艺术的背景下,站在险峻的悬崖上,旁边是一座古老的寺庙。这个场景可以用杉本博司的摄影风格来表现,光线是幽灵般的粉红色,整个画面有一种末日后的废墟感。在画面的一角,有一个微笑的脸庞和彩虹热气球,为这个场景增添了一丝乐观和幻想的元素。English:A K-pop monkey perches atop a cliff,framed by zen art and an ancient temple.The composition is captured in the photographic style of Hiroshi Sugimoto,bathed in ethereal pink light amidst post-apocalyptic scenery通过这样的分类、润色和组合,我们可以确保每个关键词都在最终的图像中发挥作用,并且共同创造出一个丰富而有趣的故事。

小田:视频转绘制作视频过程中不可或缺的一环

[title]小田:视频转绘制作视频过程中不可或缺的一环[heading1]一、转绘教程(Ebsynth Utility)[heading2]关键帧转绘图生图测试[heading3]5.1关键词编写因为我们需要做的操作是把所有图片都进行转换所以这里我们关键词尽可能描述出一个大概的画面就可以了。这里我推荐的关键词编写的公式可以是。质量词+人物描述+环境描述+Lora。这里把我的提示词放出来大家可以参考一下我之前赛博风格转绘用到的关键词正向提示词:absurdres,incredibly absurdres,artbook,real,photo,((futurism)),photo_(medium),cyberpunk,1boy,(PERFECT FACE:1.2),white_skin,black hair,slender face,ground vehicle,(helmeted:1.2),hat,jacket,long hair,long sleeves,motor vehicle,shoes,sitting,smile,socks,solo,autolinklora:cyberhelmetv0.7:0.6autolink,autolinklora:cyberpunkAI:0.6autolink,cyberhelmet,autolinklora:GlowingRunesAIv4:0.1autolink,GlowingRunesAI_pink,反向提示词:

其他人在问
我想要生成一张自己想要的图案,要怎么写关键词
要生成自己想要的图案,写关键词时可以参考以下方法: 1. 对于生成照片,关键词至关重要,输入的关键词越准确,生成的照片越接近脑海中的画面。 2. 常用的输入方式是一个个单词,用英文状态下的逗号隔开。虽然 SD 只能识别英语,但可直接使用翻译。 3. 写关键词有模板,首先可以先写一些照片质量的词语,如“最高质量,超高清画质,大师的杰作,8k 画质”,对应的英文是“Highest quality,ultrahigh definition,masterpieces,8k quality”,这样出来的照片会更加精致。 4. 接着写照片的主体和对主体的细节描写。比如生成一个女孩,可以写“一个女孩,非常精致的五官,极具细节的眼睛和嘴巴,长发,卷发,细腻的皮肤,大眼睛”,翻译成英文是“1girl,very delicate features,very detailed eyes and mouth,long hair,curly hair,delicate skin,big eyes”。 5. 然后描述人物的服装,比如“白色的毛衣、项链(white sweater,necklace)”。 6. 最后写上其他元素,如背景、天气、照片姿势、构图等,比如“在街上,阳光,上半身照片(street,Sunshine,upper body photos)”。 7. 推荐一行一行分开类型去写关键词,每行最后加上英文逗号,避免单词相连。 8. 总结写关键词的公式为:画质+主体+主体细节+人物服装+其他(背景、天气、构图等)。 例如在生成一张男女风格配色一致的插画海报时,关键词可以是“Flat illustration design,a man,black hair,half body,face front,front view,sitting at the table,working,using computer or holding mobile phone,yellow and white clothes,blue solid color background,emoticon pack 6 emoji tables,red and white clothes,multiple poses and expressions,anthropomorphic style,different emotions,multiple poses and expressions,8k ar 3:4 niji 5 style expressive s 180”,并多生成几套挑选,对不满意的区域进行局部重绘。
2024-10-12
AI绘图关键词
以下是关于 AI 绘图关键词的相关内容: 公式: 主题(加下面的)+环境(背景,周围)+气氛(烈日下,雾蒙蒙,恐怖的,风暴席卷的)+灯光(顶光,雾气光,漫反射的,强对比的)+色彩(低饱和度,颜色鲜艳的,花里胡哨的,强反射的主色调,某种颜色是 accent color)+构图(黄金分割,三分法的,电影镜头,广角,鸟瞰图)+风格参考(超清细节的,照片级别的,写实的,抽象的,2D/3D,4k8k,数字雕刻,概念艺术,水墨,水彩,海报,某个软件,某个游戏,艺术家,艺术平台) 比如: 去找自己喜欢的艺术家风格,放到风格参考的关键词里面;去找自己喜欢的灯光风格,放到灯光的关键词里面;去找自己喜欢的颜色和调色板风格,放到色彩的关键词里。 进阶技巧和关键词: 1. 主题描述: 可以描述一个场景和故事以及其组成的元素、一个物体或者人物的细节、搭配。 对于场景中的人物描述,要独立描述,不要用一长串文字,比如一个穿着红色盔甲的男孩站在山顶,最好拆分为一个男孩、穿着红色盔甲、站在山顶。但大场景中多个角色的细节不太容易通过关键词生成。 2. 设计风格: 设计风格难以直接表达时,可以找风格类的关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。 研究玻璃、透明塑料、霓虹色彩等材质的关键词时,单纯控制材质很难达到要求,可能需要加一些设计师风格。目前针对某一种风格需单独进行“咒语测试”。 Midjourney 商业实战案例: 1. 中国武术电影片 关键词:Amazing epic chinese ancient theme,chinese ink style,a young man is preparing to climb the stonesteps ladder,martial arts style,dynamic,expressiveclean lines,cinematic,stunning,realistic lighting andshading,vivid,vibrant,8k,octane render,unrealengine,very detailed,concept art,realistic –ar 16:9 (young man is preparing to climb the stonesteps ladder,)其他的关键词不变,改变这句话创作出不同的场景 2. 长安城夜景 关键词:Chang’an City,Ancient times,BigsceneSea of clouds,an expansive view of,highangle view Soft moonlight,Twinklingstars,cinematic lighting,8k,Virtua engine,detailed,Digital illustration –ar 16:9 3. 中国古代女孩 关键词:(未给出)
2024-10-01
如果我需要一名助手帮我运营跨境电商的线上店铺,我需要一些精准的关键词就可以训练模型吗?
训练模型来协助运营跨境电商线上店铺,仅依靠一些精准的关键词通常是不够的。模型的训练需要多方面的数据和信息,包括但不限于产品的详细描述、客户的评价和反馈、市场趋势、竞争对手的情况等。精准的关键词可以作为其中的一部分输入,但不足以全面有效地训练模型以达到理想的辅助运营效果。
2024-09-19
根据一句话文生视频给出关键词数据的工具
以下是一些根据一句话文生视频给出关键词数据的工具及相关信息: 在 SD 中,图生图功能除文本提词框外还有图片输入口,可通过图片反推提示词,如 CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组,但生成的提示词可能存在瑕疵,需手动补充。 Morphstudio 中,文生视频的提示词指令为:/video。 文字生成视频的 AI 产品有:Pika 擅长动画制作且支持视频编辑;SVD 是 Stable Diffusion 的插件;Runway 是老牌收费工具,提供实时涂抹修改视频功能;Kaiber 能将原视频转换成各种风格;Sora 由 OpenAI 开发,可生成长达 1 分钟以上的视频。更多相关网站可查看。但请注意内容由 AI 大模型生成,请仔细甄别。
2024-09-16
推荐分析PDF文档 提炼标注关键词的AI
以下是一些可以分析 PDF 文档、提炼标注关键词的 AI 产品或方法: 1. DeepL(网站):点击页面“翻译文件”按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部“更多”按钮,选择“制作双语 BPUB 电子书”、“翻译本地 PDF 文件”、“翻译 THML / TXT 文件”、“翻译本地字幕文件”。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件“Ebook Translator”。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译“Document”按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏“文件翻译”,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击“文档翻译”,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方“切换成电子书”,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-14
有没有可以自动翻译pdf文档并生产新pdf,同时自动注释关键词的ai
以下是一些可以自动翻译 PDF 文档并可能具备自动注释关键词功能的 AI 工具: 1. DeepL(网站): ,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): ,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用): ,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页): ,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): ,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-14
怎样按照语义生成图像
按照语义生成图像的方法主要有以下几种: 1. 在 ComfyUI 中: 条件输入:右侧的条件输入包括语义图、文本、已有图像等,表示生成图像时的上下文信息。通过多个节点模块实现,如文本提示,用户可输入文本作为生成图像的主要条件;语义图用于输入图像的语义信息,通过“条件控制”节点实现;已有图像可作为条件输入以指导最终生成的图像。CLIP 模型对图中的文本、语义图等条件信息进行编码,并通过交叉注意力机制引导图像生成。用户可通过文本输入节点、图像输入节点等调整条件及权重以达到特定效果。 编码器和解码器:编码器将输入图像映射到潜在空间,解码器将潜在表示映射回像素空间生成输出图像。在 ComfyUI 中,编码器可以是预训练的扩散模型的一部分,用户可通过加载不同模型或自定义节点实现编码过程,通过“图像输出”节点得到最终生成结果。 2. 在 OpenAI 中: 图像生成端点:允许在给定文本提示的情况下创建原始图像,生成的图像大小可为 256x256、512x512 或 1024x1024 像素,较小尺寸生成速度更快。可使用参数一次请求 1 10 张图像。描述越详细,越有可能获得想要的结果,可探索 DALL·E 预览应用程序中的示例获取更多提示灵感。 图像编辑端点:通过上传蒙版编辑和扩展图像。遮罩的透明区域指示应编辑图像的位置,提示应描述完整的新图像,而不仅仅是擦除区域。上传的图片和遮罩必须是小于 4MB 的正方形 PNG 图片,且尺寸相同。 此外,GPT 4 也具备根据详细说明生成图像的能力,例如生成“一只青蛙跳进银行,问出纳员:你有免费的荷叶吗?出纳员回答:没有,但我们提供低利息的池塘升级贷款”的 2D 图像,以及“一个由浮岛、瀑布和桥梁组成的幻想景观,天空中有一只飞龙和一个位于最大岛上的城堡”的 3D 模型,并能完成添加、重新定位、重新着色对象和改变飞龙轨迹等任务。
2024-10-18
国内可直接编辑或创建图像文件的最好用AI有哪些?
以下是一些国内可直接编辑或创建图像文件且好用的 AI 工具: 1. 无界 AI:可用于快速制作海报底图,并完成主题海报排版。操作流程包括确定主题与文案、选择风格与布局、生成与筛选、配文与排版。 2. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具有细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,可将上传的照片转换为芭比风格。 6. 可灵:由快手团队开发,用于生成高质量的图像和视频,但价格相对较高。 7. 通义万相:在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,生成图像质量较高,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可。但存在一定局限性,如某些类型的图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。
2024-10-15
如何用ai进行图像算法识别
以下是关于 AI 在图像算法识别方面的相关内容: 在图像识别方面,AI 技术自身带来的造假难题可由其自身的同僚互鉴打假来解决。目前已有不少网站通过对大量图片数据的抓取和分析,给出对画作属性的判断可能性,例如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中,可能存在一些问题,如结构严谨的真实摄影作品会被误识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 另外,CNN(卷积神经网络)的结构基于两类细胞的级联模型,主要用于模式识别任务,在计算上更有效、快速,已应用于自然语言处理和图像识别等领域。 在汽车行业,AI 也有广泛应用: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,实现自主导航和驾驶,如特斯拉、Waymo 和 Cruise 等公司在开发和测试。 2. 车辆安全系统:用于增强自动紧急制动、车道保持辅助和盲点检测等系统的性能。 3. 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置。 4. 预测性维护:分析车辆实时数据预测潜在故障和维护需求。 5. 生产自动化:用于汽车制造的生产线自动化,提高效率和质量控制。 6. 销售和市场分析:帮助汽车公司分析市场趋势、消费者行为和销售数据。 7. 电动化和能源管理:优化电动汽车的电池管理和充电策略。 8. 共享出行服务:优化路线规划、车辆调度和定价策略。 9. 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant 等。 10. 车辆远程监控和诊断:提供实时诊断和支持。
2024-10-15
用ai进行图像识别
AI 在图像识别方面的应用较为广泛,以下为您介绍一些相关内容: 在自动驾驶技术中,利用 AI 进行图像识别、传感器数据分析和决策制定,使自动驾驶汽车能够自主导航和驾驶,如特斯拉(Tesla)、Waymo 和 Cruise 等公司都在开发和测试自动驾驶汽车。 BERT 理念被应用于机器视觉领域,通过将图片分割处理,ViT 模型得以实现图像识别。 在深度学习中,图像识别实际是将图片转化为大量的图像单个像素点 RGB 值作为输入,再大量标注输出,形成神经网络。
2024-10-15
ai图像识别
以下是关于 AI 图像识别的相关内容: 判断一张图片是否为 AI 生成的方法: 通过画面风格、物品 bug 等细节进行辨别。但需注意,AI 在不断修正作图 bug,相关方法可能随时失效。 利用专门的网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来判断,但可能存在误判,如将结构严谨的真实摄影作品识别为 AI 作图。 关于鉴别 AIGC 的讨论: 培养鉴别 AI 生成图片的技能需要训练大脑模型。 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 另外,人工智能在汽车行业有广泛应用: 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定。 车辆安全系统:如自动紧急制动、车道保持辅助和盲点检测等。 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置。 预测性维护:分析车辆实时数据预测潜在故障和维护需求。 生产自动化:用于汽车制造的自动化生产线。 销售和市场分析:分析市场趋势、消费者行为和销售数据。 电动化和能源管理:优化电动汽车电池管理和充电策略。 共享出行服务:优化路线规划、调度车辆和定价策略。 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant 等。 车辆远程监控和诊断:远程监控车辆状态并提供实时诊断和支持。
2024-10-15
请阐述对比学习在图像分类和检测中的应用
在计算机视觉中,对比学习在图像分类和检测中有重要应用。 图像分类方面:图像分类是根据图像中的语义信息对不同类别的图像进行区分。对比学习通过让模型学习区分相似和不同的图像样本,从而更好地捕捉图像中的语义特征,提高分类的准确性。 目标检测方面:目标检测需要找出图像或视频中的目标物体,并检测出其位置和大小。对比学习可以帮助模型学习到更具判别性的特征表示,从而更准确地定位和识别目标物体。在多类别目标检测中,对比学习有助于区分不同类别的物体,提高检测的精度和效率。 总之,对比学习为图像分类和检测任务提供了有效的特征学习方法,有助于提升计算机视觉系统的性能。
2024-10-15