直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

倒推图像关键词

回答

在图像创作中,倒推图像关键词有以下几种方式和相关要点:

  • 对于图生图功能,除了文本提词框外还有图片输入口,可通过图片给与 AI 创作灵感。随便照一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能通过图片反推出完整含义的句子,DeepBooru 能反推出关键词组。但两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充后调整宽度和高度,使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。
  • 关键词接龙时,将润色后的关键词组合起来形成完整的图像描述,确保每个关键词都能在最终图像中得到体现。
  • 在视频转绘制作中,因为要对所有图片进行转换,关键词编写尽可能描述大概画面即可,推荐的公式是质量词+人物描述+环境描述+Lora。例如赛博风格转绘用到的正向提示词和反向提示词。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】真人转二次元?图生图如此强大

[title]【SD】真人转二次元?图生图如此强大作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-02 20:00原文网址:https://mp.weixin.qq.com/s/l-O9vT9-_xzy0uvxnkjV-w相比于文生图,图生图功能除了文本提词框以外还多了一个图片框的输入口,因此,我们还可以通过图片来给与AI创作的灵感。我们随便照一张照片,直接拖入进来。然后可以看到,在文本输入框的旁边有两个反推提示词的按钮:CLIP是可以通过图片反推出完整含义的句子;DeepBooru是可以反推出关键词组。上面的那一张图,我们通过两种反推方式得到的提示词分别为:CLIP——a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art。(一个小男孩坐在长凳上,旁边的地板上放着一辆玩具火车和一辆乐高火车,亚当·雷克斯,详细的产品照片,一张库存照片,莱科艺术,)DeepBooru——shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers。(鞋子,独奏,帽子,橙色背景,黄色背景,微笑,袜子,黑发,坐着,运动鞋)可以看到两种方式生成的提示词都有些瑕疵,比如第一组里面没有描述小孩的穿着,第二组里面没有描述小孩的性别和周围的物品,所以我们需要手动来补充提示词的信息。写好提示词之后,我们再调整一下宽度和高度,让这个红框刚好匹配我们的图片即可。接下来,最重要的是这两个参数:提示词相关性和重绘幅度。

关键词接龙

现在我们将这些润色后的关键词组合起来,形成一个完整的图像描述,确保每个关键词都能在最终的图像中得到体现。例如:中文:我们可以创建一个场景,描述一个韩流风格的猴子在禅宗艺术的背景下,站在险峻的悬崖上,旁边是一座古老的寺庙。这个场景可以用杉本博司的摄影风格来表现,光线是幽灵般的粉红色,整个画面有一种末日后的废墟感。在画面的一角,有一个微笑的脸庞和彩虹热气球,为这个场景增添了一丝乐观和幻想的元素。English:A K-pop monkey perches atop a cliff,framed by zen art and an ancient temple.The composition is captured in the photographic style of Hiroshi Sugimoto,bathed in ethereal pink light amidst post-apocalyptic scenery通过这样的分类、润色和组合,我们可以确保每个关键词都在最终的图像中发挥作用,并且共同创造出一个丰富而有趣的故事。

小田:视频转绘制作视频过程中不可或缺的一环

[title]小田:视频转绘制作视频过程中不可或缺的一环[heading1]一、转绘教程(Ebsynth Utility)[heading2]关键帧转绘图生图测试[heading3]5.1关键词编写因为我们需要做的操作是把所有图片都进行转换所以这里我们关键词尽可能描述出一个大概的画面就可以了。这里我推荐的关键词编写的公式可以是。质量词+人物描述+环境描述+Lora。这里把我的提示词放出来大家可以参考一下我之前赛博风格转绘用到的关键词正向提示词:absurdres,incredibly absurdres,artbook,real,photo,((futurism)),photo_(medium),cyberpunk,1boy,(PERFECT FACE:1.2),white_skin,black hair,slender face,ground vehicle,(helmeted:1.2),hat,jacket,long hair,long sleeves,motor vehicle,shoes,sitting,smile,socks,solo,autolinklora:cyberhelmetv0.7:0.6autolink,autolinklora:cyberpunkAI:0.6autolink,cyberhelmet,autolinklora:GlowingRunesAIv4:0.1autolink,GlowingRunesAI_pink,反向提示词:

其他人在问
AI生成视频的关键词
以下是关于 AI 生成视频的相关信息: ChatGPT 生成视频脚本:您可以设定自己为深受年轻人喜欢的电影导演,创作一个约 1 分钟、内容为山海经中的神兽在赛博朋克世界的宣传视频脚本。过程中可与 ChatGPT 讨论、修改细节并撰写宣传文案,把控核心内容以优化脚本。 文字生成视频的 AI 产品: Pika:擅长动画制作,支持视频编辑。 SVD:可在 Stable Diffusion 基础上安装使用,能在图片基础上生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多产品可查看。 进阶技巧和关键词: 主题描述:可描述场景、故事、元素、物体或人物细节等。若描述场景中的人物,建议独立描述,避免长串文字,否则 AI 可能识别不到。 设计风格:可参考风格类关键词或垫图/喂图,让 AI 结合主题描述生成相应风格图片。对于材质的描述,如玻璃、透明塑料、霓虹色彩等,关键词的运用较为复杂,需针对特定风格进行“咒语测试”。
2024-11-05
我想要生成一张自己想要的图案,要怎么写关键词
要生成自己想要的图案,写关键词时可以参考以下方法: 1. 对于生成照片,关键词至关重要,输入的关键词越准确,生成的照片越接近脑海中的画面。 2. 常用的输入方式是一个个单词,用英文状态下的逗号隔开。虽然 SD 只能识别英语,但可直接使用翻译。 3. 写关键词有模板,首先可以先写一些照片质量的词语,如“最高质量,超高清画质,大师的杰作,8k 画质”,对应的英文是“Highest quality,ultrahigh definition,masterpieces,8k quality”,这样出来的照片会更加精致。 4. 接着写照片的主体和对主体的细节描写。比如生成一个女孩,可以写“一个女孩,非常精致的五官,极具细节的眼睛和嘴巴,长发,卷发,细腻的皮肤,大眼睛”,翻译成英文是“1girl,very delicate features,very detailed eyes and mouth,long hair,curly hair,delicate skin,big eyes”。 5. 然后描述人物的服装,比如“白色的毛衣、项链(white sweater,necklace)”。 6. 最后写上其他元素,如背景、天气、照片姿势、构图等,比如“在街上,阳光,上半身照片(street,Sunshine,upper body photos)”。 7. 推荐一行一行分开类型去写关键词,每行最后加上英文逗号,避免单词相连。 8. 总结写关键词的公式为:画质+主体+主体细节+人物服装+其他(背景、天气、构图等)。 例如在生成一张男女风格配色一致的插画海报时,关键词可以是“Flat illustration design,a man,black hair,half body,face front,front view,sitting at the table,working,using computer or holding mobile phone,yellow and white clothes,blue solid color background,emoticon pack 6 emoji tables,red and white clothes,multiple poses and expressions,anthropomorphic style,different emotions,multiple poses and expressions,8k ar 3:4 niji 5 style expressive s 180”,并多生成几套挑选,对不满意的区域进行局部重绘。
2024-10-12
AI绘图关键词
以下是关于 AI 绘图关键词的相关内容: 公式: 主题(加下面的)+环境(背景,周围)+气氛(烈日下,雾蒙蒙,恐怖的,风暴席卷的)+灯光(顶光,雾气光,漫反射的,强对比的)+色彩(低饱和度,颜色鲜艳的,花里胡哨的,强反射的主色调,某种颜色是 accent color)+构图(黄金分割,三分法的,电影镜头,广角,鸟瞰图)+风格参考(超清细节的,照片级别的,写实的,抽象的,2D/3D,4k8k,数字雕刻,概念艺术,水墨,水彩,海报,某个软件,某个游戏,艺术家,艺术平台) 比如: 去找自己喜欢的艺术家风格,放到风格参考的关键词里面;去找自己喜欢的灯光风格,放到灯光的关键词里面;去找自己喜欢的颜色和调色板风格,放到色彩的关键词里。 进阶技巧和关键词: 1. 主题描述: 可以描述一个场景和故事以及其组成的元素、一个物体或者人物的细节、搭配。 对于场景中的人物描述,要独立描述,不要用一长串文字,比如一个穿着红色盔甲的男孩站在山顶,最好拆分为一个男孩、穿着红色盔甲、站在山顶。但大场景中多个角色的细节不太容易通过关键词生成。 2. 设计风格: 设计风格难以直接表达时,可以找风格类的关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。 研究玻璃、透明塑料、霓虹色彩等材质的关键词时,单纯控制材质很难达到要求,可能需要加一些设计师风格。目前针对某一种风格需单独进行“咒语测试”。 Midjourney 商业实战案例: 1. 中国武术电影片 关键词:Amazing epic chinese ancient theme,chinese ink style,a young man is preparing to climb the stonesteps ladder,martial arts style,dynamic,expressiveclean lines,cinematic,stunning,realistic lighting andshading,vivid,vibrant,8k,octane render,unrealengine,very detailed,concept art,realistic –ar 16:9 (young man is preparing to climb the stonesteps ladder,)其他的关键词不变,改变这句话创作出不同的场景 2. 长安城夜景 关键词:Chang’an City,Ancient times,BigsceneSea of clouds,an expansive view of,highangle view Soft moonlight,Twinklingstars,cinematic lighting,8k,Virtua engine,detailed,Digital illustration –ar 16:9 3. 中国古代女孩 关键词:(未给出)
2024-10-01
如果我需要一名助手帮我运营跨境电商的线上店铺,我需要一些精准的关键词就可以训练模型吗?
训练模型来协助运营跨境电商线上店铺,仅依靠一些精准的关键词通常是不够的。模型的训练需要多方面的数据和信息,包括但不限于产品的详细描述、客户的评价和反馈、市场趋势、竞争对手的情况等。精准的关键词可以作为其中的一部分输入,但不足以全面有效地训练模型以达到理想的辅助运营效果。
2024-09-19
根据一句话文生视频给出关键词数据的工具
以下是一些根据一句话文生视频给出关键词数据的工具及相关信息: 在 SD 中,图生图功能除文本提词框外还有图片输入口,可通过图片反推提示词,如 CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组,但生成的提示词可能存在瑕疵,需手动补充。 Morphstudio 中,文生视频的提示词指令为:/video。 文字生成视频的 AI 产品有:Pika 擅长动画制作且支持视频编辑;SVD 是 Stable Diffusion 的插件;Runway 是老牌收费工具,提供实时涂抹修改视频功能;Kaiber 能将原视频转换成各种风格;Sora 由 OpenAI 开发,可生成长达 1 分钟以上的视频。更多相关网站可查看。但请注意内容由 AI 大模型生成,请仔细甄别。
2024-09-16
推荐分析PDF文档 提炼标注关键词的AI
以下是一些可以分析 PDF 文档、提炼标注关键词的 AI 产品或方法: 1. DeepL(网站):点击页面“翻译文件”按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部“更多”按钮,选择“制作双语 BPUB 电子书”、“翻译本地 PDF 文件”、“翻译 THML / TXT 文件”、“翻译本地字幕文件”。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件“Ebook Translator”。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译“Document”按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏“文件翻译”,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击“文档翻译”,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方“切换成电子书”,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-14
AI 图像识别的发展历程
AI 图像识别的发展历程如下: 早期处理印刷体图片的方法是将图片变成黑白、调整为固定尺寸,与数据库对比得出结论,但这种方法存在多种字体、拍摄角度等例外情况,且本质上是通过不断添加规则来解决问题,不可行。 神经网络专门处理未知规则的情况,如手写体识别。其发展得益于生物学研究的支持,并在数学上提供了方向。 CNN(卷积神经网络)的结构基于大脑中两类细胞的级联模型,在计算上更高效、快速,在自然语言处理和图像识别等应用中表现出色。 ImageNet 数据集变得越来越有名,为年度 DL 竞赛提供了基准,在短短七年内使获胜算法对图像中物体分类的准确率从 72%提高到 98%,超过人类平均能力,引领了 DL 革命,并开创了新数据集的先例。 2012 年以来,在 Deep Learning 理论和数据集的支持下,深度神经网络算法大爆发,如卷积神经网络(CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等,每种都有不同特性。例如,递归神经网络是较高层神经元直接连接到较低层神经元;福岛邦彦创建的人工神经网络模型基于人脑中视觉的运作方式,架构基于初级视觉皮层中的简单细胞和复杂细胞,简单细胞检测局部特征,复杂细胞汇总信息。
2024-11-14
目前国外主流的图像类AICG应用有哪些
目前国外主流的图像类 AICG 应用包括 DALL·E2、StableDiffusion 等。DALL·E2 能够根据输入的文本描述生成逼真且富有创意的图像;StableDiffusion 则以其强大的生成能力和广泛的自定义选项受到众多用户的青睐。
2024-11-13
目前国外主流的十大图像类AICG应用有哪些
目前关于国外主流的十大图像类 AICG 应用,暂时没有确切和权威的统一排名。不同的评估标准和应用场景可能会导致结果有所差异。一些常见且受到广泛关注的图像类 AICG 应用包括 DALL·E2、StableDiffusion、Midjourney 等,但要确切指出十大应用会因各种因素而难以确定。
2024-11-13
目前国外主流的图像类AICG应用有哪些
目前国外主流的图像类 AICG 应用包括 DALL·E2、StableDiffusion 等。DALL·E2 能够根据输入的文本描述生成逼真的图像;StableDiffusion 则具有强大的图像生成能力和丰富的自定义选项。
2024-11-13
我有一份PPT,我想对这个PPT进行图像设计等美观化处理,怎么来做?使用哪个工具好?
以下为您介绍一些可用于对 PPT 进行图像设计等美观化处理的工具及相关信息: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 在对 PPT 进行排版时,工具的选择可根据个人顺手程度决定,对于打工人来说,PPT 是较为熟练的选择。关于尺寸问题,如果想要打印,4:3 的比例比较适合童书绘本的比例,出图时可按此比例,文字可直接排版到画面上;若出图为 16:9 横板,排版时 4:3 可把文字放在图片下面。若要发小红书或者小绿书,竖版更合适,比例选 3:4,出图也选竖版。制作 H5 时,出图选竖版,比例选 9:16。所有排版尺寸在 PPT 里都可以选。另外,PPT 里的删除背景功能对于基础抠图很有用。用 PPT 另存为图片时,直接选 jpg 或 png 格式会降低图片清晰度,可先另存为“增强型 Windows 源文件”格式,再用画图软件打开另存为 JPG 以得到高清图。
2024-11-12
我想生成有具体建筑的图像设计,如夫子庙,而不是古风建筑,怎么表述,让AI理解
要让 AI 准确理解您想要生成具有特定建筑(如夫子庙)的图像设计,而非一般的古风建筑,您可以这样表述:“生成一幅清晰、逼真的夫子庙图像设计,展现其独特的建筑风格和细节,包括庙宇的屋顶结构、墙壁装饰、门窗样式等,要突出夫子庙的特色元素,如特定的牌匾、雕刻、飞檐等,背景可以是适当的自然景观或周边的街道场景。”
2024-11-11