Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

倒推图像关键词

Answer

在图像创作中,倒推图像关键词有以下几种方式和相关要点:

  • 对于图生图功能,除了文本提词框外还有图片输入口,可通过图片给与 AI 创作灵感。随便照一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能通过图片反推出完整含义的句子,DeepBooru 能反推出关键词组。但两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充后调整宽度和高度,使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。
  • 关键词接龙时,将润色后的关键词组合起来形成完整的图像描述,确保每个关键词都能在最终图像中得到体现。
  • 在视频转绘制作中,因为要对所有图片进行转换,关键词编写尽可能描述大概画面即可,推荐的公式是质量词+人物描述+环境描述+Lora。例如赛博风格转绘用到的正向提示词和反向提示词。
Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】真人转二次元?图生图如此强大

[title]【SD】真人转二次元?图生图如此强大作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-02 20:00原文网址:https://mp.weixin.qq.com/s/l-O9vT9-_xzy0uvxnkjV-w相比于文生图,图生图功能除了文本提词框以外还多了一个图片框的输入口,因此,我们还可以通过图片来给与AI创作的灵感。我们随便照一张照片,直接拖入进来。然后可以看到,在文本输入框的旁边有两个反推提示词的按钮:CLIP是可以通过图片反推出完整含义的句子;DeepBooru是可以反推出关键词组。上面的那一张图,我们通过两种反推方式得到的提示词分别为:CLIP——a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art。(一个小男孩坐在长凳上,旁边的地板上放着一辆玩具火车和一辆乐高火车,亚当·雷克斯,详细的产品照片,一张库存照片,莱科艺术,)DeepBooru——shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers。(鞋子,独奏,帽子,橙色背景,黄色背景,微笑,袜子,黑发,坐着,运动鞋)可以看到两种方式生成的提示词都有些瑕疵,比如第一组里面没有描述小孩的穿着,第二组里面没有描述小孩的性别和周围的物品,所以我们需要手动来补充提示词的信息。写好提示词之后,我们再调整一下宽度和高度,让这个红框刚好匹配我们的图片即可。接下来,最重要的是这两个参数:提示词相关性和重绘幅度。

关键词接龙

现在我们将这些润色后的关键词组合起来,形成一个完整的图像描述,确保每个关键词都能在最终的图像中得到体现。例如:中文:我们可以创建一个场景,描述一个韩流风格的猴子在禅宗艺术的背景下,站在险峻的悬崖上,旁边是一座古老的寺庙。这个场景可以用杉本博司的摄影风格来表现,光线是幽灵般的粉红色,整个画面有一种末日后的废墟感。在画面的一角,有一个微笑的脸庞和彩虹热气球,为这个场景增添了一丝乐观和幻想的元素。English:A K-pop monkey perches atop a cliff,framed by zen art and an ancient temple.The composition is captured in the photographic style of Hiroshi Sugimoto,bathed in ethereal pink light amidst post-apocalyptic scenery通过这样的分类、润色和组合,我们可以确保每个关键词都在最终的图像中发挥作用,并且共同创造出一个丰富而有趣的故事。

小田:视频转绘制作视频过程中不可或缺的一环

[title]小田:视频转绘制作视频过程中不可或缺的一环[heading1]一、转绘教程(Ebsynth Utility)[heading2]关键帧转绘图生图测试[heading3]5.1关键词编写因为我们需要做的操作是把所有图片都进行转换所以这里我们关键词尽可能描述出一个大概的画面就可以了。这里我推荐的关键词编写的公式可以是。质量词+人物描述+环境描述+Lora。这里把我的提示词放出来大家可以参考一下我之前赛博风格转绘用到的关键词正向提示词:absurdres,incredibly absurdres,artbook,real,photo,((futurism)),photo_(medium),cyberpunk,1boy,(PERFECT FACE:1.2),white_skin,black hair,slender face,ground vehicle,(helmeted:1.2),hat,jacket,long hair,long sleeves,motor vehicle,shoes,sitting,smile,socks,solo,autolinklora:cyberhelmetv0.7:0.6autolink,autolinklora:cyberpunkAI:0.6autolink,cyberhelmet,autolinklora:GlowingRunesAIv4:0.1autolink,GlowingRunesAI_pink,反向提示词:

Others are asking
图片反推关键词
在图片反推关键词方面: 对于图生图功能,除文本提词框外还有图片输入口,可通过图片给 AI 创作灵感。随便一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组。例如一张小男孩的图片,CLIP 反推的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,DeepBooru 反推的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种方式生成的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度,以及注意提示词相关性和重绘幅度等参数。 第二十一期港风胶片活动中,有利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个墨悠_胶片 lo 的方法 1,上一期活动链接为;还有利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流的方法 2。 在【SD】最强控制插件 ControlNet(6)全局重绘 inpaint 中,有时需要去掉画面中的主体形象,填补复杂背景,可使用 inpaint 重绘功能。先将图放入 WD 1.4 标签器(Tagger)中裁剪保留背景部分,然后反推提示词,如“outdoors,no humans,tree,scenery,grass,sky,cloud,day,blue sky,mountain,road,house,path,building,nature,cloudy sky”,检查无误后发送到文生图中。开启 ControlNet,使用 inpaint 模型涂抹人物部分生成,可调整控制权重和模式。也可尝试图生图中的“局部重绘”功能,但可能效果不佳。
2024-12-14
写一个关于AI面试B端软件的需求文档,里面核心功能包括AI面试功能、背调功能(比如线上、证明人、应聘者提供的材料)、简历筛选关键词功能(比如UI设计里面负责项目包括用户调研、原型设计、需求缝隙、高保真设计、切图)、提取简历证书项目功能(比如初级设计师、建筑设计师、一级建造师)。
以下是为您生成的关于 AI 面试 B 端软件的需求文档: 一、核心功能 1. AI 面试功能 用友大易 AI 面试产品:具有强大技术底座、高度场景贴合度、招聘全环节集成解决方案、先进防作弊技术及严密数据安全保障,能完成面试、初筛并自动发送面试邀约。 海纳 AI 面试:通过在线方式自动面试、评估,精准度高达 98%,面试效率比人工提升 5 倍以上,候选人到面率提升最高达 30%。 InterviewAI:在线平台提供面试职位相关问题及 AI 生成的推荐答案,候选人用设备麦克风回答,每个问题最多回答三次,会收到评估、建议和得分。 2. 背调功能 线上背调。 证明人背调。 对应聘者提供材料的背调。 3. 简历筛选关键词功能 UI 设计方面,负责项目包括用户调研、原型设计、需求缝隙、高保真设计、切图。 4. 提取简历证书项目功能 初级设计师。 建筑设计师。 一级建造师。 二、案例参考 1. HR 相关案例 HR:团队绩效管理,根据团队和个人绩效的往期数据,分析员工绩效排名,输出绩效考评和迭代改进建议。 HR:面试工具,作者开发使用 GPT4 技术的实时转录工具,帮助求职者在面试中生成完美回答。 2. 其他工作场景案例 销售:话术总结优缺点,涵盖产品特点、服务优势等方面。 销售:定制销售解决方案,涉及企业产品和服务内容等方面。 客服:定制客服话术,包含产品知识、使用方法等关键词库。 三、提示词工程师面试经验分享 某岗位面试一面完不到 2 个小时就通知二面,效率较高。 技术面:面试官直接给出同行美妆 GPT 案例,让判断实现方式,应试者提出 C 端优化方案及补充 B 端商业化方案后通过。 BOSS 面:了解学业情况、经历和意向,询问经典问题。
2024-12-02
写一个关于AI面试B端软件的需求文档,里面核心功能包括AI面试功能、背调功能、简历筛选关键词功能、提取简历证书项目功能。
以下是一份关于 AI 面试 B 端软件的需求文档,核心功能包括 AI 面试功能、背调功能、简历筛选关键词功能、提取简历证书项目功能: 一、AI 面试功能 目前市场上有一些相关产品,例如: 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善,到面率比之前提升最高达 30%。 3. InterviewAI:这是一个在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 二、背调功能 (此处可详细描述背调的具体流程、涵盖的内容、数据来源等) 三、简历筛选关键词功能 (说明如何设置关键词、关键词的匹配规则等) 四、提取简历证书项目功能 (阐述如何准确提取简历中的证书和项目信息) 需要注意的是,使用这些产品时,企业需要考虑到数据安全性和隐私保护的问题。
2024-12-02
AI制图关键词
以下是关于 AI 制图关键词的相关内容: 一、图片内容的表现形式 一般分为二维插画和三维立体两种。 二、生成想要的图片的关键结构 1. 主题描述 可以描述场景、故事、元素、物体、人物细节和搭配。 对于场景中的人物,应独立描述,避免长串文字,否则 AI 可能识别不到。 大场景中多个角色的细节不太容易通过关键词生成。 2. 设计风格 可参考风格类关键词或垫图/喂图,让 AI 结合主题描述生成相应风格的图片。 对于某些材质的表现,如透明材质,关键词的运用较为复杂,需针对特定风格进行“咒语测试”。 三、AI 绘画的关键词公式 主题(加下面的)+环境(背景,周围)+气氛(烈日下,雾蒙蒙,恐怖的,风暴席卷的)+灯光(顶光,雾气光,漫反射的,强对比的)+色彩(低饱和度,颜色鲜艳的,花里胡哨的,强反射的主色调,某种颜色是 accent color)+构图(黄金分割,三分法的,电影镜头,广角,鸟瞰图)+风格参考(超清细节的,照片级别的,写实的,抽象的,2D/3D,4k8k,数字雕刻,概念艺术,水墨,水彩,海报,某个软件,某个游戏,艺术家,艺术平台) 四、Midjourney 生成 B 端产品页面的关键词示例 UI components,button,Gucci,ar 16:9(立体按钮) UI components,button,concrete,ar 16:9(低保真线框按钮) UI components,button,drawing,outline,ar 16:9(像素风格按钮) UI components,button,pixel art,ar 16:9 circular HUD interface 通过对 AI 出图的持续探索能发现,Midjourney 在 UI/UX 设计中能发挥的作用上限很高,小到一个图标、组件,大到整个页面、产品,都能带来意想不到的创意灵感。
2024-11-29
可以用AI分析味道的构成么,比如关键词“冬日温暖壁炉” 生成雪松、木炭、火焰、热巧克力等元素
目前的 AI 技术在直接分析味道的构成方面还存在一定的局限性。对于您提到的“冬日温暖壁炉”这样的关键词,要生成雪松、木炭、火焰、热巧克力等与味道相关的元素,虽然有一些基于语义理解和关联的尝试,但还不够精确和全面。 AI 主要擅长处理文本、图像等数据,对于味道这种复杂的感官体验,其分析能力尚有待进一步发展和完善。不过,在某些特定的应用场景中,例如通过对大量与味道相关的描述文本进行学习和分析,AI 可以提供一些相关的推测和联想,但这与直接准确地分析味道的构成还有差距。
2024-11-20
我想根据提问的问题关键词设置自动回复
以下是关于根据提问的问题关键词设置自动回复的相关内容: Apple Intelligence 中各种智能应用的提示词已曝光,存在“/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels”目录下。作为邮件助理,可识别邮件中的相关问题并提供简短回复片段,以 JSON 格式呈现输出,包含问题和答案的字典列表。若邮件无提问则返回空列表。 安仔:Coze AI 机器人对接微信群的疑问解答,包括放行端口、Bot ID、微信账号被封、服务器是否需一直开着、不懂编程能否配置好、配置中遇到问题、为何配置多个前缀触发回复等问题及相应答案。 飞书 5000 人大群内置智能机器人“waytoAGI 知识库智能问答”,基于飞书 aily 搭建。使用时在群里发起话题时,它能自动问答、知识搜索、文档引用、互动教学、更新最新动态、促进社区互动、资源共享、支持多语言问答。
2024-11-18
图像转线稿
以下是关于图像转线稿的相关内容: 在图像转线稿方面,有以下几种方法和流程: 1. 基于真实线稿的背景风格重绘: 可以将图像用蓝色的线连接到 cn 应用。 对于 cn 模型,可以采用深度学习的模型(个人感觉效果更佳),也可以采用“adapterxllineartfp16.safetensors”线稿模型。 对应的生成图片即可。 2. 星流一站式 AI 设计工具中的相关功能: 使用图像控制功能,如空间关系、线稿、人物长相、姿势等,来精准控制生成图像的内容和风格。 入门模式下有多种参考功能,如原图、景深、线稿轮廓、姿势、Lineart 线稿、Scribble 线稿、光影、Segmant 构图分割、SoftEdge 线稿、配色参考、配色打乱、法线贴图、MLSD 线稿等。每种参考功能都有其特定的作用,例如将参考图像转化为深度图以控制人物与背景的纵深关系,将参考图像转化为线稿以控制后续图像生成的轮廓等。 3. 基于 ipadapter 最新工作流“ipadapter_advanced.json”的方法: 工作流中 controlnet 模型(简称“cn”)用来控制 ipadapter 生成的图片。 基于深度学习的重绘,例如将一张黑白素材图片和一张彩色风格图片进行风格迁移完成转绘。 具体步骤包括创建节点加载图片、读取所需风格的图片作为参考图、将图像用蓝色的线连接到 cn 应用(通过 cn 的深度学习模型,如 SDxl 版本)、对要生成的图片进行填写提示词等。 相关资源:作者为 b 站 up 坏心眼猫特效,工作流和模型可参考:
2025-02-15
图像翻译
图像翻译具有以下特点和功能: 多语言支持:涵盖 18 种语言,包括中文、英文、法语、日语、韩语和西班牙语等。 保护图像主体:可选择不翻译品牌名称或重要信息,避免影响关键内容。 高分辨率处理:支持高达 4000×4000 像素的图像,确保翻译后画质清晰。 原始排版恢复:保留原字体、大小及对齐方式,确保设计一致性。 多行文本合并:将多行文本合并为段落翻译,避免逐行翻译造成误解。 清除文本痕迹:翻译后干净移除原文本,并恢复图像空白区域。 此外,以下是一些与图像翻译相关的信息: MangaimageTranslator 能够一键翻译图片文字,具备高效 OCR 和 AI 翻译技术,支持多语言,还能对去文字区域修复上色,重新渲染文本。相关链接:https://github.com/zyddnys/mangaimagetranslator 、https://touhou.ai/imgtrans/ 、https://x.com/imxiaohu/status/1770700877172736238?s=20 。
2025-02-12
一、学习内容 1. AI工具的操作:了解并掌握至少一种AI工具的基本操作,如智能代码、流程管理、智能报表、数据分析、图像识别、文字生成等。 2. AI工具在本职工作的应用:思考并提出AI工具如何帮助你更高效地完成本职工作,包括但不限于提高工作效率、优化工作流程、节约成本、提升交付质量等。 3. AI工具在非本职工作的潜力推演:探索AI工具如何在你的非本职工作领域发挥作用,比如在公司管理、团队领导、跨部门合作、团队发展以及市场研究等方面。提出这些工具如何被有效利用,以及它们可能带来的改
以下是关于学习 AI 的相关内容: 一、AI 工具的操作 要了解并掌握至少一种 AI 工具的基本操作,如智能代码、流程管理、智能报表、数据分析、图像识别、文字生成等。 二、AI 工具在本职工作的应用 思考并提出 AI 工具如何帮助更高效地完成本职工作,包括但不限于提高工作效率、优化工作流程、节约成本、提升交付质量等。 三、AI 工具在非本职工作的潜力推演 探索 AI 工具在非本职工作领域,如公司管理、团队领导、跨部门合作、团队发展以及市场研究等方面的作用,思考如何有效利用这些工具以及它们可能带来的改变。 四、学习路径 1. 对于不会代码的学习者: 20 分钟上手 Python+AI,在 AI 的帮助下可以完成很多基础的编程工作。若想深入,需体系化了解编程及 AI,至少熟悉 Python 基础,包括基本语法(如变量命名、缩进等)、数据类型(如字符串、整数、浮点数、列表、元组、字典等)、控制流(如条件语句、循环语句)、函数(定义和调用函数、参数和返回值、作用域和命名空间)、模块和包(导入模块、使用包)、面向对象编程(类和对象、属性和方法、继承和多态)、异常处理(理解异常、异常处理)、文件操作(文件读写、文件与路径操作)。 2. 新手学习 AI: 了解 AI 基本概念,建议阅读「」部分,熟悉术语和基础概念,浏览入门文章。 开始 AI 学习之旅,在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获证书。 选择感兴趣的模块深入学习,掌握提示词技巧。 实践和尝试,理论学习后通过实践巩固知识,在知识库分享实践作品和文章。 体验 AI 产品,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式。 五、工具推荐 1. Kimi 智能助手:ChatGPT 的国产平替,上手体验好,适合新手入门学习和体验 AI。不用科学网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解做得好,能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。 PC 端: 移动端(Android/ios): 2. 飞书:汇集各类 AI 优质知识库、AI 工具使用实践的效率工具,助力人人成为效率高手。
2025-02-07
试过了些代码,还是缺失一些生成图像的工具。
如果您在生成图像方面缺少工具,以下为您提供一些相关信息: 对于风格调音器:生成一个代码后,您可以使用 Parameter 添加到提示中。了解有关参数的更多信息可参考:https://docs.midjourney.com/parameterlist 。复制您的提示和参数,在页面底部找到您的自定义代码,单击 Copy 按钮复制原始提示和新生成的 style<code>参数。您可以与朋友分享您的 Style Tuner 页面并生成新代码,而无需使用任何额外的 GPU 分钟。返回不和谐,使用该 /imagine 命令并将复制的提示和 style<code>参数粘贴到 prompt 字段中,即可生成您的图像。您还可以使用其他 Midjourney 工具(例如 Upscale、Pan、ZoomOut、Remix 或 VaryRegion)进一步增强图像。 对于 Wojak memecoze 复刻版本:先写一个阴阳怪气的 prompt,原作里面就是把用户输入的职业、人物或者概念去尽量解构,用讽刺风趣的 meme 来解读。生成图片时没有用图像流里面的工具,而是用工作流,调用插件来实现。例如用 ByteArtist 插件里面的 ImageToolPro 工具,将 model_type 选 2,就可以根据用户图片风格进行生成。输入一个参考丑图,比如从 glif 官网别人的作品里面选一个 10241024 的老大爷,将其 url 输入给 image_url。 对于 ComfyUI BrushNet:通俗易懂地说,这个过程有点像小时候玩的连点成图游戏。掩码就像是一张有洞的纸覆盖在图片上,电脑程序通过这些洞了解哪些部分需要修复。编码器是电脑的大脑,它把需要修复的图片转换成电脑能理解和处理的信息。噪声潜在空间为了让修复的部分不那么单调,程序会加入一些随机性,这样修复出来的图片看起来更自然。BrushNet 和冻结的 UNet(Frozen UNet,值预训练好的固定不变的)是处理图片的工具,就像画家的画笔和调色板,帮助电脑细致地完成修复工作。程序会尝试去除不需要的噪声,并最终创建出看起来很真实的图片部分。最后,程序会用一种特殊的技巧,将新生成的图片和原始图片融合在一起。
2025-02-06
AI智能图像生成软件
以下是为您介绍的 AI 智能图像生成软件: 1. Imagen 3: 功能点: 根据用户输入的 Prompt 生成图像。 能自动拆解用户输入的 Prompt,并提供下拉框选项。 提供自动联想功能,帮助用户选择更合适的词汇。 优势: 无需排队,用户可直接使用。 免费使用。 交互人性化,如自动联想和下拉框选项。 具有较好的语义理解能力,能生成符合描述的图像。 灵活性强,用户可根据自动联想调整 Prompt 生成不同图像。 2. 好用的图生图产品: Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,将上传的照片转换为芭比风格,效果好。 3. 藏师傅教您用 AI 三步制作任意公司的周边图片: 流程: 获取 Logo 图片的描述。 根据 Logo 图片的描述和生成意图生成图片提示词。 将图片和提示词输入 Comfyui 工作生成。
2025-01-23
ai图像生成软件
以下是一些 AI 图像生成软件: 1. 根据视频脚本生成短视频的工具: ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架,实现从文字到画面的快速转化。 PixVerse AI:在线 AI 视频生成工具,支持多模态输入转化为视频。 Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 Runway:AI 视频创作工具,能将文本转化为风格化视频内容。 艺映 AI:专注人工智能视频,提供文生视频、图生视频、视频转漫等服务。 2. AI 绘图 Imagen3: 功能点: 图像生成:根据用户输入的 Prompt 生成图像。 Prompt 智能拆解:自动拆解 Prompt,并提供下拉框选项。 自动联想:帮助用户选择更合适的词汇。 优势: 无需排队,可直接使用。 免费使用。 交互人性化,有自动联想和下拉框选项。 语义理解能力较好,能生成符合描述的图像。 灵活性强,用户可根据自动联想调整 Prompt 生成不同图像。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-23