以下是关于 AI 绘图换背景的相关内容:
在 Google 的 Gemini 文生图测试中,其能够在短时间内出色地完成抠图、换背景、打光影等工作。例如,无中生有地换背景效果非常好,商业级别的背景合成与打光也能在 10 秒内取得稳定且令人满意的结果。
在使用【SD】进行商业换装时,也可以给人物换背景。先启用 GroundingDINO 模型获取更精确的蒙版,如眼睛或配饰等部分。然后选择想要修改的蒙版,添加相关提示词和设置,如选择大模型、正向提示词、蒙版模式等,就能够生成换背景后的图片。如果效果不太理想,还可以进行进一步的细化和修复。
在【PS】中,通过选择主体和移除背景的功能,结合创成式填充和添加提示词,可以实现背景的替换。但对于颜色复杂的部分,可能需要手动创建选区以获得更精准的效果。
我发誓,这是本文最后一个工业设计的Case了,后面还有游戏设计、自媒体应用等更多元的Case,一个比一个精彩。⬇️我其实一贯AI评测挺克制的,但在测试Gemini文生图的4小时内,基本每分钟都在发出粗鄙的感慨……这个Case就是进一步模拟工业设计的造型推敲环节。原本我们会需要大量的时间在犀牛(一套工业设计建模软件)中花数天时间建模,再花数天在keyshot(一套工业设计渲染软件)中调整材质、打光出图。而且一旦建模完成后,想要再对模型进行造型调整,简直是对设计师无尽的折磨。现在,Gemini在20s内就给你一次性生成12张🥲……[heading2]主测试4:抠图、换背景、打光影[content]搞定了产品设计,正常商业流程中,我们还要解决一下最终宣发的物料问题。这时候离不开抠图、换背景、打光影拍照的工作流程。先抠个图,无中生有地换背景:没问题,换的非常好。再看看商业级别的背景合成与打光:再引用一个WaytoAGI上看到的例子:绝了,每次都只用一句嘴炮,就能在10s内取得相当稳定的预期结果。甚至复杂的形体打光,也能做的有模有样。OK,fine,测到这里,我只想说:——大碳奸恭迎硅基老爷重塑人类社会。
但有的时候,我们需要更精确一点的蒙版,比如人物的眼睛,或者是身上的配饰等等。单靠SAM模型就很难得到想要的蒙版了,这个时候我们就需要使用到segment anything中的GroundingDINO了。启用GroundingDINO,AI会自动下载模型,此时会需要用魔法,没有魔法的同学可以去我的云盘直接下载。放到这个文件目录下“……sd-webui-aki-v4.2\extensions\sd-webui-segment-anything\models\grounding-dino”点击启用,在检测提示词中输入“eye”,AI就可以根据语义分割帮我们自动检测出眼睛的部分,并设置好蒙版。我们还可以通过预览箱体,来得到两只眼睛的编号,通过编号可以选择调整单一的眼睛。比如,我只想调整左边那只眼睛,我就只需要勾选1就可以了。和刚才一样,选择我们想要修改的蒙版,上传到重绘蒙版当中。添加提示词“闭眼”。点击生成,可以看到图片就修改好了。我们再来给人物换个背景试试,加载刚才生成的背景蒙版。大模型选择revAnimated_v122,正向提示词:简单背景、花、国画、工笔。蒙版模式选择“重绘非蒙版内容”。得到这张图片,头发的部分没有抠太好。我们将它再次放入图生图中,使用tile模型做一次整体细化,除了融合人物之外,还能给人物的衣服也添加上国风元素。生成,人物好像变得高级了一些。来到PS,使用创成式填充修复一下头发。完成啦。
计算完成后,运算结果会生成一个新的图层,并且产生三种变化可供选择。可以看到移除效果比上面两种要好得多,轮胎和线都修补上了。水印去掉之后,这张照片还有一个小遗憾,就是左脚没有拍完整,不知道运用“创成式填充”能不能让PS脑补出来,毕竟这种对未知信息的想象才是真正考验AI算力的地方。我首先用裁剪工具扩大了画布尺寸,给PS一个计算的空间。用选区框选空白区域,还是使用“创成式填充”,不填写任何提示词。稍等一会之后,ps就帮我补出了另一部分的鞋子、轮胎跑道和背景的树,对比生成的三张备选图,感觉第三幅是最自然的。当然,如果你使用的时候,对于生成的三张都不喜欢,也可以点击这个“生成”按钮出下一批图。这样,这张照片就修补好了,效果很不错,而且主要是速度快、操作简单。再试一试背景替换,选择了一张我在出发板上拍摄的照片。下方有一个一键选择主体和移除背景。看一下选取结果,对于颜色复杂的部分抠图还是不太精准,有很多残缺的地方。所以,还是需要用传统方法手动创建一下选区。反选选区,重新创建背景,来到“创成式填充”,添加“花园小径”文本提示词,点击生成。能看到路径的透视是可以随着主体进行联想的。更改提示词“光滑的瓷砖,教堂,倒影”,看一下倒影的感觉,似乎有,但又不完全有。