以下模型或工具组合可以实现一键抠图:
需要注意的是,具体的实现效果和操作可能因不同的场景和需求而有所差异。
由于文本类型大语言模型无法直接生成图片,但是我们设计的智能体需要有对应的功能,因此我们要通过【技能】部分的图像流,为文本大模型提供图像生成能力。比如我们的marvin机器人需要有个生成海报的能力,所以我们需要为bot加入图像流,按照下面步骤创建图像流并设定图像流名称以及描述(注意名称只能是英文)[heading3]步骤二:了解图像流节点的意义[content]在图像流编辑界面,左侧的工具栏集合了所有你可能用到的功能。这些工具大致可以分成几类,让我们先了解最常用的部分。智能处理工具包括"智能生成"、"智能抠图"和"画质提升"等,它们可以帮你快速完成一些复杂的图片处理任务。比如你想要去除图片背景,用智能抠图就能一键完成。基础编辑工具则是我们最常用到的。画板、裁剪、调整、添加文字这些功能可以满足日常图片编辑需求。像调整图片大小、裁切形状、加个文字说明这些都可以轻松搞定。如果你想让图片更有创意,可以试试风格处理类的工具。风格迁移能让照片秒变艺术画,背景替换能帮你换个好看的背景,这些都是让图片与众不同的好帮手。别被这么多工具吓到,你不需要一次就掌握所有功能。建议从基础编辑工具开始尝试,熟悉了再去探索其他有趣的功能。每个工具点开就能看到详细设置,同时你可以尝试动手操作看看效果。右侧看起来像一个画布,拖拽左侧的工具或点击+在可以在这里拖放各种工具模块,工具之间可以连接,形成工作流程[heading3]步骤三:根据需求进行图像流设计[content]1.生成海报功能在总结故事后,将完整的故事作为输入2.输入的故事进行一轮提示词优化从自然语言转变为更符合文生图大模型的提示词3.将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报[heading3]步骤四:测试图像流
首先是关于放大算法,如果大家用的都是秋叶大佬的整合包的话,算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”做写实图片,“R-ESRGAN 4x+Anime6B”做二次元图片。但是经常去C站,copy一些别人的作品却老是发现他们用的放大算法是什么“4x-UltraSharp”之类的高级货。那就是因为,这些高端的放大算法,你还没下载。所以,我在这里整理了四款更厉害的放大算法,分别是:“4x-UltraSharp”、“8x_NMKD-Superscale_150000_G”、“8x_NMKD-Typescale_175k”、“16xPSNR”。并将它们放在了云盘里,大家下载之后,将这四款放大算法放入“……\sd-webui-aki-v4.2\models\ESRGAN”这个路径之中,然后重启软件。就可以看到这四款新的放大算法了。我们以这张图作为例子来测试一下,这张图片现在分辨率是512*512。我将这张图发送到后期处理,分别使用一个传统算法“Lanczos”、一个常用算法“R-ESRGAN 4x+Anime6B”,和刚才下载的四个算法做一个对比。图片太小,大家可能看不清细节,我直接来做一下总结。传统放大算法Lanczos对原图没有任何优化,仅仅只是放大像素,直接pass。曾经的王者“R-ESRGAN 4x+Anime6B”表现蛮好的,放大之后,图片有了更多的细节和更清晰的轮廓。但是和新晋放大器“4x-UltraSharp”比起来,还是弱了一些,“4x-UltraSharp”拥有更清晰的细节,而且没有过度锐化的部分。