Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

放大图片

Answer

在 AI 绘画领域,放大图片有以下相关知识:

Midjourney 中放大图片的方法

  • 使用 /imagine 命令生成低分辨率图像选项网格,每个图像网格下方的按钮可用于创建图像的变体、升级图像或重新运行最后一个 Midjourney Bot 操作。
    • U1U2U3U4 按钮将图像与图像网格分开,使用旧版 Midjourney 模型版本时,U 按钮会放大图像,生成所选图像的更大版本并添加更多细节。
    • 重做(重新滚动)按钮重新运行作业。
    • V1V2V3V4V 按钮创建所选网格图像的增量变化。
    • 制作变体:创建放大图像的变体并生成包含四个选项的新网格。网页:在Midjourney.com上打开图库中的图像,最喜欢的:标记您最好的图像,以便在 Midjourney 网站上轻松找到它们。
  • 直接消息:如果#general 或#newbie 频道进展太快,Midjourney 订阅者可以在其 Discord 直接消息中与 Midjourney 机器人进行一对一的合作。
  • 使用 Midjourney Vary Region 编辑器选择并重新生成放大图像的特定部分。Vary(Region)按钮会在中途图像放大后出现,区域差异由原始图像中的内容和您选择的区域决定,与 Midjourney 模型版本 V5.0、V5.1、V5.2、niji 5 兼容。具体操作步骤如下:
    1. 生成图像:使用命令创建图像/imagine。
    2. 升级图像:使用 U 按钮放大所选图像。
    3. 选择不同区域:点击🖌️Vary(Region)按钮,打开编辑界面。
    4. 选择要再生的区域:选择编辑器左下角的手绘或矩形选择工具,选择要重新生成的图像区域。注意选择的大小会影响结果,更大的选择为 Midjourney 机器人提供更多空间来生成新的创意细节,较小的选择将导致更小、更微妙的变化。无法编辑现有选择,但可以使用右上角的撤消按钮撤消多个步骤。
    5. 提交您的工作:单击 Submit→按钮将您的请求发送到 Midjourney Bot。
    6. 查看结果:中途机器人将处理您的作业并在您选择的区域内生成一个新的变化图像网格。

Stable Diffusion 中放大图片的相关设置

  • 文生图是仅通过正反向词汇描述来发送指令。在进行文本描述时,分为内容型提示词和标准化提示词,内容型提示词主要用于描述想要的画面。
  • 采样迭代步数通常数值控制在 20 - 40 之间,步数越高绘画越清晰,但绘画速度也会越慢。
  • 采样方法一般常用的为:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。有的模型会有指定的算法,搭配起来更好用。
  • 将比例设置为 800:400,注意尺寸并非越大越好,模型的练图基本上都是按照 512x512 的框架去画,高宽比尽量在这个数值附近。太大的数值比如 1920x1080,会使 AI 做出很奇怪的构图。若想要高清的图,可以同时点选高清修复来放大图像倍率,高宽比主要是控制一个画面比例。
Content generated by AI large model, please carefully verify (powered by aily)

References

MJ手册·如何使用MJ

该/imagine命令根据您的提示生成低分辨率图像选项网格。使用每个图像网格下方的按钮创建图像的变体、升级图像或重新运行最后一个Midjourney Bot操作。[heading3]高档纽扣[content]U1U2U3U4按钮将图像与图像网格分开,使您可以轻松下载该图像或使用其他工具,例如[“缩小”](https://docs.midjourney.com/docs/zoom-out)或[“平移”](https://docs.midjourney.com/docs/pan)。使用旧版Midjourney模型版本时,U按钮会[放大](https://docs.midjourney.com/legacy/docs/upscalers)图像,生成所选图像的更大版本并添加更多细节,这会使用快速GPU时间。[heading3]重做[content]🔄重做(重新滚动)按钮重新运行作业。在这种情况下,它将重新运行原始提示,生成新的图像网格。[heading3]变化按钮[content]V1V2V3V4V按钮创建所选网格图像的增量[变化。](https://docs.midjourney.com/docs/variations)创建变体会生成与所选图像的整体风格和构图相似的新图像网格。[heading1]放大图像[content]🪄Make VariationsWeb↗️❤️Favorite制作变体:创建放大图像的变体并生成包含四个选项的新网格。网页:在[Midjourney.com](https://www.midjourney.com/home/)上打开图库中的图像最喜欢的:标记您最好的图像,以便在Midjourney网站上轻松找到它们。[heading1]直接消息[content]如果#general或#newbie频道进展太快,Midjourney订阅者可以在其Discord直接消息中与Midjourney机器人进行一对一的合作。[了解如何向中途机器人直接发送消息](https://docs.midjourney.com/docs/direct-messages)

Vary (Region)不同区域

该Vary(Region)按钮会在中途图像放大后[出现](https://docs.midjourney.com/upscalers)。区域差异由原始图像中的内容和您选择的区域决定。[与Midjourney模型版本](https://docs.midjourney.com/models)、、和Vary(Region)兼容V5.0V5.1V5.2niji 5[heading1]如何使用不同区域[heading2]1.生成图像[content]使用命令创建图像/imagine。[heading2]2.升级图像[content]使用U按钮放大所选图像。[heading2]3.选择不同区域[content]点击🖌️Vary(Region)按钮,打开编辑界面。[heading2]4.选择要再生的区域[content]●选择编辑器左下角的手绘或矩形选择工具。●选择要重新生成的图像区域。○您选择的大小将影响您的结果。更大的选择为中途机器人提供了更多空间来生成新的创意细节。较小的选择将导致更小、更微妙的变化。注意:您无法编辑现有选择,但可以使用右上角的撤消按钮撤消多个步骤。[heading2]5.提交您的工作[content]单击Submit→按钮将您的请求发送到Midjourney Bot。现在可以关闭Vary Region编辑器,并且在处理作业时您可以返回Discord。注意🖌️Vary(Region)您可以多次使用放大图像下方的按钮来尝试不同的选择。您之前的选择将被保留。您可以继续添加到此现有选择或使用undo按钮清除您的选择。[heading2]6.查看结果[content]中途机器人将处理您的作业并在您选择的区域内生成一个新的变化图像网格。[heading1]不同区域的示例[content]放大图像提示:彩色糖果胸针选择结果放大图像提示:房屋建筑图选择结果

【SD】文生图怎么写提示词

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-01 20:00原文网址:https://mp.weixin.qq.com/s/kwNfc9NCaKJRy30wHI95UgStable Diffusion的生成方式主要分为文生图和图生图两种:文生图是仅通过正反向词汇描述来发送指令;图生图除了可以添加文字以外,还可以给AI参考图进行模仿,也就是我们常说的“垫图”。接下去就是对你想要的图形进行文本描述,文本描述上又分为两类:内容型提示词和标准化提示词。内容型提示词主要用于描述你想要的画面,我们选择anythingV5这个专门用于二次元绘画的大模型,然后输入以下提示词:1个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面。(使用翻译软件翻译成英文)采样迭代步数是指AI绘画去噪的次数,步数越高绘画越清晰,但是绘画速度也会越慢,通常数值控制在20-40之间最好。采样方法是指AI生成图像时候的某种特定算法,我们不用全部了解,一般常用的为:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。有的模型会有指定的算法,搭配起来更好用。将比例设置为800:400,注意这里的尺寸并不是越大越好,因为模型的练图基本上都是按照512x512的框架去画,所以我们的高宽比尽量都在这个数值附近。太大的数值比如1920x1080,会使AI做出很奇怪的构图。那你就会说,我就想要很高清的图怎么办,其实Stable Diffusion也提供了图片放大的功能,我们可以同时点选这个高清修复来放大图像倍率,而高宽比我们只要记住这里主要是控制一个画面比例就可以了。

Others are asking
midjourney图怎么 放大
在 Midjourney 中,放大图像的方法如下: 放大(Upscale)将图像尺寸加倍: 精细放大(Subtle):放大图像同时尽量保持原样。 创意放大(Creative):在放大的同时会调整或改变图像中的某些细节。 操作时,您可以点击相应的按钮进行放大。例如,在生成的图像中,点击上面的 U 1 4 即可放大一张图。 另外,使用当前默认模型版本的中途图像的默认尺寸为 1024 x 1024 像素。您可以使用 upscale 工具将文件大小增加到 2048 x 2048 或 4096 x 4096 像素。在网络浏览器中打开 Midjourney 图像,或从 Midjourney.com 下载它们以获得最大文件大小。 需要注意的是,如果没看到放大相关的按钮,可能有以下原因: 1. 该图像已经在 Discord 中生成最满意的一张,不可再放大。 2. 在 More options 文字里没打上相应的对勾。
2025-03-21
图片放大
图像放大主要通过以下几种方式实现: 1. 图像高清修复流程: 输入原始图像:添加Load Image节点加载图像,不建议上传大分辨率图片,以免处理时间过长。 图像高清修复:使用Iceclear/StableSR等模型进行修复并2倍放大,搭配Stable SR Upscaler模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:对第一次放大修复后的图像进行二次修复,使用realisticVision底膜,搭配tile ControlNet提升画面细节感,选择合适的高清放大模型。 2. 利用插件和脚本: Tiled Diffusion中的MultiDiffusion方案适合图像的重绘、风格迁移和放大等功能,其中的滑块可调节分块大小、重叠像素和同时处理的分块数量。 Tiled VAE可降低VAE编解码大图所需的显存字节,分块大小可根据电脑情况调节。 3. 辅助工具: 本地工具:https://www.upscayl.org/download SD放大:扩散模型可增加更多细节 开源工作流: 相关网站: stability.ai的https://clipdrop.co/tools 画质增强magnific遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯ARChttps://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2025-03-08
comfyui tile放大
以下是关于 ComfyUI tile 放大的相关内容: 文生图工作流搭建:先左键点住 CLIP 黄点向外拖,再拖出两个 CLIP 编码器,从条件处拉出采样器,连接正负提示词和模型,还需 VE 解码器和 VE 模型,若模型无 VAE 则需加载器。 浅空间图像放大:从第一个采样器向右拉,点击按系数缩放将 later 调成 2 倍,复制采样器、VE 解码器并连接处理过的 later。 Confii 图像放大操作:从第一个采样器开始,通过一系列操作如添加 Latin 节点、连接提示词和模型、连接 VE 解码器等,并设置重绘幅度、缩放系数等参数来实现图像放大。参数设置方面,重绘幅度(降噪)决定图像改变程度,数值越高与原始图像差别越大;缩放系数默认 1.5,可调整为 2。 在 SD 中,可使用 Ultimate SD upscale 插件放大,也可在图生图中进行放大,重绘幅度设置为 0.6。放大时打开 Tiled Diffusion,方案选择 MultiDiffusion,放大算法选择 RESRGAN 4x+Anime6B,放大 2 倍。同时启用 Tiled VAE 和 controlnet 插件的 tile 模型,给图片添加细节。
2025-03-03
帮我找一些可以无损放大图片的ai 产品
以下是一些可以无损放大图片的 AI 产品: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 此外,以下是图片增强方面的 AI 产品排名数据: 4 月访问量(万 Visit): 1. Cutout pro 图片增强 1608 相对 3 月变化 0.023 2. Upscale media 图片增强 432 相对 3 月变化 0.073 3. ZMO AI 图片增强 338 相对 3 月变化 0.161 4. Neural.love Art 图片增强 283 相对 3 月变化 0.072 5. Topaz Photo AI 图片增强 247 相对 3 月变化 0.047 6. VanceAI 图片增强 247 相对 3 月变化 0.078 7. bigjpgAI 图片无损放大 图片增强 203 相对 3 月变化 0.06 8. Img Upscaler 图片增强 203 相对 3 月变化 0.042 9. Let's Enhance 图片增强 167 相对 3 月变化 0.046 10. Akool 图片增强 122 相对 3 月变化 0.173 6 月访问量(万 Visit): 1. Cutout pro 图片增强 1408 相对 5 月变化 0.082 2. Upscale media 图片增强 433 相对 5 月变化 0.029 3. Neural.love Art 图片增强 253 相对 5 月变化 0.137 4. Img Upscaler 图片增强 244 相对 5 月变化 0.032 5. VanceAI 图片增强 239 相对 5 月变化 0.077 6. ZMO AI 图片增强 221 相对 5 月变化 0.153 7. bigjpgAI 图片无损放大 图片增强 180 相对 5 月变化 0.109 8. Topaz Photo AI/Topaz Video AI 图片增强 170 相对 5 月变化 0.224 9. Let's Enhance 图片增强 150 相对 5 月变化 0.102 10. Akool 图片增强 142 相对 5 月变化 0.193
2025-02-24
ComfyUI中的放大插件
ComfyUI 中的放大插件相关知识如下: 通过使用神经网络对潜在空间进行放大,无需使用 VAE 进行解码和编码,此方法比传统方式快很多且质量损失小。插件项目地址:https://github.com/Ttl/ComfyUi_NNLatentUpscale?tab=readmeovfile 。潜在表示是神经网络处理图像时生成的压缩版本,包含图像主要特征信息,处理潜在表示更快且资源消耗更少。其流程包括生成潜在表示(生成低分辨率图像)、放大潜在表示、生成高分辨率图像(将放大的潜在图像反馈到稳定扩散 UNet 中进行低噪声扩散处理)。UNet 是一种常用于图像处理的特别神经网络结构,包括编码部分(逐步缩小图像提取重要特征)、解码部分(逐步放大图像并重新组合)和跳跃连接(保留细节信息),能在放大图像时保持细节和准确性。 8 月 13 日的 ComfyUI 共学中,讨论了图像生成中分辨率和放大方式。不同模型有适合的分辨率,如 SD1.5 通用尺寸为 512×512 或 512×768,SDXL 基础尺寸为 1024×1024,生成图像前要选对尺寸。通过浅空间缩放放大图像时,直接对浅空间图片编辑放大,然后进行第二次采样和高清处理,直接放大不解码会模糊,需用较低采样系数增加细节。也可使用外置放大模型放大图像,默认放大 4 倍,可通过 resize image 节点调整尺寸,放大后要送回编码器进行采样处理。还提到图像对比节点、算力和资源获取、AI 绘图相关技术与工具、CLIP 和 CFG 的区别、搭建带 Lora 的图生图工作流等内容。 Comfyui PuLID 人物一致节点相关:节点插件 PuLID ComfyUI https://github.com/cubiq/PuLID_ComfyUI 。包括 model(使用预训练的基础文本到图像扩散模型)、pulid(加载的 PuLID 模型权重)、eva_clip(用于从 ID 参考图像中编码面部特征的 EvaCLIP 模型)、face_analysis(使用 InsightFace 模型识别和裁剪 ID 参考图像中的面部)、image(提供的参考图像用于插入特定 ID)、method(选择 ID 插入方法)、weight(控制 ID 插入强度)、start_at 和 end_at(控制在去噪步骤的应用阶段)、attn_mask(可选的灰度掩码图像),还有高级节点可进行更精细的生成调优。
2025-02-20
图片放大
以下是关于图片放大的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强: https://magnific.ai/ https://www.krea.ai/apps/image/enhancer https://imageupscaler.com/ https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 https://imglarger.com/ https://letsenhance.io/ http://waifu2x.udp.jp/ 在 SD 中进行图片放大: 使用过插件、脚本和后期处理,原理相同,好坏需尝试,因为 AI 生图有随机性。 在 Tiled Diffusion 中,MultiDiffusion 方案适合图像重绘、风格迁移和放大等功能。 四个滑块代表分块大小、分块之间的重叠像素和同时处理的分块数量,数值越大效果越好、速度越快,数值越小占用显存越小,一般保持默认,重叠像素大小建议使用 MultiDiffusion 时选择 32 或 48,使用 Mixture of Diffusers 选择 16 或 32。 Tiled VAE 可极大程度降低 VAE 编解码大图所需的显存字节,分块大小根据电脑情况调节,数值越小占用显存越低。 生成 512x512 的图片,发送到图生图进行重绘,选择熟悉的放大算法和所需的放大倍数,重绘幅度设置为 0.35,放大算法下面的噪声反转可在重绘前对原图像进行噪声图反推,让放大的图片更接近原图。 在 SD 中文生图的相关提示词: Stable Diffusion 的生成方式主要分为文生图和图生图两种,文生图仅通过正反向词汇描述发送指令,图生图除文字外还可给 AI 参考图进行模仿(垫图)。 文本描述分为内容型提示词和标准化提示词,内容型提示词用于描述想要的画面,例如:1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面(使用翻译软件翻译成英文)。 采样迭代步数通常控制在 20 40 之间,采样方法常用的有:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。 比例设置为 800:400,高宽比尽量在 512x512 数值附近,太大的数值会使 AI 构图奇怪,可同时点选高清修复来放大图像倍率。
2024-12-20
生成logo图片工具
以下是一些生成 logo 图片的工具和方法: 1. 藏师傅的方法:通过智能体 https://www.coze.cn/s/iDec2U13/ ,整个流程分为三个部分,包括获取 Logo 图片的描述、根据描述和生成意图生成图片提示词、将图片和提示词输入 Comfyui 工作生成。 2. 即梦 AI:在其官网 https://jimeng.jianying.com/ ,左侧点击「智能画布」,上传 logo 图,点击「图生图」输入描述词,参考程度为 55 并选择「轮廓边缘」点击立即生成,然后在右侧图层选择喜欢的图,还可使用局部重绘、消除笔等功能调整或重新生成。 3. guahunyo 提供的 SD 入门讲解 PPT.pptx 中提到的相关采样器设置和生成图片的技巧,如预览图设置、右键无限跑图模式以及相关插件 https://github.com/ArtVentureX/sdwebuiagentscheduler 等。
2025-03-26
介绍把图片变清晰的软件,logo图片上的文字不清晰。
目前有一些可以将图片变清晰的软件,以下为您介绍几种常见的: 1. Adobe Photoshop:功能强大,通过图像增强、锐化等操作来提高图片清晰度。 2. Topaz Gigapixel AI:专门用于图像放大和增强清晰度。 3. Waifu2x:对动漫、插画类图片的清晰度提升效果较好。 您可以根据自己的需求和图片类型选择适合的软件来处理 logo 图片上不清晰的文字。
2025-03-25
我想用ai生成图片,有什么工具
目前市场上有许多用于生成图片的工具,以下为您介绍: 1. 文生图工具: DALL·E:由 OpenAI 推出,可根据输入的文本描述生成逼真的图片。 StableDiffusion:开源的文生图工具,能生成高质量图片,支持多种模型和算法。 MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 2. 图片生成 3D 建模工具: Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成。 CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域的模型生成。 VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。 这些工具通常具有用户友好的界面,允许用户通过简单操作生成图片或 3D 模型,无需专业技能。它们可广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-25
根据产品平面图片可以生成产品360度3D视频
以下是一些根据产品平面图片生成产品 360 度 3D 视频的相关信息: ViggleAI:由 15 人团队打造,创始人是在多家知名公司工作过的华人 AI 研究员。其核心能力是将视频中的角色替换成其他形象,依赖自家训练的 3D 视频模型「JST1」,能够根据一张角色图片生成 360 度角色动画。目前支持 Discord 访问和网页版访问,Discord 平台已积累超 400 万用户。网页版访问:https://www.viggle.ai/ 官方推特:https://x.com/ViggleAI 。Move 模式能使图像角色移动,原始图像背景保持不变,擅长将特定角色融入动作场景,视频生成稳定性和角色前后一致性强。 Sora:可以将 2D 照片生成三维的 360 度景致,视频效果逼真,例如赛车在旧金山街道的视频、厨房照片生成的 360 度环视效果等。 工具汇总: MakeACharacter:一键生成 3D 数字人,可自定义面部特征,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。链接:https://x.com/xiaohuggg/status/1739926702158225859?s=20 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获,创建 AR QR 码,展示物体于任何地点,苹果新品官网展示中应用此技术。链接:https://x.com/xiaohuggg/status/1739259052448944139?s=20
2025-03-25
可以为我找到在线更换图片颜色服务的AI网站吗
以下是一些可以在线更换图片颜色服务的 AI 网站相关信息: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下将图片放大到足够的倍数。 在最近新上线的 controlnet 模型中,Recolor 新模型可将黑白图片重新上色。 对于人物照片还原,可选择 realisian 的写实大模型,通过提示词描述颜色和对应内容,如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景等。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 您可以通过以下网址获取更详细内容:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2025-03-25
图片信息提取
图片信息提取主要包括以下几个方面: 1. 实现工作流: 上传输入图片。 理解图片信息,提取图片中的文本内容信息。 场景提示词优化/图像风格化处理。 返回文本/图像结果。 零代码版本:选择 Coze 平台,将本地图片转换为在线 OSS 存储的 URL 以便调用,封装图片理解大模型和图片 OCR 为工作流插件。 2. 银海的工程视角 TrickleOnWeChat 方案: 设计信息整合和提炼的 Prompt 提示词,将 OCR 文本信息与图片识别信息关联整合,按信息分类分析方法整理并按指定格式输出,增加标签分类。 3. 星流一站式 AI 设计工具: 左侧图片案例板块包含大量图像例图与生图信息,滑动鼠标到“info”区域可直接将图像发送到画布与生图信息调取。 图像筛选功能包括推荐(根据生图参数推荐)、热门(推荐浏览量最高的图片)、搜索(输入描述进行图像搜索)。 图像调取包括点击“发送到画布”直接将图像发送到“无限画布”,生图参数调取包括整体调取(点击“发送到生成器”调取全部参数)和单个调取(点击右侧单独的发动键调取单个参数)。
2025-03-24