Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

帮我找一些可以无损放大图片的ai 产品

Answer

以下是一些可以无损放大图片的 AI 产品:

  • 本地工具放大:https://www.upscayl.org/#download
  • SD 放大:扩散模型可以增加更多细节
  • 开源工作流:
  • stability.ai 的 https://clipdrop.co/tools
  • 画质增强 magnific 遥遥领先:https://magnific.ai/
  • Krea:https://www.krea.ai/apps/image/enhancer
  • Image Upscaler:https://imageupscaler.com/
  • 佐糖:https://picwish.cn/photo-enhancer-api?apptype=aps-bd-api&bd_vid=8091972682159211710
  • 腾讯 ARC:https://arc.tencent.com/zh/ai-demos/humansegmentation?ref=88sheji.cn
  • 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN
  • 在线测试地址:https://replicate.com/tencentarc/gfpgan
  • 美图老照片修复:https://www.x-design.com/quality/?channel=sllbd90&bd_vid=11711254260543749686
  • Imglarger:https://imglarger.com/
  • Let's Enhance:https://letsenhance.io/
  • Waifu2x:http://waifu2x.udp.jp/

此外,以下是图片增强方面的 AI 产品排名数据:

  • 4 月访问量(万 Visit):
      1. Cutout pro 图片增强 1608 相对 3 月变化 0.023
      1. Upscale media 图片增强 432 相对 3 月变化 -0.073
      1. ZMO AI 图片增强 338 相对 3 月变化 -0.161
      1. Neural.love Art 图片增强 283 相对 3 月变化 0.072
      1. Topaz Photo AI 图片增强 247 相对 3 月变化 0.047
      1. VanceAI 图片增强 247 相对 3 月变化 -0.078
      1. bigjpgAI 图片无损放大 图片增强 203 相对 3 月变化 -0.06
      1. Img Upscaler 图片增强 203 相对 3 月变化 -0.042
      1. Let's Enhance 图片增强 167 相对 3 月变化 -0.046
      1. Akool 图片增强 122 相对 3 月变化 0.173
  • 6 月访问量(万 Visit):
      1. Cutout pro 图片增强 1408 相对 5 月变化 -0.082
      1. Upscale media 图片增强 433 相对 5 月变化 -0.029
      1. Neural.love Art 图片增强 253 相对 5 月变化 -0.137
      1. Img Upscaler 图片增强 244 相对 5 月变化 -0.032
      1. VanceAI 图片增强 239 相对 5 月变化 -0.077
      1. ZMO AI 图片增强 221 相对 5 月变化 -0.153
      1. bigjpgAI 图片无损放大 图片增强 180 相对 5 月变化 -0.109
      1. Topaz Photo AI/Topaz Video AI 图片增强 170 相对 5 月变化 -0.224
      1. Let's Enhance 图片增强 150 相对 5 月变化 -0.102
      1. Akool 图片增强 142 相对 5 月变化 0.193
Content generated by AI large model, please carefully verify (powered by aily)

References

辅助工具:放大/扩图

本地工具放大:https://www.upscayl.org/#downloadSD放大:扩散模型可以增加更多细节开源工作流:[开源的Magnific AI的图片放大工作流](https://waytoagi.feishu.cn/wiki/A5LtwIV6KixSCckCOuYcAYpFnjb)开源工作流:[图像高清修复,无损放大N倍](https://waytoagi.feishu.cn/wiki/BDNJwt5uji6hkakgahGcp0LlnVb)stability.ai的https://clipdrop.co/tools画质增强magnific遥遥领先:https://magnific.ai/Krea https://www.krea.ai/apps/image/enhancerImage Upscaler:https://imageupscaler.com/佐糖:https://picwish.cn/photo-enhancer-api?apptype=aps-bd-api&bd_vid=8091972682159211710腾讯ARChttps://arc.tencent.com/zh/ai-demos/humansegmentation?ref=88sheji.cn腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN在线测试地址:https://replicate.com/tencentarc/gfpgan美图老照片修复:https://www.x-design.com/quality/?channel=sllbd90&bd_vid=11711254260543749686Imglarger:https://imglarger.com/Let's Enhance:https://letsenhance.io/Waifu2x:http://waifu2x.udp.jp/

图片增强 Top10

|排行|产品名|分类aiwatch.ai|4月访问量(万Visit)|相对3月变化||-|-|-|-|-||1|Cutout pro|图片增强|1608|0.023||2|Upscale media|图片增强|432|-0.073||3|ZMO AI|图片增强|338|-0.161||4|Neural.love Art|图片增强|283|0.072||5|Topaz Photo AI|图片增强|247|0.047||6|VanceAI|图片增强|247|-0.078||7|bigjpgAI图片无损放大|图片增强|203|-0.06||8|Img Upscaler|图片增强|203|-0.042||9|Let's Enhance|图片增强|167|-0.046||10|Akool|图片增强|122|0.173|

图片增强 Top10

|排行|产品名|分类aiwatch.ai|6月访问量(万Visit)|相对5月变化||-|-|-|-|-||1|Cutout pro|图片增强|1408|-0.082||2|Upscale media|图片增强|433|-0.029||3|Neural.love Art|图片增强|253|-0.137||4|Img Upscaler|图片增强|244|-0.032||5|VanceAI|图片增强|239|-0.077||6|ZMO AI|图片增强|221|-0.153||7|bigjpgAI图片无损放大|图片增强|180|-0.109||8|Topaz Photo AI/Topaz Video AI|图片增强|170|-0.224||9|Let's Enhance|图片增强|150|-0.102||10|Akool|图片增强|142|0.193|

Others are asking
有没有什么AI工具,可以把收藏的小红书内容链接批量导出
以下是一些可能满足您需求的 AI 工具: 1. MediaCrawler:这是一款一键抓取工具,支持小红书、抖音、快手、B 站和微博等平台内容抓取。它集成了 IP 代理池,可防封,还支持视频、图片、评论等多种数据格式保存。相关链接:https://github.com/NanmiCoder/MediaCrawler 、https://x.com/imxiaohu/status/1769569874601546034?s=20
2025-03-30
哪个AI能帮助初中生规划学习计划
以下几个 AI 可以帮助初中生规划学习计划: 1. 文心大模型 4.0:它可以按照以下步骤为用户制定学习计划。首先询问学习目标或需要解决的问题,然后依次询问并收集学习目标与个人或职业发展目标的关系、具体学习内容、量化学习进度和成功的标准、目标完成的时间框架、目标的现实可行性等信息,最后综合这些信息制定详细的分步骤学习计划,包括每日和每周的学习内容及目标。 2. ChatGPT:可以协助设定量化目标,比如以考取雅思 8.0 且能和朋友或客户流利交谈为目标。然后会询问达成目标的时间框架,比如半年。还会询问目标的现实可行性,比如考虑目前的英语水平、日常时间安排、学习资源等情况。 例如,如果一个初中生想要提高英语水平,设定半年内考取雅思 8.0 且能流利交流为目标,目前雅思 6.5,每天能投入 2 小时,周末更多,有网络课程访问条件且能购买学习材料,那么这些 AI 可以根据这些信息为其制定具体的学习计划。
2025-03-30
有没有aI工具可以把小红书收藏的内容帮我整理出来
以下是一些可以帮助您整理小红书收藏内容的 AI 工具: 1. Felo:这是一个浏览器插件,会自动调用您的小红书网页搜索获取笔记内容,然后引用小红书的笔记内容来回答您的问题。它输出的攻略详尽,使用结构化语言梳理路径,比直接看小红书博主的笔记更高效,因为能避免 emoji 和排版不清晰的干扰。 2. 点点 生活搜索助手:小红书自家推出的 AI 搜索产品,目前还在内测中。在微信小程序上搜索“点点 生活搜索助手”即可使用。它在回答问题时会插入相应图片,免去重新打开笔记看图片的麻烦。 3. 暂时未明确提及其他专门用于整理小红书收藏内容的工具,但您可以参考以下相关资源: 一些小红书优质科技内容案例,如: 关于字节火山 DeepSeek 系列 API 的获取及使用方法,您可以参考:
2025-03-30
AI 优化简历
以下是一些可以用于优化简历的 AI 工具: 1. ResumeMatcher:这是一个 AI 驱动的开源简历优化工具。它能提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。采用 FastEmbed 计算简历与职位匹配度,结合 textacy 提取核心术语,精准优化简历内容。链接: 2. 超级简历优化助手:帮助用户优化简历提高求职成功率。超级简历优化助手分析简历内容并提供优化建议。 3. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,为简历摘要、工作经验和教育等专业部分编写内容,并在整个文档中保持一致的语调。 4. Rezi:是一个受到超过 200 万用户信任的领先 AI 简历构建平台。使用先进的 AI 技术自动化创建可雇佣简历的每个方面——写作、编辑、格式化和优化。 5. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合您的工具。
2025-03-30
帮我找个AI体育计划师
以下是一些可以作为 AI 体育计划师的工具和平台: 1. Keep:中国最大的健身平台,为用户提供全面的健身解决方案,以帮助实现健身目标。网址:https://keep.com/ 2. Fiture:沸彻魔镜由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。网址:https://www.fiture.com/ 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。网址:https://www.fitnessai.com/ 4. Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。网址:https://planfit.ai/ 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-30
aigc是什么
AIGC 即 AI generated content,又称为生成式 AI,意为人工智能生成内容。 AIGC 能够通过机器学习和深度学习算法,根据输入的数据和指令生成各种类型的内容,例如 AI 文本续写、文字转图像的 AI 图、AI 主持人等。其应用领域广泛,包括内容创作、广告、媒体等。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 Gemini Ultra。图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。此外,AIGC 还可应用于音乐生成、游戏开发和医疗保健等领域。 能进行 AIGC 的产品项目众多,能进行 AIGC 的媒介也很多,包括且不限于: 语言文字类:OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM 都是语言类的。 语音声音类:Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。 AIGC、UGC(普通用户生产)和 PGC(专业用户生产)都是内容生成的不同方式,主要区别在于内容的创作者和生成方式。AIGC 由人工智能生成内容,优势在于可以快速、大规模地生成内容,适用于需要大量内容的场景。UGC 由用户生成内容,优势在于内容丰富多样,能够反映用户的真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 由专业人士或机构生成内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。 目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。AIGC 应用可能引发内生风险、数据隐私问题和知识产权风险,需要进一步加强监管和伦理约束。
2025-03-30
好用的图片无损高清放大
以下是关于图片无损高清放大的相关内容: 图像修复放大的流程分为三部分: 1. 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 2. 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,提示词应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。全程采取两次高清修复,第一次修复原始图像分辨率并放大。 3. 图像高清放大:针对第一次放大修复后的图像进行二次修复,用 realisticVision 底膜,使用提示词反推 node 对图像进行画面提示词提取,搭配 tile ControlNet 提升画面细节感,用合适的高清放大模型进行二次放大。 【SD】超清无损放大器 StableSR: 作者为白马少年,发布于 2023 年 6 月 10 日 20:01,原文网址:https://mp.weixin.qq.com/s/J0HIF2U1siAen6FWNA67A 。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,主要用到“脚本”和“后期处理”,其中脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片,可按原图内容扩图,但无法还原原图不清晰的地方。 今天讲的 StableSR 可算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式:在扩展面板中搜索 StableSR 直接安装,或将下载好的插件放在“……\\sdwebuiakiv4\\extensions”文件夹下,安装完成后重启 webUI 即可在脚本中找到。 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹;StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹;VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 测试:用一张网上找的分辨率为 512x768 的神仙姐姐照片,“Ultimate SD upscale”脚本放大哪怕重绘幅度只开到 0.1,人物细节有变化但磨皮严重,重绘幅度开到 0.4 则变化很大;“后期处理”放大 3 倍,眼神变锐利但头发仍模糊;StableSR 放大时,先调整大模型和 VAE,打开脚本下拉选择“StableSR”,模型选择对应模型,放大倍数为 3,勾选“pure noise”。
2024-11-12
视频压缩软件推荐(清晰度最好无损,用上ai技术,支持8G容量大的mp4文件压缩)
目前市面上支持您需求的视频压缩软件相对较少。不过,您可以关注以下几款可能符合部分要求的软件: 1. HandBrake:这是一款开源的视频转码工具,虽然没有明确提及使用 AI 技术,但在压缩视频时可以较好地保持画质。 2. Adobe Premiere Pro:专业的视频编辑软件,具有一定的视频压缩功能,但其主要优势在于视频编辑,对于大文件的处理能力较强。 需要注意的是,要实现无损压缩且支持 8G 容量大的 MP4 文件,同时还运用 AI 技术,可能较难完全满足。在实际使用中,您可能需要根据具体情况进行尝试和调整。
2024-10-10
midjourney图怎么 放大
在 Midjourney 中,放大图像的方法如下: 放大(Upscale)将图像尺寸加倍: 精细放大(Subtle):放大图像同时尽量保持原样。 创意放大(Creative):在放大的同时会调整或改变图像中的某些细节。 操作时,您可以点击相应的按钮进行放大。例如,在生成的图像中,点击上面的 U 1 4 即可放大一张图。 另外,使用当前默认模型版本的中途图像的默认尺寸为 1024 x 1024 像素。您可以使用 upscale 工具将文件大小增加到 2048 x 2048 或 4096 x 4096 像素。在网络浏览器中打开 Midjourney 图像,或从 Midjourney.com 下载它们以获得最大文件大小。 需要注意的是,如果没看到放大相关的按钮,可能有以下原因: 1. 该图像已经在 Discord 中生成最满意的一张,不可再放大。 2. 在 More options 文字里没打上相应的对勾。
2025-03-21
图片放大
图像放大主要通过以下几种方式实现: 1. 图像高清修复流程: 输入原始图像:添加Load Image节点加载图像,不建议上传大分辨率图片,以免处理时间过长。 图像高清修复:使用Iceclear/StableSR等模型进行修复并2倍放大,搭配Stable SR Upscaler模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:对第一次放大修复后的图像进行二次修复,使用realisticVision底膜,搭配tile ControlNet提升画面细节感,选择合适的高清放大模型。 2. 利用插件和脚本: Tiled Diffusion中的MultiDiffusion方案适合图像的重绘、风格迁移和放大等功能,其中的滑块可调节分块大小、重叠像素和同时处理的分块数量。 Tiled VAE可降低VAE编解码大图所需的显存字节,分块大小可根据电脑情况调节。 3. 辅助工具: 本地工具:https://www.upscayl.org/download SD放大:扩散模型可增加更多细节 开源工作流: 相关网站: stability.ai的https://clipdrop.co/tools 画质增强magnific遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯ARChttps://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2025-03-08
comfyui tile放大
以下是关于 ComfyUI tile 放大的相关内容: 文生图工作流搭建:先左键点住 CLIP 黄点向外拖,再拖出两个 CLIP 编码器,从条件处拉出采样器,连接正负提示词和模型,还需 VE 解码器和 VE 模型,若模型无 VAE 则需加载器。 浅空间图像放大:从第一个采样器向右拉,点击按系数缩放将 later 调成 2 倍,复制采样器、VE 解码器并连接处理过的 later。 Confii 图像放大操作:从第一个采样器开始,通过一系列操作如添加 Latin 节点、连接提示词和模型、连接 VE 解码器等,并设置重绘幅度、缩放系数等参数来实现图像放大。参数设置方面,重绘幅度(降噪)决定图像改变程度,数值越高与原始图像差别越大;缩放系数默认 1.5,可调整为 2。 在 SD 中,可使用 Ultimate SD upscale 插件放大,也可在图生图中进行放大,重绘幅度设置为 0.6。放大时打开 Tiled Diffusion,方案选择 MultiDiffusion,放大算法选择 RESRGAN 4x+Anime6B,放大 2 倍。同时启用 Tiled VAE 和 controlnet 插件的 tile 模型,给图片添加细节。
2025-03-03
ComfyUI中的放大插件
ComfyUI 中的放大插件相关知识如下: 通过使用神经网络对潜在空间进行放大,无需使用 VAE 进行解码和编码,此方法比传统方式快很多且质量损失小。插件项目地址:https://github.com/Ttl/ComfyUi_NNLatentUpscale?tab=readmeovfile 。潜在表示是神经网络处理图像时生成的压缩版本,包含图像主要特征信息,处理潜在表示更快且资源消耗更少。其流程包括生成潜在表示(生成低分辨率图像)、放大潜在表示、生成高分辨率图像(将放大的潜在图像反馈到稳定扩散 UNet 中进行低噪声扩散处理)。UNet 是一种常用于图像处理的特别神经网络结构,包括编码部分(逐步缩小图像提取重要特征)、解码部分(逐步放大图像并重新组合)和跳跃连接(保留细节信息),能在放大图像时保持细节和准确性。 8 月 13 日的 ComfyUI 共学中,讨论了图像生成中分辨率和放大方式。不同模型有适合的分辨率,如 SD1.5 通用尺寸为 512×512 或 512×768,SDXL 基础尺寸为 1024×1024,生成图像前要选对尺寸。通过浅空间缩放放大图像时,直接对浅空间图片编辑放大,然后进行第二次采样和高清处理,直接放大不解码会模糊,需用较低采样系数增加细节。也可使用外置放大模型放大图像,默认放大 4 倍,可通过 resize image 节点调整尺寸,放大后要送回编码器进行采样处理。还提到图像对比节点、算力和资源获取、AI 绘图相关技术与工具、CLIP 和 CFG 的区别、搭建带 Lora 的图生图工作流等内容。 Comfyui PuLID 人物一致节点相关:节点插件 PuLID ComfyUI https://github.com/cubiq/PuLID_ComfyUI 。包括 model(使用预训练的基础文本到图像扩散模型)、pulid(加载的 PuLID 模型权重)、eva_clip(用于从 ID 参考图像中编码面部特征的 EvaCLIP 模型)、face_analysis(使用 InsightFace 模型识别和裁剪 ID 参考图像中的面部)、image(提供的参考图像用于插入特定 ID)、method(选择 ID 插入方法)、weight(控制 ID 插入强度)、start_at 和 end_at(控制在去噪步骤的应用阶段)、attn_mask(可选的灰度掩码图像),还有高级节点可进行更精细的生成调优。
2025-02-20
放大图片
在 AI 绘画领域,放大图片有以下相关知识: Midjourney 中放大图片的方法: 使用 /imagine 命令生成低分辨率图像选项网格,每个图像网格下方的按钮可用于创建图像的变体、升级图像或重新运行最后一个 Midjourney Bot 操作。 U1U2U3U4 按钮将图像与图像网格分开,使用旧版 Midjourney 模型版本时,U 按钮会放大图像,生成所选图像的更大版本并添加更多细节。 重做(重新滚动)按钮重新运行作业。 V1V2V3V4V 按钮创建所选网格图像的增量变化。 制作变体:创建放大图像的变体并生成包含四个选项的新网格。网页:在上打开图库中的图像,最喜欢的:标记您最好的图像,以便在 Midjourney 网站上轻松找到它们。 直接消息:如果general 或newbie 频道进展太快,Midjourney 订阅者可以在其 Discord 直接消息中与 Midjourney 机器人进行一对一的合作。 使用 Midjourney Vary Region 编辑器选择并重新生成放大图像的特定部分。Vary按钮会在中途图像放大后出现,区域差异由原始图像中的内容和您选择的区域决定,与 Midjourney 模型版本 V5.0、V5.1、V5.2、niji 5 兼容。具体操作步骤如下: 1. 生成图像:使用命令创建图像/imagine。 2. 升级图像:使用 U 按钮放大所选图像。 3. 选择不同区域:点击🖌️Vary按钮,打开编辑界面。 4. 选择要再生的区域:选择编辑器左下角的手绘或矩形选择工具,选择要重新生成的图像区域。注意选择的大小会影响结果,更大的选择为 Midjourney 机器人提供更多空间来生成新的创意细节,较小的选择将导致更小、更微妙的变化。无法编辑现有选择,但可以使用右上角的撤消按钮撤消多个步骤。 5. 提交您的工作:单击 Submit→按钮将您的请求发送到 Midjourney Bot。 6. 查看结果:中途机器人将处理您的作业并在您选择的区域内生成一个新的变化图像网格。 Stable Diffusion 中放大图片的相关设置: 文生图是仅通过正反向词汇描述来发送指令。在进行文本描述时,分为内容型提示词和标准化提示词,内容型提示词主要用于描述想要的画面。 采样迭代步数通常数值控制在 20 40 之间,步数越高绘画越清晰,但绘画速度也会越慢。 采样方法一般常用的为:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。有的模型会有指定的算法,搭配起来更好用。 将比例设置为 800:400,注意尺寸并非越大越好,模型的练图基本上都是按照 512x512 的框架去画,高宽比尽量在这个数值附近。太大的数值比如 1920x1080,会使 AI 做出很奇怪的构图。若想要高清的图,可以同时点选高清修复来放大图像倍率,高宽比主要是控制一个画面比例。
2025-01-15
图片放大
以下是关于图片放大的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强: https://magnific.ai/ https://www.krea.ai/apps/image/enhancer https://imageupscaler.com/ https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 https://imglarger.com/ https://letsenhance.io/ http://waifu2x.udp.jp/ 在 SD 中进行图片放大: 使用过插件、脚本和后期处理,原理相同,好坏需尝试,因为 AI 生图有随机性。 在 Tiled Diffusion 中,MultiDiffusion 方案适合图像重绘、风格迁移和放大等功能。 四个滑块代表分块大小、分块之间的重叠像素和同时处理的分块数量,数值越大效果越好、速度越快,数值越小占用显存越小,一般保持默认,重叠像素大小建议使用 MultiDiffusion 时选择 32 或 48,使用 Mixture of Diffusers 选择 16 或 32。 Tiled VAE 可极大程度降低 VAE 编解码大图所需的显存字节,分块大小根据电脑情况调节,数值越小占用显存越低。 生成 512x512 的图片,发送到图生图进行重绘,选择熟悉的放大算法和所需的放大倍数,重绘幅度设置为 0.35,放大算法下面的噪声反转可在重绘前对原图像进行噪声图反推,让放大的图片更接近原图。 在 SD 中文生图的相关提示词: Stable Diffusion 的生成方式主要分为文生图和图生图两种,文生图仅通过正反向词汇描述发送指令,图生图除文字外还可给 AI 参考图进行模仿(垫图)。 文本描述分为内容型提示词和标准化提示词,内容型提示词用于描述想要的画面,例如:1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面(使用翻译软件翻译成英文)。 采样迭代步数通常控制在 20 40 之间,采样方法常用的有:Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM。 比例设置为 800:400,高宽比尽量在 512x512 数值附近,太大的数值会使 AI 构图奇怪,可同时点选高清修复来放大图像倍率。
2024-12-20
点击AI应用主界面的某一个图片组件触发另一个工作流,如何设置入参
要在 AI 应用主界面设置点击某一图片组件触发另一个工作流的入参,具体步骤如下: 1. 工作流的入参设置为 File>Image。 2. 入参配置为 {{ImageUpload1.value}}是获取图片上传组件的第一张图片,因为组件可以上传多张图片,所以需要通过下标数来获取,数组的下标从 0 开始。 3. {{psy_ai.error}}是工作流的报错信息。 4. 当用户上传图片点击按钮时会进入加载状态,加载状态通过 {{psy_ai.loading}} 控制。提交按钮配置中,属性设置包括宽度百分比 95%、高度固定 50px、颜色填充 295DC1、圆角 12、加载状态 {{psy_ai.loading}}。事件配置为事件类型 点击时,执行动作 调用工作流,WorkFlow(工作流) psy_ai,失败提示 工作流调用失败,原因:{{psy_ai.error}}。 5. 当工作流运行时,右边的内容显示容器包含两个组件,图片组件显示加载中的 gif 图片(默认隐藏),其来源为本地上传加载中 gif 图,尺寸为宽度百分比 100%,高度适应内容,可见性隐藏根据 {{!psy_ai.loading}},即当 loading 为 true 时隐藏,前面加「!」取反,工作流运行中显示。Markdown 组件显示分析内容,内容显示是 psy_ai 工作流输出的结果,隐藏根据 {{psy_ai.loading}},psy_ai 工作流运行完显示。 至此,页面所有的布局和数据交互就全部完成了。
2025-03-29
coze AI 应用中图片触发工作流如何设置
在 Coze AI 应用中设置图片触发工作流,步骤如下: 1. 工作流入参设置:将工作流的入参设置为 File>Image。注意,图片下方会提供特别的文本供复制,代码内容中 ImageUpload1 部分可替换成实际的文件上传组件名称,且一个引号、一个大括号都不能错。因为 value 里未提供 url 地址,只能用上传后的 file_id 从 Coze 存储的图片中获得索引。 2. 获得图片 URL:在工作流中可以直接使用 image 变量,也可以用 string 模式输出,它会神奇地变成图片的 URL。当使用文本组件显示其地址时,能清晰看到图片地址,图片组件上也可正常显示图片。只要绑定工作流的 image 输出即可。 此外,还有以下相关内容供您参考: 用扣子 Coze 搭建的 AI 公益应用中,用户界面的功能页相对复杂。当用户上传完图片进入分析,分析后会显示具体分析结果。布局组件包括容器(Div)、Markdown、图片(Image)、按钮(Button)、图片上传(ImageUpload)等,组合方式也有详细配置。 在 Coze 中,图像流的入口可通过扣子 coze.cn 的个人空间页面,图像流菜单进入。创建全新的图像流可在右上角点击操作,输入名称和描述。图像流由多个工具节点组合而成,包括开始节点、结束节点和智能生成、智能编辑、基础编辑等工具节点类别。
2025-03-29
关于图片生成人物衣服的提示词
以下是关于图片生成人物衣服的一些提示词相关内容: 在使用 Segment Anything 时,启用 GroundingDINO 可自动下载模型,将其放到特定文件目录下,在检测提示词中输入相关内容,如“eye”,可自动检测并设置蒙版。通过预览箱体获取编号,可选择调整单一部分。例如,只想调整左边眼睛,勾选 1 即可。还可给人物换背景,如大模型选择 revAnimated_v122,正向提示词为简单背景、花、国画、工笔,蒙版模式选择“重绘非蒙版内容”。将生成的图片放入图生图中,使用 tile 模型能给人物衣服添加国风元素。 设置模型和提示词时,例如大模型为 ghostmix_v20Bakedvae,正向提示词包含人物特征、服饰等描述,负向提示词包含 EasyNegative、badhandsv5neg 等。生成图片后可进行细节微调。 使用 cutoff 插件时,点击启用后按提示词顺序依次填入颜色提示词,中间用逗号分开,能准确显示颜色。如创建双人物构图,设置好人物形象和提示词,先在不开启插件时生成图片可能有颜色污染,开启插件并输入颜色信息后能保证颜色与提示词的关联性。
2025-03-28
文生图片哪个好
以下是对一些文生图模型的介绍及相关提示词和操作的说明: 文生图模型排序(从高到低): 1. Imagen 3:真实感满分,指令遵从强。 2. Recraft:真实感强,风格泛化很好,指令遵从较好(会受风格影响)。 3. Midjourney:风格化强,艺术感在线,但会失真,指令遵从较差。 4. 快手可图:影视场景能用,风格化较差。 5. Flux.1.1:真实感强,需要搭配 Lora 使用。 6. 文生图大模型 V2.1L(美感版):影视感强,但会有点油腻,细节不够,容易糊脸。 7. Luma:影视感强,但风格单一,糊。 8. 美图奇想 5.0:AI 油腻感重。 9. 腾讯混元:AI 油腻感重,影视感弱,空间结构不准。 10. SD 3.5 Large:崩。 【SD】文生图提示词: 英文为:, (toomany finger。 Tusiart 简易上手教程: 提示词相关性:指图像与用户输入 prompt 的匹配程度。数字越大,图像就越接近你的提示。但数字过高会让图像质量下降。在 5 15 之间为好,一般用 7、9、12。 随机种子:生成的每张图都有随机种子,在固定好种子以后,可以对图片进行“控制变量”效果的操作,比如说修改提示词、修改 clip 跳过层等等。 ADetailer:面部修复插件,预防或解决脸部崩坏的超强小工具,高阶操作后面再学,没事勾上也 OK。 CLIP skip:设成 2 就行。
2025-03-28
图片生成CAD图
以下是关于图片生成 CAD 图的相关信息: 存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,特别是在设计和工程领域。一些可用的工具包括: 1. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,涵盖图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能帮助创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可帮助创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。 对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 关于 AI 生成 CAD 图的相关资料,您可以参考以下几个方面: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库进行搜索。 2. 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍。 3. 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程,在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区:加入相关的技术论坛和社区,如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与其他专业人士交流和学习,关注 AI 和 CAD 相关的博客和新闻网站。 5. 开源项目和代码库:探索 GitHub 等开源平台上的 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等 AI 模型在 CAD 设计中的应用。 6. 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 此外,还有 TexttoCAD 工具,它支持通过文本生成 CAD 模型,UI 开源,但模型需付费。相关链接如下: 官网: 试用地址: UI 项目地址:
2025-03-28
GPT4o图片生成能力
GPT4o 是 OpenAI 推出的一种先进的图像生成模型,具有以下能力和特点: 1. 核心功能: 是一种先进的多模态模型,能够生成精确、真实感强的图像。 其图像生成功能不仅美观,还具有实际用途,例如白板演示、科学实验图解等。 2. 亮点功能: 精确的文本渲染:能够在图像中准确生成文字,例如街道标志、菜单、邀请函等。 结合文本和图像,提升了视觉传达能力。 多样化场景生成:支持从照片级真实感到漫画风格的多种图像生成。 可根据用户上传的图像进行灵感转化或视觉改造。 上下文感知:能够利用 GPT4o 的内在知识库和对话上下文生成符合语境的内容。 3. 技术改进: 通过联合训练在线图像和文本的分布,模型学会了图像与语言之间以及图像之间的关系。 经过后期训练优化,模型在视觉流畅性和一致性方面表现出色。 4. 实际应用场景: 信息传递:从标志性图像到复杂的科学图表,帮助用户更有效地传达信息。 创意设计:生成创意菜单、街道标志和独特的视觉故事。 教育与演示:支持生成教学图表、实验示意图等。 5. 局限性:尽管生成能力强,但仍可能存在某些场景或细节的限制。 6. 安全性与可用性:OpenAI 强调了安全性和隐私保护。目前该功能已集成到 ChatGPT 中,用户可直接体验。 此外,GPT4o 图像生成模型整合进了 4o 模型中,基于多模态训练,能够结合文本和图像的上下文,生成更智能、更逼真一致的视觉内容,并支持用户通过自然对话对其进行编辑调整和优化。它不仅能提供传统的图像生成,还可以生成更复杂的图像,包括插图、图表、PPT 元素、logo、游戏角色设计等。
2025-03-28