Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

生图之后怎么保持原图改尺寸扩展

Answer

以下是关于生图后保持原图改尺寸扩展的方法:

对于 SD :

  1. 将原图导入到图生图界面。
  2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类选“Realistic Vision”,效果不好可尝试其他模型。
  3. 图生图中重要参数设置:“缩放模式”选择“缩放后填充空白”;根据扩展方向增加宽度或高度;单批数量按需填写;“重绘幅度”加大到“0.8”以上。
  4. 升级到最新的 controlnet 版本,将图片导入。
  5. 启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 Controlnet”,缩放模式选择“缩放后填充空白”。
  6. 为了出图更统一,可增加一个 reference_only 的通道巩固扩图风格。
  7. 设置好后点击生成,选择满意的结果。

对于 Midjourney :

  1. 放大(Upscale):包括精细放大(Subtle)尽量保持原样,创意放大(Creative)会调整或改变某些细节。
  2. 重混(Remix):微妙(Subtle)为较小微调,较强(Strong)有较大差异。若没看到 Remix 按钮,点击右上方 More options 文字把常用的打上对勾。
  3. 扩展(Pan):根据选定方向自动扩展图像边界。若没看到此按钮,可能是图像已在 Discord 中生成最满意的一张不可再扩展,或 More options 文字里没打上 Pan 对勾。
  4. 缩放(Zoom):实际为“缩小视图”,会在图像周围添加额外空间展示更多内容。
  5. 更多(More):包括重新运行提示词,或打开图像的编辑模式。重新生成(Rerun)再次运行相同提示,编辑器(Editor)编辑图像特定部分。

对于星流一站式 AI 设计工具:

  1. 应用图生图:在 prompt 输入框下点击“图生图”上传本地文件,或在无限画布中图片功能区进行选择。
  2. 调整“图生图”功能区参数:参考程度分为更像原图(小幅度修改基底图像,有限增加元素)、更创意(大幅度修改基底图像,可搭配增强模型加入更多元素)、自定义(可自定义修改重绘幅度)。
  3. 增加参考纬度:点击添加按钮,会自动应用并打开“生成器”的图片参考功能。
  4. 替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片。
  5. 转换提示词:反推参考图信息填入进提示词框中。
  6. 同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中。

需要注意的是,新生成的部分和原图可能会存在色差,需要通过调整各项参数来修正,且不是每一次效果都能非常好。只要记住这个工作流,扩图还是很快的,只要替换图片改尺寸就可以了。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】最强控制插件ControlNet(8)创成式填充

我们用这张图作为例子来讲解一下,首先将它导入到图生图界面。根据情况选择大模型,一般卡通类的选择“revAnimated”,真实类的选择“Realistic Vision”,但是也不一定,如果效果不好,可以尝试一下其他的模型。图生图中比较重要的参数,一个是“缩放模式”,选择“缩放后填充空白”;然后是尺寸,如果是横向扩充就增加宽度,如果是纵向扩充就增加高度;单批数量可以根据需求填写,增加抽卡概率;最后尽量将“重绘幅度”加大到“0.8”以上,让AI充分发挥想象。接下来是controlnet的设置,升级到最新的controlnet版本,将图片导入进来。启用插件,“控制类型”选择“局部重绘”,也就是我们之前讲到过的inpaint预处理器,然后在预处理器的下拉菜单中选择“inpaint_only+lama”,这是一个新增的预处理器,专门用于扩图。另外,控制模式选择“更倾向Controlnet”,缩放模式选择“缩放后填充空白”。为了让出图更加统一,甚至还可以再增加一个reference_only的通道,来进一步巩固扩图的风格。设置好之后,点击生成,等待结果,选择一张满意的即可。我们再试验一张图,将这张图放进图生图中。有时为了更好地控制出图,我们还可以通过反推提示词的方式,增加一些文本进行控制。这样生成的图也会受到提示词的影响,可以看出图形部分的衔接还是很自然的,但是不是每一次效果都能非常好,新生成的部分和原图可能会存在色差,需要通过调整各项参数来修正。从网上找一张建筑图,使用真实系模型来扩展一下,其他参数不变,仅需要调整尺寸,并将图片分别放入“图生图”和“controlnet”中。点击生成图片就扩展好了,只要记住这个工作流,扩图还是很快的,只要替换图片改尺寸就可以了。

Midjourney 官方用户端 · 基础介绍

同时在没点击进来前就可以操作,很方便。---·放大(Upscale)将图像尺寸加倍:精细放大(Subtle):放大图像同时尽量保持原样。创意放大(Creative):在放大的同时会调整或改变图像中的某些细节。---·重混(Remix)类似于“变化”,但允许你修改提示词中的元素并替换部分文本,生成更个性化的版本。微妙(Subtle):较小的微调图像较强(Strong):较大的差异,用于向新的方向移动注意:如果没看到Remix按钮,点击右上方More options文字把常用的打上对勾即可。---·扩展(Pan)根据选定方向(箭头所指)自动扩展图像的边界。注意:如果没看到此按钮,有两个原因:1.该图像已经在Discord中生成最满意的一张,不可再扩展。2.More options文字里没打上Pan对勾。---·缩放(Zoom)实际为“缩小视图”,会在图像周围添加额外的空间,展示更多内容。1.5倍图和2倍图---·更多(More)重新运行提示词,或打开图像的编辑模式。重新生成(Rerun):再次运行相同提示编辑器(Editor):编辑图像特定部分,不论是否有提示更改---·使用(Use)将该图像用作提示的参考,可以选择:这些功能让你可以进一步微调、调整或增强生成的图像,以更符合你的创作需求。

星流一站式 AI 设计工具

1.图生图的作用?图生图功能允许用户上传一张图像,并基于该图像生成新的视觉内容1.如何使用图生图?1.1.应用图生图1.1.1.prompt输入框下,点击“图生图”上传本地文件1.1.1.无限画布中下,图片功能区进行选择1.2.调整“图生图”功能区参数参考程度更像原图:小幅度修改基底图像,有限的增加元素更创意:大幅度修改基底图像,可搭配增强模型加入更多的元素自定义:可自定义修改重绘幅度增加参考纬度:点击添加按钮,会自动的应用并打开“生成器”的图片参考功能替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片转换提示词:反推参考图信息填入进提示词框中同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中

Others are asking
请推荐一下你知道的人物头像转卡通图的平台,要求效果好,和原图相似度高,最好是免费的
以下为一些人物头像转卡通图效果好、与原图相似度高且可能免费的平台及相关操作技巧: 1. Stable Diffusion: 可以使用【X/Y/Z plot】脚本来做参数对比,将 X 轴设置为提示词相关性(取值范围 1 30,每次增加 5),Y 轴设置为重绘幅度(取值范围 0 1,每次增加 0.2)。 提示词相关性在 6 11 中间为最佳,重绘幅度 0.4 时和原图比较接近。 可使用绘图功能,如增加红色眼镜、去掉衣服图案等,局部重绘可只改变涂抹部分。 2. 复杂提示词: 如 Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 。 可根据需求调整提示词,如将 Disney 换成 Pixar,boy 换成 girl 等。 3. 通用人物模版: 用真人照片+照片描述+方法 1 的关键词来处理。 需要注意的是,不同平台的效果可能因图片和操作而有所差异,您可以自行尝试。
2025-02-06
有什么软件可以基于原图扩图?除了adobe
以下为您介绍两款除 Adobe 外可以基于原图扩图的软件: 1. 【SD】超清无损放大器 StableSR: 作者:白马少年。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,包括“脚本”和“后期处理”。脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片包括野图,但无法还原原图不清晰的地方。 今天介绍的 StableSR 可以算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式是在扩展面板中搜索 StableSR 直接安装,或者将下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI 即可在脚本中找到。 2. 【SD】脸部修复插件 After Detailer: 图片扩充好后,PS 的这个功能又快又好。将 PS 中调整好的图再次导入到 Stable Diffusion 的“图生图”中,使用 controlnet 的 tile 模型进行细化,再使用“Ultimate SD upscale”放大脚本将原图扩充到 2 倍大小。 如果想要这个插件,可以添加公众号【白马与少年】,回复【SD】获取。
2024-12-30
如何优化原图,加入妆容,不修改五官
以下是关于优化原图并加入妆容、不修改五官的一些方法和步骤: 1. 在放大算法方面,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 后不甚理想。ESRGAN_4x、SwinR 4x 对 0.5 以下的重绘幅度有较好支持。 2. Hires step 表示进行这一步时计算的步数。 3. Denoising strength 字面翻译是降噪强度,表现为最后生成图片对原始输入图像内容的变化程度。一般阈值是 0.7 左右,超过 0.7 和原图基本上无关,0.3 以下是稍微改一些。实际执行中,具体步骤为 Denoising strength Sampling Steps。 4. 面部修复可修复画面中人物的面部,但非写实风格人物开启面部修复可能导致面部崩坏。 5. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。可参考文章——。但此步骤无法将照片中头发、衣服等元素变清晰。 6. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免对原图产生干扰。 7. 在星流一站式 AI 设计工具中,点击生成器下方的切换按钮可切换到高级模式。基础模型允许使用更多微调大模型,图片参考允许使用更多图像控制功能。星流基础大模型下,增加了 tile 分块与 softedge 线稿。切换不同系列的基础模型可使用与之配套的图像控制功能,包括基础模型 F.1、基础模型 XL、基础模型 1.5。高清分辨率修复利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型 xl 和 1.5 模型)。放大算法影响图像放大后的质量,建议默认。重绘幅度与初步生成的图像的相似度有关。采样器方面,有些在细节处理上表现更佳如 DPM++ 2M,有些生成速度更快如 Euler。采样步数一般越多,模型对图像的生成和优化越充分,但会增加生成时间。随机种子是文生图的随机数种子,通过设置相同的随机数种子,在相同参数配置下可生成相同图像。CFG Scale 控制生成图像与提示词一致性。脸部/手部修复利用算法对人像的脸部或者手部进行修复。
2024-12-02
如何搭建利用产品原图和模特模板生成商业图的工作流 或者有没有这类ai 应用
以下是关于利用产品原图和模特模板生成商业图的工作流及相关 AI 应用的信息: 美国独立站搭建工作流中,有给模特戴上珠宝饰品的应用。 大淘宝设计部在主题活动页面、超级品类日传播拍摄创意、产品营销视觉、定制模特生成、产品场景生成等方面应用了 AI。例如,七夕主题活动页面通过 AI 生成不受外部拍摄条件限制的素材;在 UI 设计场景中,利用 SD 中 controlnet 生成指定范围内的 ICON、界面皮肤等;通过对 AI 大模型的训练和应用,提升合成模特的真实性和美感,提供定制化线上真人模特体验,如 AI 试衣间、AI 写真等;还能根据商品图和用户自定义输入生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。
2024-11-22
有什么工具,可以将上传图片上的文字全部翻译成另一种语言,并且生成将原图文字变成翻译结果的新图片
以下为您推荐一些能够将上传图片上的文字翻译成另一种语言,并生成新图片的工具: 1. OpenAI 的 DALL·E :通过图像生成端点可以创建原始图像,编辑端点可以编辑和扩展图像。但主要侧重于图像的生成和编辑,对于图片文字翻译和生成新图片的针对性功能可能不太突出。 2. Reccloud :免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。 3. 绘影字幕 :一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持多种语言,准确率高,还能自定义字幕样式。 4. Arctime :对视频语音自动识别并转换为字幕,支持自动打轴,支持主流平台和多种字幕功能。 5. 网易见外 :国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-04
有免费的文生图,而且效果很好的ai软件
以下为一些免费且效果较好的文生图 AI 软件及相关简易上手教程: Liblibai: 1. 定主题:明确生成图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择贴近的,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora 以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设成 2。 6. Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开。 7. 负向提示词 Negative Prompt:同样用英文单词和短语组合。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间。 10. 尺寸:根据个人喜好和需求选择。 Dreamina 即梦: 1. 定主题:确定生成图片的主题、风格和信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的,如麦橘、墨幽的系列模型。 3. 选择 lora:参考广场上好看的帖子选择合适的 lora。 Tusiart: 1. 定主题:明确生成图片的主题、风格和信息。 2. 选择基础模型 Checkpoint:选择贴近主题的,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找重叠内容的 lora 控制图片效果和质量。 4. ControlNet:可控制图片中特定图像,如人物姿态、特定文字、艺术化二维码等。 5. 局部重绘:后续学习。 6. 设置 VAE:选择 840000 。 7. Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文单词和短语组合。 9. 采样算法:一般选 DPM++2M Karras,参考模型作者推荐的采样器更稳妥。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间。 11. 尺寸:按需选择。 此外,还有一些其他的文生图工具,如: Runway:网址 https://runwayml.com/ ,有网页和 app ,方便使用。 Pika:网址 https://pika.art/ 、https://discord.gg/pika ,已收费。 PixVerse:网址 https://pixverse.ai/ ,人少不怎么排队,还有换脸功能。 GigaStudio:网址 https://studio.gigaai.cc/ ,10 个免费极光,创作者可申请免费会员,文生视频效果好。 Heygen:网址 https://www.heygen.com/ ,最近不好注册使用。 Krea:网址 https://www.krea.ai/ ,12 月 13 日免费公测。 Kaiber:网址 https://kaiber.ai/ 。 Moonvalley:网址 https://moonvalley.ai/ 。 Mootion:网址 https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:网址 https://www.miraclevision.com/ 。 Neverends:网址 https://neverends.life/create ,2 次免费体验,操作傻瓜。 SD:Animatediff SVD deforum 。 Morph Studio:网址 https://app.morphstudio.com/ ,还在内测。 七火山:网址 https://etna.7volcanoes.com/?ref=pidoutv.com 。
2025-02-19
文生图什么ai软件好
以下是一些较好的文生图 AI 软件: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因其高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 此外,还有以下文生视频的 AI 产品: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 2. SVD:若熟悉 Stable Diffusion,可安装此最新插件,在图片基础上直接生成视频,由 Stability AI 开源。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 4. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生图和文生视频工具及相关信息,您可以查看以下网站: 1. https://www.waytoagi.com/category/104 2. https://www.waytoagi.com/category/38 以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。内容由 AI 大模型生成,请仔细甄别。
2025-02-19
图片生图片
以下是关于图片生图片的相关知识: Tusiart 简易上手教程 概念与功能说明: 1. 图生图:上传图片后,SD 会根据您的图片、选择的模型、输入的 prompt 等信息进行重绘。重绘幅度越大,输出的图与输入的图差别越大。 2. 尺寸:图片生成的尺寸大小。尺寸过小,AI 生成内容有限;尺寸过大,AI 可能放飞自我。若要高清图,可设置中等尺寸并用高分辨率修复。 3. 采样算法:即让 AI 用何种算法生图。 4. 采样次数:AI 调整图片内容的次数。次数越多,调整越精密,理论上出图效果越好,但耗时越长。不过并非次数越多越好,效果提升并非线性,过多后效果增长曲线会放平并开始震荡。 5. 提示词相关性:指图像与 prompt 的匹配程度。数字增大将使图像更接近提示,但过高会导致图像质量下降。 6. 随机种子 seed:生成的每张图都有随机种子。固定种子后,可进行“控制变量”操作,如修改提示词等。首次生成图时无种子,无需操作。 7. Clip Skip:可用于生成图片后控制、调整构图变化,一般设为 2,早期无需过多关注。 8. ENSD:eta 噪声种子增量,默认设为 0 即可。 简明操作流程: 在会用文生图之后,上传图片即可尝试图生图。注意重绘幅度,最小可选 0.01 的重绘,输出的图片差别较明显。局部重绘等高阶功能不在本简明操作流程中,后续进阶内容的教程再展开。 Liblibai 简易上手教程 简明操作流程: 在会用文生图之后,上传图片即可尝试图生图。注意重绘幅度,最小可选 0.01 的重绘,输出的图片差别较明显。局部重绘等高阶功能不在本简明操作流程中,后续进阶内容的教程再展开。
2025-02-18
AI生图
以下是关于 AI 生图的详细教程: 一、Liblibai 简易上手教程 1. 定主题:明确您想要生成的图片主题、风格和表达的信息。 2. 选择 Checkpoint:根据主题选择贴近内容的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需考虑语法和长句。 7. 负向提示词 Negative Prompt:同样用英文单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:使用 DPM++2M Karras 时,在 30 40 之间,过多意义不大且慢,过少出图效果差。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。 二、AI 线上绘画教程 1. 背景:工作中需要大量图片时,AI 生图是高效解决办法,主流工具如 midjourney 付费成本高,stable diffusion 硬件门槛不低,可选择免费在线 SD 工具网站如。 2. 目标:让入门玩家在半个小时内自由上手创作绘图。 3. 注意事项:本教程适用于入门玩家,若有疑问可在评论区联系或加微信 designurlife1st 沟通,教程内容会持续更新。 三、Tusiart 简易上手教程 1. 图生图:上传图片后,sd 根据图片、模型、prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 2. 尺寸:太小生成内容有限,太大 AI 易放飞自我,如需高清图,可设中等尺寸并用高分辨率修复。 3. 采样算法:即让 AI 用何种算法生图。 4. 采样次数:次数越多调整越精密,效果理论上更好但耗时越长,并非越多越好。 5. 提示词相关性:数字增大图像更接近提示词,但过高会使图像质量下降。 6. 随机种子 seed:固定种子可对图片进行“控制变量”操作,首次生成图时无种子。 7. Clip Skip:一般设为 2,早期无需过多关注。 8. ENSD:eta 噪声种子增量,默认 0 即可。
2025-02-17
Ai生图和生视频和电脑算力的关系
AI 生图和生视频与电脑算力密切相关。 在生成图像和视频的过程中,需要强大的算力来处理复杂的计算任务。例如,像 PIKA1.0 这样的模型,在文生图和文生视频方面表现出色,其高质量和稳定性的输出依赖于足够的算力支持。 拥有大规模 GPU 集群、超算集群、云渲染平台等强大算力资源的企业或个人,能够更高效地完成生图和生视频的任务。 同时,未来算力的重点将从训练模型转向增强推理能力,这也将对 AI 生图和生视频的发展产生重要影响。 此外,一些新的模型和技术不断涌现,如 o1 推理模型,其在给出最终结果前会反复推演和验证,以提供更准确的结果。而像 OpenAI 发布会公布的 Sora v2 功能,能够生成 1 分钟长度的视频,并支持多种形式的转换,提升了多媒体创作的灵活性。 总之,电脑算力是实现高质量 AI 生图和生视频的重要支撑和保障。
2025-02-17
有哪些免费的文生图中文软件
以下是一些免费的文生图中文软件: 1. 豆包 App 支持文生图中文文字生成。 2. Stability AI 推出的基于 Discord 的媒体生成和编辑工具可用于文生图,您可以通过以下步骤使用: 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 进入 ARTISAN 频道,任意选择一个频道。 输入/dream 会提示您没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。输入/dream 提示词,这部分和 MJ 类似,可选参数有五类,包括提示词(必填项)、负面提示词(选填项)、种子值(选填项)、长宽比(选填项)、模型选择(选填项)、张数(选填项)。完成后选择其中一张。 3. 您还可以参考以下教程: SD 做中文文字生成的教程: 找到一款喜欢的字体,写上主题例如“端午”。 打开 SD,选择文生图,输入关键词咒语。 打开 Controlnet,启用 lineart 和 canny 固定字体,如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 打开高清修复,分辨率联系 1024 以上,步数:29 60 。 直接生成。这里可以举一反三,选择一些水果模型,珠宝模型,毛毡等等快来试一试吧,附免费参数。
2025-02-16
有什么AI工具 可以转换视频的尺寸
以下是一些可以转换视频尺寸的 AI 工具: 1. Topaz Video AI:可通过以下链接获取:https://www.topazlabs.com/topazvideoai 。超级会员 V6 可通过百度网盘分享获取相关文件,链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 ,提取码:16d1 ,复制这段内容打开「百度网盘 APP 即可获取」。 2. Kraken.io:主要用于图像压缩,但也提供了免费的图像放大功能,能保证图像的细节清晰度。 3. Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术能够将图像放大并赋予艺术效果,支持多种滤镜和风格。 4. RealESRGAN:https://replicate.com/nightmareai/realesrgan ,这是一个基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次后要收费。 5. Stability AI 推出的基于 Discord 的媒体生成和编辑工具:包括搜索和替换(无需蒙版,通过搜索提示识别对象并替换)、创意放大(将低分辨率或低质量图像放大至 4K 分辨率,同时可以附加提示)、外扩(在图像中添加内容以扩展空间)、控制草图(将手绘草图转换为高质量图像)、删除背景(准确分割前景并删除背景)、基于初始图像使用 Stable Video Diffusion 生成短视频等功能。
2024-10-22
ai能生成多大尺寸的图?大型线下营销活动海报需要打印,ai出的图精度够吗?
AI 可以生成多种尺寸的图片,具体尺寸取决于你的需求和 AI 工具的能力。无界 AI 已将尺寸与用途标注在选项中,使用时根据需要选择即可。 对于大型线下营销活动海报的打印,AI 生成的图片精度可能不够。虽然 AI 可以生成高分辨率的图片,但它们可能无法满足大型海报所需的打印质量。在这种情况下,建议你使用专业的设计软件或请设计师制作高质量的海报。
2024-05-23
图片扩展
以下是关于图片扩展的相关内容: 使用 SD 进行图片扩展: 1. 将图片导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类一般选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要的参数:“缩放模式”选择“缩放后填充空白”;根据扩展方向调整尺寸;单批数量按需填写;加大“重绘幅度”到“0.8”以上。 4. 升级到最新的 ControlNet 版本,将图片导入,启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 ControlNet”,缩放模式选择“缩放后填充空白”。 5. 为使风格统一,可增加“reference_only”通道。 6. 设置好后点击生成,选择满意的结果。 7. 试验时可通过反推提示词增加文本控制,但效果不一定每次都好,可能存在色差,需调整参数修正。 8. 以建筑图为例,调整尺寸,分别放入“图生图”和“ControlNet”中点击生成即可。记住工作流,替换图片改尺寸就能快速扩图。 悠船中的图片调整: 1. 常用内容包括变化(细微或强烈改变)、高清(“直接”或“创意”放大)、风格变化(基于垫图再创作)、拓展(上下左右扩展图片)、缩放(镜头调整)、局部重绘(选择区域建议大些)。 2. 使用图片即垫图,使用风格即参考风格,使用提示词即复制提示词。 3. 在悠船中可利用垫图和提示词配合生成符合要求的建筑、风景、文物等,将图片复制到提示词框并填写提示词描述。 悠船的其他操作: 1. 基础页面操作包括想象历史(创作记录、创建文件夹、筛选器、预览形式)和套餐选择(年费模式、月费模式,价格越高对应做图数量、同时出图数量越多、生成速度越快,初次使用者可先从免费版开始,同时出图 3 指三列图,每列 4 张)。
2025-01-20
图片扩展
以下是关于图片扩展的详细介绍: 使用 SD 进行图片扩展: 1. 将图片导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类一般选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要的参数设置: 缩放模式选择“缩放后填充空白”。 按需求增加宽度或高度来调整尺寸。 单批数量可按需填写以增加抽卡概率。 将“重绘幅度”加大到“0.8”以上。 4. ControlNet 的设置: 升级到最新版本,导入图片。 启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 ControlNet”,缩放模式选择“缩放后填充空白”。 还可增加一个 reference_only 的通道巩固扩图风格。 5. 点击生成,等待结果并选择满意的图片。 使用悠船进行图片扩展: 1. 点击进入对应的图片,常用的操作有变化、高清、重塑、扩图等。 变化:细微改变幅度小,强烈改变幅度大。 高清:“直接”表示直接出高清,“创意”表示在原图基础上进行微小优化调整。 风格变化:基于上传图片(垫图)再创作。 拓展:可上下左右扩展图片。 缩放:指镜头,如 2x 表示镜头拉远 2 倍。 局部重绘:选择区域建议大一些,太小无法修改。 2. 操作时,使用图片即垫图,使用风格即参考图片风格,使用提示词即复制图片的提示词。 在进行图片扩展时,可能不是每次效果都非常好,新生成部分和原图可能存在色差,需要通过调整各项参数来修正。记住工作流,替换图片改尺寸即可快速扩图。
2025-01-20
如何把已经写好的内容放入ai做ppt,并且ai不会自动扩展。
要将已写好的内容放入 AI 做 PPT 且不让 AI 自动扩展,可以参考以下方法: 1. 使用 Kimi.ai 等工具将思维导图图片转成 PPT。 2. 对于 AI 辅助生成 PPT,其原理和作用包括: 减轻排版工作的压力。 生成打底的内容,减轻人写内容的工作。 文章生成 PPT 时,让 AI 帮忙摘要内容,生成大纲列表;主题生成 PPT 时,让 AI 根据主题扩充成大纲列表,乃至具体内容。 在特定场景下可直接使用,如学生快速为小组展示配 PPT。 3. 具体流程为:用户输入内容,AI 输出,然后通过排版网站处理。网站把 AI 输出的文本丢给 LLM,让其根据内容在已有的 UI 组件中选择更适合的组件,按时间线为每页 PPT 的文字选出整个 PPT 中每一页的 UI 组件。有的网站如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。 4. 另外,还可以参考以下案例中的方法,如在办公场景中,用 ChatGPT 生成 Markdown 语法的内容,再借用 MindShow 工具把 Markdown 内容转换为精美的 PPT。
2025-01-14
有没有什么能够把手绘扩展成插画的 AI?
以下是一些能够把手绘扩展成插画的 AI 工具或方法: 1. Stable Diffusion:在有参考图的情况下,可以对原图进行风格化转变。若要创作原创卡通插画,可不使用 ControlNet。通过调整提示词,如“一个女孩坐在沙发上,吃西瓜,看电视,夏天”,能生成插画。完成后可能存在小瑕疵,可在 PS 里后期修复。 2. 公众号【白马与少年】:如果想要相关模型和 Lora,可以添加该公众号,回复【SD】获取。 需要注意的是,在使用这些工具时,可能需要一定的操作技巧和相关知识。
2025-01-13
通过ollama和通义千问大模型,如果要实现一个智能机器人,支持模型微调,扩展知识库,问答记忆功能的实现步骤
要通过 Ollama 和通义千问大模型实现一个支持模型微调、扩展知识库和问答记忆功能的智能机器人,可参考以下步骤: 1. 安装和启动 Ollama 服务: 在 Mac 上启动 Ollama 应用程序,在 Linux 上通过 ollama serve 启动。 通过 ollama list 确认服务是否已启动。 2. 下载模型: 可下载如 Gemma(7B 模型)、Mistral(7B 模型)、Mixtral(87B 的 MoE 模型)、Qwen(通义千问,7B 模型)等。 3. 了解 Ollama 的特点和优势: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于在 macOS、Windows 和 Linux 系统使用,支持 CPU 和 GPU。 提供模型库,可通过 https://ollama.com/library 查找和下载不同模型,满足不同需求和硬件条件。 支持自定义模型,如修改温度参数调整创造性和连贯性,或设置特定系统消息。 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,有多种集成插件和界面。 4. 安装相关模型:访问 https://ollama.com/download/ 进行下载安装。 5. 选择文本向量模型:使用文本向量模型 bgem3,可从 https://huggingface.co/BAAI/bgem3 下载。 6. 利用 FAISS 创建向量存储:从 hf 下载好模型放置在指定路径,通过相关函数创建高效的向量存储。 7. 实现 RAG:基于用户问题从向量数据库中检索相关段落,根据设定阈值过滤,让模型参考上下文信息回答问题。 8. 创建网页 UI:通过 gradio 创建网页 UI 并进行评测。获取完整代码可关注公众号发送 fin 获取 github 仓库代码链接。 9. 进行问答测试:对同样的问题和上下文,基于 Qwen7b、Gemma、Mistral、Mixtral 和 GPT4 分别进行多次测试。
2024-08-16
扩展以下内容到500字:数智中医是中医药融入“一带一路”的抓手当前,充分融合互联网、大数据、物联网、云计算、人工智能AI、区块链等数智技术对传统中医药服务进行全方位、全链条优化,提高全要素生产率,构建一批示范中医医疗机构、中医馆、中医健管中心,创新数智中医“检测、诊断、治疗、评价、管理”的新中医服务闭环,促进数智中医“产学研用”的国际合作及产业发展,助推重庆成为数智中医发展新高地。
数智中医作为中医药融入“一带一路”的重要抓手,在当今时代具有极其重要的意义。 如今,互联网、大数据、物联网、云计算、人工智能 AI、区块链等数智技术蓬勃发展,为传统中医药服务带来了全新的机遇。通过充分融合这些先进技术,能够对传统中医药服务进行全方位、全链条的优化。这种优化涵盖了从检测到管理的各个环节,全面提升了服务的质量和效率。 在检测方面,借助先进的技术手段,可以更精准地获取患者的身体状况信息,为后续的诊断提供更可靠的数据支持。诊断环节则因数智技术的融入而更加准确和高效,能够快速识别病症的根源。治疗过程中,数智技术能够辅助医生制定更个性化、更科学的治疗方案,提高治疗效果。 评价环节也得以创新,能够更全面、客观地评估治疗效果和患者的康复情况。而在管理方面,数智技术有助于实现对医疗资源的合理调配和高效管理,提高整个医疗服务体系的运行效率。 构建一批示范中医医疗机构、中医馆、中医健管中心,是推动数智中医发展的重要举措。这些示范机构将成为展示数智中医成果的窗口,吸引更多的关注和投入。同时,创新数智中医“检测、诊断、治疗、评价、管理”的新中医服务闭环,能够形成一个良性循环,不断提升服务水平和质量。 促进数智中医“产学研用”的国际合作及产业发展,对于推动中医药走向世界具有关键作用。通过国际合作,可以吸收借鉴其他国家的先进经验和技术,进一步完善数智中医体系。这将有助于提升我国中医药在国际上的影响力,为全球健康事业贡献中国智慧和力量。 重庆作为一个具有发展潜力的地区,有望借助数智中医的发展,成为这一领域的新高地,引领行业的发展潮流,为当地乃至全国的中医药事业注入新的活力。
2024-08-12