Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何优化原图,加入妆容,不修改五官

Answer

以下是关于优化原图并加入妆容、不修改五官的一些方法和步骤:

  1. 在放大算法方面,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 后不甚理想。ESRGAN_4x、SwinR 4x 对 0.5 以下的重绘幅度有较好支持。
  2. Hires step 表示进行这一步时计算的步数。
  3. Denoising strength 字面翻译是降噪强度,表现为最后生成图片对原始输入图像内容的变化程度。一般阈值是 0.7 左右,超过 0.7 和原图基本上无关,0.3 以下是稍微改一些。实际执行中,具体步骤为 Denoising strength * Sampling Steps。
  4. 面部修复可修复画面中人物的面部,但非写实风格人物开启面部修复可能导致面部崩坏。
  5. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。可参考文章——【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿。但此步骤无法将照片中头发、衣服等元素变清晰。
  6. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章——【Stable Diffusion】超清无损放大器 StableSR。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免对原图产生干扰。
  7. 在星流一站式 AI 设计工具中,点击生成器下方的切换按钮可切换到高级模式。基础模型允许使用更多微调大模型,图片参考允许使用更多图像控制功能。星流基础大模型下,增加了 tile 分块与 softedge 线稿。切换不同系列的基础模型可使用与之配套的图像控制功能,包括基础模型 F.1、基础模型 XL、基础模型 1.5。高清分辨率修复利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型 xl 和 1.5 模型)。放大算法影响图像放大后的质量,建议默认。重绘幅度与初步生成的图像的相似度有关。采样器方面,有些在细节处理上表现更佳如 DPM++ 2M,有些生成速度更快如 Euler。采样步数一般越多,模型对图像的生成和优化越充分,但会增加生成时间。随机种子是文生图的随机数种子,通过设置相同的随机数种子,在相同参数配置下可生成相同图像。CFG Scale 控制生成图像与提示词一致性。脸部/手部修复利用算法对人像的脸部或者手部进行修复。
Content generated by AI large model, please carefully verify (powered by aily)

References

SD新手:入门图文教程

放大算法中,Latent在许多情况下效果不错,但重绘幅度小于0.5后就不甚理想。ESRGAN_4x、SwinR 4x对0.5以下的重绘幅度有较好支持。Hires step表示在进行这一步时计算的步数。Denoising strength字面翻译是降噪强度,表现为最后生成图片对原始输入图像内容的变化程度。该值越高,放大后图像就比放大前图像差别越大。低denoising意味着修正原图,高denoising就和原图就没有大的相关性了。一般来讲阈值是0.7左右,超过0.7和原图基本上无关,0.3以下就是稍微改一些。实际执行中,具体的执行步骤为Denoising strength * Sampling Steps。面部修复修复画面中人物的面部,但是非写实风格的人物开启面部修复可能导致面部崩坏。点击“生成”

【SD】用AI给老照片上色,岁月不改它模样

将照片放入到后期处理中,使用GFPGAN算法将人脸变清晰,不知道这个功能的可以参考我这篇文章——[【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21#wechat_redirect)。这个步骤,可以将我们的五官进行重绘,但是却没有办法将照片中的头发、衣服等其他元素变清晰。所以,接下来我将图片再发送到图生图当中,打开stableSR脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准的,也是重绘效果最好的,不知道的朋友可以参考我的这篇文章——[【Stable Diffusion】超清无损放大器StableSR](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21#wechat_redirect)。切换到sd2.1的模型进行修复,vae选择vqgan,提示词可以什么都不写,以免对原图产生干扰。

星流一站式 AI 设计工具

点击生成器下方的切换按钮进行切换基础模型:允许使用更多的微调大模型图片参考:允许使用更多的图像控制功能星流基础大模型下,增加了tile分块与softedge线稿切换不同的系列的基础模型可以使用与之配套的图像控制功能基础模型F.1基础模型XL基础模型1.5高清分辨率修复:利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型xl和1.5模型)放大算法:影响图像放大后的图像质量,建议默认即可重绘幅度:与初步生成的图像的相似度其他参数默认即可参数:允许调整更多的高级参数采样器:采样方法决定了模型在生成图像过程中的出图质量,有些采样器在细节处理上表现更佳比如DPM++ 2M,而有些则在生成速度上更快,比如Euler。采样步数:一般来说,步数越多,模型对图像的生成和优化越充分,但同时也会增加生成时间。随机种子:文生图的随机数种子是一个用于生成过程的整数值。通过设置相同的随机数种子,可以确保在相同的参数配置下生成相同的图像。CFG Scale:控制生成图像与提示词一致性的重要参数。脸部/手部修复:利用算法对人像的脸部或者手部进行修复

Others are asking
有什么软件可以基于原图扩图?除了adobe
以下为您介绍两款除 Adobe 外可以基于原图扩图的软件: 1. 【SD】超清无损放大器 StableSR: 作者:白马少年。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,包括“脚本”和“后期处理”。脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片包括野图,但无法还原原图不清晰的地方。 今天介绍的 StableSR 可以算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式是在扩展面板中搜索 StableSR 直接安装,或者将下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI 即可在脚本中找到。 2. 【SD】脸部修复插件 After Detailer: 图片扩充好后,PS 的这个功能又快又好。将 PS 中调整好的图再次导入到 Stable Diffusion 的“图生图”中,使用 controlnet 的 tile 模型进行细化,再使用“Ultimate SD upscale”放大脚本将原图扩充到 2 倍大小。 如果想要这个插件,可以添加公众号【白马与少年】,回复【SD】获取。
2024-12-30
如何搭建利用产品原图和模特模板生成商业图的工作流 或者有没有这类ai 应用
以下是关于利用产品原图和模特模板生成商业图的工作流及相关 AI 应用的信息: 美国独立站搭建工作流中,有给模特戴上珠宝饰品的应用。 大淘宝设计部在主题活动页面、超级品类日传播拍摄创意、产品营销视觉、定制模特生成、产品场景生成等方面应用了 AI。例如,七夕主题活动页面通过 AI 生成不受外部拍摄条件限制的素材;在 UI 设计场景中,利用 SD 中 controlnet 生成指定范围内的 ICON、界面皮肤等;通过对 AI 大模型的训练和应用,提升合成模特的真实性和美感,提供定制化线上真人模特体验,如 AI 试衣间、AI 写真等;还能根据商品图和用户自定义输入生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。
2024-11-22
有什么工具,可以将上传图片上的文字全部翻译成另一种语言,并且生成将原图文字变成翻译结果的新图片
以下为您推荐一些能够将上传图片上的文字翻译成另一种语言,并生成新图片的工具: 1. OpenAI 的 DALL·E :通过图像生成端点可以创建原始图像,编辑端点可以编辑和扩展图像。但主要侧重于图像的生成和编辑,对于图片文字翻译和生成新图片的针对性功能可能不太突出。 2. Reccloud :免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。 3. 绘影字幕 :一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持多种语言,准确率高,还能自定义字幕样式。 4. Arctime :对视频语音自动识别并转换为字幕,支持自动打轴,支持主流平台和多种字幕功能。 5. 网易见外 :国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-04
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
请推荐一个好的优化简历的工具
以下为您推荐几个优化简历的工具: 1. ResumeMatcher:这是一个 AI 驱动的开源简历优化工具。它能提供智能关键词匹配和深入的分析见解,有助于提升简历通过 ATS 筛选的几率。采用 FastEmbed 计算简历与职位匹配度,并结合 textacy 提取核心术语,精准优化简历内容。相关链接: 2. Napkin:这是一个生成多样风格图表的 AI 工具。可将选中文本转换为 mermaid 格式图表,支持 SVG 渲染,交互流畅且模板丰富。后台可能使用轻量模型(如 GPT4 mini),自动选择图标,生成多套模板供选择。当前免费,适合需要快速生成图表的用户。相关链接: 3. 作者开发的使用 GPT4 技术的实时转录工具 Ecoute:可在文本框中为求职者的麦克风输入提供实时转录,还使用 OpenAI 的 GPT3.5 生成建议的响应。开源地址:https://github.com/SevaSk/ecoute
2025-01-20
生成AI视频的提示词如何优化更好
以下是关于优化生成 AI 视频提示词的一些方法: 1. 详细描述各部分:例如将“一只小狗在草地上散步”拓展为“一只金色毛发的狗悠然自得地在阳光洒满的草地上行走,草叶轻轻地在它的爪下弯曲。微风拂过,它的毛发随风轻动,时不时低下头嗅闻着大地。远处,夕阳的余晖拉长了影子,营造出一种宁静祥和的氛围”,增加对主体、环境和动作的详细描述,能使生成的视频更稳定、提升美感。 2. 调整不满意结果:用具体动作表达代替抽象表达,如“踱步>走到画面右侧”“小狗让他开心>小狗摇尾巴,男人脸上出现微笑”等。把重点想表达的内容前置,精简提示词,删去不重要部分。获得稳定结果后,可增加更多配合动作和运镜,如将“一个男人在冲浪,镜头跟随他的运动”修改为“一个男人在冲浪,镜头跟随他的运动,镜头特写他的脸部,他对着镜头竖大拇指”。 3. 合理运用基础参数:选择固定相机后镜头会保持不动,未选择则倾向生成带有运镜的视频,可通过在提示词里加入环绕、镜头拉远等描述控制运镜。默认开启提示词增强会对输入的提示词进行修改以获得更大运动效果,关闭则遵循输入的提示词生成视频。 4. 利用海螺 AI 的功能:海螺 AI 视频模型能识别图片、理解指令,不依靠特效模板实现惊艳特效,呈现细腻表情,还上线了提示词优化功能,开放 2000 字的提示词空间,为创作者提供更多发挥空间。同时,为达到更好效果,设计了两类 Prompt 的参考公式。
2025-01-17
怎样用ai优化视频剪辑
以下是关于如何用 AI 优化视频剪辑的相关内容: 在整个视频剪辑操作流程中,AI 的应用相对较少。但仍有一些技巧和方法可以利用: 1. 导入素材:将视频、音频等素材按顺序导入到剪映编辑区中。 2. 添加效果: 音频加速:若睿声生成的配音语速慢且有 AI 味儿,可使用剪映的音频变速功能加速配音,以配合视频前段的快节奏。具体操作是选中激活音频,点击功能区的变速按钮,调整速率并测试效果。 快镜头慢放:对于难以生成快速运动效果的镜头,如活塞运动,可借鉴影视中精彩打斗场面的慢放思路。选择激活活塞运动分镜,在功能区选择变速、曲线变速、蒙太奇,以达到电影级快镜头慢放的效果。若只有活塞向下运动且配音长度不符,可选中激活这一片段,复制并插入到原片段后,右键选择基础编辑、倒放,根据配音长度适当复制或裁剪复制/倒放的片段,实现活塞往复运动的效果。 对于不同的受众群体,AI 在视频剪辑中的应用和优势有所不同: 1. 专业创作者(艺术家、影视人等):AI 生成能够为作品赋予独特风格和想象力,为创作者提供灵感。配合高超的剪辑技巧和叙事能力,可制作出超乎想象的效果。低成本动捕能大幅降低后期制作的门槛和成本,自动识别背景生成绿幕、视频主体跟随运动等能够辅助视频编辑,为后期制作增加更多空间。目前该应用主要集中在音乐 MV、短篇电影、动漫等方向。 2. 自媒体、非专业创作者:这部分人群通常有明确的视频剪辑痛点。比如科技、财经、资讯类重脚本内容的视频制作时,寻找视频素材耗时且需注意版权问题。一些产品已在发力脚本生成分镜、视频,帮助创作者降低视频素材制作门槛。不同平台适合不同内容形式,创作者想将同一素材在不同平台分发意味着制作成本升高,而 OpusClip 提供的长视频转短视频致力于解决这一痛点。 3. 企业客户:对于资金不足的小企业、非盈利机构,AI 视频生成可大幅缩减成本。 使用剪映进行剪辑时,其有方便之处也有不足: 方便在于有很多人性化设计以及简单的音效库/小特效;难用在于无法协同工作,导出工程文件,无法与各软件进行工程联通,应用起来难以使视频内容达到更好的商业化效果。 剪辑流程一般为: 1. 视频粗剪:先确定画面逻辑,声音作部分参考,快速对片子全貌有整体把握,把素材先放上去,再看哪些部分需要细节调整和画面替换。 2. 视频定剪:将画面素材调整和替换到满意效果。 3. 音效/音乐:剪映中有简单音效库,制作简单短片可用,复杂真实音效可能需另外制作。使用商用音乐要注意购买版权或使用无版权音乐。 4. 特效:可根据需要添加一些光的效果等。 5. 包装(如字幕):字幕最后添加,剪映可智能匹配字幕再修改。 此外,还为您推荐一些剪辑相关的书籍。
2025-01-16
prompt优化
以下是关于优化 Prompt 的相关知识: 1. 明确具体的描述:使用更具体、细节的词语和短语来描述您想要表达的内容,避免使用过于笼统的词语,以便 AI 更准确地理解您的需求。 2. 添加视觉参考:在 Prompt 中插入相关的图片参考,可显著提高 AI 理解您的意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整 Prompt 的整体语气和情感色彩,让 AI 能生成出期望的语境和情绪。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最有针对性、最准确表达需求的 Prompt 描述方式。 5. 增加约束条件:为避免 AI 产生意料之外的输出,可以在 Prompt 中添加限制性条件,如分辨率、比例等。 6. 分步骤构建 Prompt:将复杂的需求拆解为逐步的子 Prompt,引导 AI 先生成基本结构,再逐步添加细节和完善。 7. 参考优秀案例:研究 AI 社区流行的、被证明有效的 Prompt 范例,借鉴其中的写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同的 Prompt 写法,并根据输出效果反馈持续优化完善,直至达到理想结果。 总之,编写高质量 Prompt 需要不断实践、总结经验,熟悉 AI 模型的能力边界。保持开放的思维尝试创新的描述方式也很有帮助。 另外,关于 Grok 角色设定 prompt 方面,目前 Grok 没有完全开放,可尝试直接用 Grok 的设定在其他大语言模型做尝试,比如先直接问问题,参考 Grok 的人物设定,对 prompt 稍微做优化。 在提示工程方面,在整个提示开发生命周期中,值得从最具能力的模型和无约束的提示长度开始,以建立性能上限。一旦达到所需的输出质量,可以尝试优化,如缩短提示或使用较小的模型,以根据需要降低延迟和成本。通过遵循测试驱动的方法论,并在一开始仔细定义任务和成功标准,投入时间设计健壮的测试用例和提示,将在模型性能和可维护性方面获得好处。
2025-01-13
AI写作 (一)AI写作的优势和应用场景 (二)利用AI辅助新闻通讯稿写作的方法:如获取灵感、优化语言等
AI 写作具有以下优势和应用场景: 优势:能够快速生成内容,提高写作效率;可以提供新的思路和创意。 应用场景:广泛应用于新闻通讯、营销文案、小说创作等领域。 利用 AI 辅助新闻通讯稿写作的方法包括: 头脑风暴:在写作前让 AI 提供选题建议或内容方向。 查找资料:借助 AI 快速汇总相关主题信息,节省查阅资料时间。 优化表达:写完初稿后,让 AI 检查语法、改善表达。 拓展思路:写作卡壳时,询问 AI 以开拓新的思路。 需要注意的是,写作不仅是产出内容,更是思考的过程,不应过度依赖 AI 写作,而应注重提升自身写作技巧和思考深度。同时,大语言模型在写作中很有用,如用于集思广益、头脑风暴等,但也存在编造故事产生错误信息的问题,需要鉴别信息准确性。另外,选好模型、克服平庸、显式归纳文本特征等方法有助于用 AI 写出好文字。
2025-01-13
什么AI可以帮助我优化PPT的排版
以下是一些可以帮助您优化 PPT 排版的 AI 工具和相关思路: 1. 爱设计:操作方式基于 Markdown 语法的内容来完成 PPT 生成。具体步骤可移步到 MindShow、闪击、爱设计等章节。下载后的 PPT 可按照公司要求自行删改内容以优化字体、图片等元素。 2. Gamma、AiPPT、iSlide、创客贴、WPS 等:这些工具对文本的多级排列有更高要求,便于摒弃呆板单调的表现形式,一键切换多元模版。熟练使用有助于提高效率,最终的排版效果可由操作者决定。 3. WPS AI:可以帮助生成 PPT 大纲并进行优化,还能根据您的要求修改主题配色和字体。 您可以根据自己的需求选择适合的工具来优化 PPT 排版。
2025-01-13