直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

怎么才能让FLUX生成的人物更像真人的照片

回答

以下是一些可能有助于让 FLUX 生成的人物更像真人照片的建议:

  1. 尝试使用特定的提示词,例如“abstract network out of glass made of holographic liquid crystal, dark background, blue light reflections, symmetrical composition, centered in the frame, highly detailed, hyper-realistic, cinematic lighting, in the style of Octane Rende --ar 16:9 --style raw --personalize --v 6.1”。
  2. 可以训练 FLUX Lora 模型,如褪色胶片风格,推荐权重 0.6 - 0.8,人像会偏向复古褪色的胶片风格。
  3. 对于生成人物,还可以参考 XLabs-AI 发布的不同 Lora,如 mjv6_lora(Midjourney 风格)、realism_lora(写实风格)等,并使用相应的示例进行参考和调整。
  4. 您还可以从以下地址下载相关的 Lora:https://hf-mirror.com/Kijai/flux-loras-comfyui/tree/main/xlabs
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AIGC Weekly #88

封面提示词:abstract network out of glass made of holographic liquid crystal,dark background,blue light reflections,symmetrical composition,centered in the frame,highly detailed,hyper-realistic,cinematic lighting,in the style of Octane Rende --ar 16:9 --style raw --personalize --v 6.1[💎查看更多风格和提示词](https://catjourney.life/)这周同样训练了一个FLUX Lora模型,褪色胶片风格,推荐权重0.6-0.8。非常适合生成毛茸茸的动物玩偶人像会偏向复古褪色的胶片风格涉及到玻璃制品产品展示摄影的表现很好整体景深模糊的也很好,过度自然柔和下载:https://www.liblib.art/modelinfo/4510bb8cd80142168dc42103d7c20f82?from=personal_page

Midjourney 人物一致性已上线

官方说明和操作:DavidH:Hey @everyone @here we're testing a new"Character Reference"feature today This is similar to the"Style Reference"feature,except instead of matching a reference style it tries to make the character match a"Character Reference"image.How it worksType --cref URL after your prompt with a URL to an image of a characterYou can use --cw to modify reference 'strength' from 100 to 0strength 100(--cw 100)is default and uses the face,hair,and clothesAt strength 0(--cw 0)it'll just focus on face(good for changing outfits / hair etc)What it's meant forThis feature works best when using characters made from Midjourney images.It's not designed for real people / photos(and will likely distort them as regular image prompts do)Cref works similarly to regular image prompts except it 'focuses' on the character traitsThe precision of this technique is limited,it won't copy exact dimples / freckles / or tshirt logos.Cref works for both Niji and normal MJ models and also can be combined with --sref Advanced FeaturesYou can use more than one URL to blend the information /characters from multiple images like this --cref URL1 URL2(this is similar to multiple image or style prompts)How does it work on the web alpha?Drag or paste an image into the imagine bar,it now has three icons.selecting these sets whether it is an image prompt,a style reference,or a character reference.Shift+select an option to use an image for multiple categories Remember,while MJ V6 is in alpha this and other features may change suddenly,but V6 official beta is coming soon.We'd love everyone's thoughts in ⁠ideas-and-features We hope you enjoy this early release and hope it helps you play with building stories and worlds

第十五期 生图新王FLUX.1

XLabs-AI发布了6个不同Lora:mjv6_lora - Midjourney风格示例:A full-profile portrait of a Chinese dancer poised on a moonlit stone bridge,surrounded by the delicate blooms of a cherry orchard.Her silk garments ripple with her movement,her eyes are focused and intense,with skin details on her face.She's part of a scene inspired by classical poetry,her fluid motions a dance of elegance.The luminance is delicate and dreamlike,bestowing a soft ambiencerealism_lora -写实风格示例:In a conference room setting,a beauty women dressed in business attire are attending a meeting,random expressions,postures,and physical characteristicsa RAW ultra-realistic photo,UHD,8kanime_lora -动漫风格示例1girldisney_lora -迪斯尼风格示例:1cat,catoon,disney,scenery_lora -风景风格示例:A breathtaking view of the Himalayas mountain range,showcasing its majestic and serene beauty.The mountains are covered in snow,with their peaks reaching towards the sky,creating a stunning contrast with the blue horizon.The range is vast and imposing,with numerous towering peaks,including Mount Everest,the highest point on Earth.The scene captures the grandeur and tranquility of the Himalayas,with sunlight casting a soft glow on the snow-covered slopes.The foreground shows the rugged terrain and lush greenery of the lower elevations,adding to the diverse and spectacular landscape.art_lora -艺术风格Cat,European street,exploration,cozy,mysterious,colorful buildings,sunlight through leaves,cobblestone path,high definition,watercolor painting,warm tones,bright lighting effects,paper textureLora下载地址:https://hf-mirror.com/Kijai/flux-loras-comfyui/tree/main/xlabs

其他人在问
在comyui中,使用flux1-dev模型24g显存够吗
在 ComfyUI 中使用 Flux1dev 模型,24G 显存是可以的,但建议内存尽量高于 32G 以避免意外情况的发生。如果您的显卡是 24G 或更高,右键 24G 那个 train_flux_24GLora 的文件。修改脚本路径和参数时,要注意底模路径、VAE 路径、数据集路径,还有下面的 clip 路径和 T5xxl 路径的正确填写。ae.safetensors 和 flux1dev.safetensors 的下载地址为:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b ,百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。最后下载 dev 的工作流: ,或者使用官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,打开 ComfyUI 把工作流或图片拖拽到其中即可。
2024-11-12
在comyui中,使用flux1-dev模型需要多少显存
在 ComfyUI 中使用 flux1dev 模型所需的显存情况如下: 相关模型的下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 对于 GPU 性能不足、显存不够的情况,底模可以使用 fp8 的量化版模型,下载地址为:https://huggingface.co/Kijai/fluxfp8/tree/main 。 低显存方案(8G 以下):flux1devbnbnf4.safetensors ,放入 ComfyUI\\models\\checkpoints 文件夹内,下载链接为 https://huggingface.co/lllyasviel/flux1devbnbnf4/blob/main/flux1devbnbnf4.safetensors 。 此外,还提供了以下相关资源链接: BitsandBytes Guidelines and Flux :https://github.com/lllyasviel/stablediffusionwebuiforge/discussions/981 ComfyUI_bitsandbytes_NF4 节点:https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4
2024-11-12
我想知道flux相关的提示词描述
Fluffy 相关提示词描述如下: 含义:这个词用来描述某种质地柔软、轻盈、松散或有蓬松感的物体,常用于适配动物的毛发、云彩、食物、布料,美容化妆等多种材料和场景,着重营造一种温馨、舒适、轻松的氛围。 主题风格: 作用: 增强感官体验:Fluffy 描述的物体通常能提供愉悦的触感体验。 营造舒适氛围:在家居装饰、服装设计等方面,营造一种温暖和舒适的氛围。 吸引视觉注意:在广告和视觉艺术中,fluffy 物体常常被用来抓住观众的目光。 技巧: 材料选择:纤维结构和化学组成的不同,造就了不同的手感和光泽,比如羊毛和棉花。 毛发渲染:专门用于生成和渲染细长、柔软的物体,如动物毛发、人类头发、草地等。 材质特性:类似羽毛等轻盈蓬松材质应考虑空气动力学效应——如何在空中漂浮或飘动。 灯光运用:使用柔光或特定角度的照明来突出材质的轻盈和柔软。 应用: 家居和室内设计:Fluffy 的枕头、抱枕、地毯等家居用品。 时尚与服装:在服装设计中,如毛衣、围巾和冬季外套等,保暖性与时尚感兼顾。 食品工业:在食品制作中,如蛋糕、面包、甜点等,fluffy 的质地是吸引消费者的一个重要因素。 动物和宠物产品:宠物床垫、玩具等,fluffy 的材质可以提供给宠物更大的舒适感。 广告和市场营销:使用 fluffy 的概念在广告中创建吸引人的、温馨的图像。
2024-11-09
怎么用FLUX创作艺术作品
以下是使用 FLUX 创作艺术作品的方法: 1. 艺术风格 Lora 方面: 可选择如“art_lora 艺术风格”,其特点包括“Cat,European street,exploration,cozy,mysterious,colorful buildings,sunlight through leaves,cobblestone path,high definition,watercolor painting,warm tones,bright lighting effects,paper texture”。Lora 下载地址为:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs 。 还有“FLUX超写实黑悟空V1”等风格,详情可点击:https://www.liblib.art/modelinfo/5e4a4cc0e3674818a9f8454a63cc0115?from=pic_detail 。 XLabsAI 发布了 6 个不同 Lora,包括“mjv6_lora Midjourney 风格”“realism_lora 写实风格”“anime_lora 动漫风格”“disney_lora 迪斯尼风格”“scenery_lora 风景风格”,并提供了相应示例。 2. Lora 使用方法: 下载 lora 文件。 放入 comfy/models/loras 文件夹内。 使用 ComfyUI 工作流(其实就是上面文生图基础工作流加上一个简易 Lora 加载器),加载您需要的 Lora 风格。工作流文件如“flux1+lora 加载.json”,可通过 https://bytedance.feishu.cn/space/api/box/stream/download/all/KZoGbKe3yo4YHgxnNg6cELfPnwg?allow_redirect=1 下载。 3. 教程参考: 。 4. 示例作品:大家可以在哩布的返图区找到更多灵感,群友作品包括鹏程、海波、CYCHENYUE 等。
2024-10-27
webui可以用FLUX模型吗
WebUI 可以使用 FLUX 模型。以下是相关的下载和使用信息: ae.safetensors 和 flux1dev.safetensors 下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型(体积较大)的百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。 下载 dev 的工作流: 或者官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,打开 ComfyUI,把工作流或图片拖拽到 ComfyUI 里。 郑敏轩的 Flux 的 controlnet 系列中 TheMisto.ai 的 MistoLine 版: 注意:该 ControlNet 与 Flux1.dev 的 fp16/fp8 以及使用 Flux1.dev 量化的其他模型兼容。 需要节点(可以 git clone 方式下载或通过以下网盘): 夸克网盘:链接:https://pan.quark.cn/s/ad43dd5152a6 。 百度网盘:链接:https://pan.baidu.com/s/1NcOdG4AV68xTup8FvphsYA?pwd=lpvc 提取码:lpvc 。 模型: 夸克网盘:链接:https://pan.quark.cn/s/5551e813db21 。 百度网盘:链接:https://pan.baidu.com/s/1Ntf4MbTCGJ5TYDv6mgvqNQ?pwd=zhfq 提取码:zhfq 。 处理:将模型放到 ComfyUI\\models\\TheMisto_model 文件夹中。 导入官方工作流 。所需要的两个模型:
2024-10-25
webui可以用FLUX模型吗
WebUI 可以使用 FLUX 模型。以下是相关的下载和使用信息: ae.safetensors 和 flux1dev.safetensors 的下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 夸克网盘链接:https://pan.quark.cn/s/b5e01255608b 百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。 dev 的工作流: 官方原版的图片链接:https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,打开 ComfyUI ,把工作流或图片拖拽到 ComfyUI 里。 郑敏轩的 Flux 的 controlnet 系列: TheMisto.ai 的 MistoLine 版,该 ControlNet 与 Flux1.dev 的 fp16/fp8 以及使用 Flux1.dev 量化的其他模型兼容。 节点: 可以 git clone 方式下载或通过压缩包。 夸克网盘:链接:https://pan.quark.cn/s/ad43dd5152a6 百度网盘:链接:https://pan.baidu.com/s/1NcOdG4AV68xTup8FvphsYA?pwd=lpvc 提取码:lpvc 模型: 夸克网盘:链接:https://pan.quark.cn/s/5551e813db21 百度网盘:链接:https://pan.baidu.com/s/1Ntf4MbTCGJ5TYDv6mgvqNQ?pwd=zhfq 提取码:zhfq 处理:将模型放到 ComfyUI\\models\\TheMisto_model 文件夹中。 导入官方工作流: ,所需要的两个模型。
2024-10-25
用什么AI工具,绘画出的美女,如同真人照片。
以下几种 AI 工具可以绘画出如同真人照片的美女: 1. 谷歌的文生图 AI 模型 Imagen 2,实测效果逼真细腻,生成的美女图仿佛真人照片,其对提示的还原程度已经超越了 DALL·E 3 和 Midjourney。 2. Visual Electric 是一个不需要操心技术的 AI 绘画网站,您只需要发挥创意就行。 需要注意的是,使用 AI 绘画工具时可能会遇到一些问题,比如在独立游戏开发中使用 AI 绘画可能会出现风格不合适、缺乏叙事性、素材有限、泛化性差等情况。但通过不断尝试和优化,如更换 Embedding、CKPT、Lora 等方式,以及进行一些特殊处理,如为引导前景后景区分明显的画专门绘制引导图、对人物朝向做镜像处理等,也能获得较为理想的效果。
2024-10-08
模拟真人绘画的AI有哪些
以下是一些模拟真人绘画的 AI 相关内容: 小码哥:提供了多种以汉服为主题的 AI 绘画描述,如可爱的小老鼠、小龙、小猴、小鸡等穿着汉服的形象,涉及 Pixar 风格、超清晰细节、电影灯光等元素。 探讨了 AI 艺术的相关概念,包括从语言学角度研究提示词,以及对 AI 艺术本体形态的思考,如生成式空间计算的使命是创造生命体验。 提到生成式 AI 在视觉效果方面的应用,以漫画家 Yoko Li 为例,训练的模型能够模仿生成图像,在经济效益、创造新风格和概念的灵活性以及生成完整工作成果的能力等方面具有优势,这种变化不仅限于图像,还适用于整个设计领域。但 AI 模型生成的图像拥有一个非白色背景。
2024-10-08
真人视频转动漫风格视频工具
以下是一些真人视频转动漫风格视频的工具: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,能在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 另外,还有以下相关工具: 1. 艺映 AI(https://www.artink.art/):专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。更多的文生视频的网站可以查看: 。需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2024-09-28
AI对口型拍摄真人视频的软件
以下是一些 AI 对口型拍摄真人视频的软件: 1. HeyGen:是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入要说的内容,平台的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 此外,还有以下相关软件: 1. Runway:有网页和 app 方便使用。网址:https://runwayml.com 2. haiper:网址:https://app.haiper.ai/ ,免费。 3. SVD:网址:https://stablevideo.com/ ,有免费额度,对于景观更好用。 4. Pika:网址:https://pika.art/ ,收费,可控性强,可以对嘴型,可配音。 5. PixVerse:网址:https://pixverse.ai/ ,免费,人少不怎么排队,还有换脸功能。 6. Dreamina:剪映旗下,网址:https://dreamina.jianying.com/ ,生成 3 秒,动作幅度有很大升级。 7. Morph Studio:网址:https://app.morphstudio.com/ ,还在内测。 8. Kaiber:网址:https://kaiber.ai/ 9. Moonvalley:网址:https://moonvalley.ai/ 10. Mootion:https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 11. 即梦 AI:「对口型」是其「视频生成」中的二次编辑功能,现支持中文、英文配音。可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。更多相关信息请访问网站查看:https://www.waytoagi.com/category/42
2024-09-25
AI对口型拍摄真人视频的软件
以下是一些 AI 对口型拍摄真人视频的软件: 1. HeyGen:是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真的会开口说话的视频。 此外,还有以下相关软件: 1. Runway:有网页和 app 方便使用。 2. haiper:免费。 3. SVD:有免费额度,对于景观更好用。 4. Pika:可控性强,可以对嘴型,可配音。 5. PixVerse:人少不怎么排队,还有换脸功能。 6. Dreamina:剪映旗下,生成 3 秒,动作幅度有很大升级。 7. Morph Studio:还在内测。 8. Kaiber 。 9. Moonvalley 。 10. Mootion:3d 人物动作转视频。 即梦 AI 的「视频生成」中有「对口型」二次编辑功能,现支持中文、英文配音。针对写实/偏真实风格化人物的口型及配音生成,可上传包含完整人物面容的图片,视频生成完成后,点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言:中文(全部音色),英文(推荐「超拟真」内的音色) 更多相关软件请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。内容由 AI 大模型生成,请仔细甄别。
2024-09-25
能制作真人图片的AI软件
以下是一些能制作真人图片的 AI 软件及相关信息: 1. Midjourney:能够生成图像,并且已经解决了创建文本的问题。 2. HeyGen:是一个 AI 驱动的平台,可以创建逼真的数字人脸和角色。它使用深度学习算法来生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 3. Synthesia:是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。它支持多种语言,并可以用于教育视频、营销内容和虚拟助手等场景。 4. DID:是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 需要注意的是: 1. 这些系统是围绕基于互联网数据训练而具有内置偏见的模型构建的(例如,如果您要求它创建企业家的图片,您可能会看到更多以男性而不是女性为特色的图片,除非您指定“女性企业家”),您可以使用在工作中看到这些偏见。 2. 这些系统还以不透明的方式对互联网上的现有艺术进行了学习,并且可能在法律和道德上存在问题。虽然从技术上讲,您拥有所创建图像的版权,但法律规则仍然模糊不清。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-09-22
什么工具/模型/API 可以根据宠物照片生成数字宠物 可以有简单的活动。
以下是一个可以根据宠物照片生成数字宠物并具有简单活动的工具/模型/API: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API。 出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务,以及 AI 智能硬件。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,致力成为全球 AI CoPilot 的引领者。 在 ComfyUI 全球领导力峰会上,特意搭建了数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。本次活动特意提供了免费 api 额度及操作指南给大家进行体验。以下是一些不同风格的照片驱动效果展示:
2024-11-16
有可以更具提供的文本和照片生成视频的AI吗?
以下是一些可以根据提供的文本和照片生成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作并支持视频编辑。目前内测免费,其生成服务托管在 Discord 中。操作步骤包括加入 Pika Labs 的 Discord 频道,在“generate”子区输入指令生成或上传本地图片生成视频,对不满意的效果可再次生成优化。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 内容由 AI 大模型生成,请仔细甄别。
2024-11-11
照片生成卡通画
以下是关于照片生成卡通画的相关内容: 1. 个性卡通头像生成: 复杂提示词:如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 不同照片生成:可更换新照片使用上述提示词重新生成。 其他调整:若不喜欢 Disney 风格,可将提示词中的“Disney”换成“Pixar”;若为女孩,可将“boy”换成“girl”。每次生成 4 张图片,满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 【SD】简笔水彩风格插画生成: 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。 Lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”;在正向提示词末尾添加上述 lora;设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想接近原图可降低数值;将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 3. 进阶使用技巧总结: 通用人物模版:想用真人照片生成卡通头像,可用「真人照片」+「照片描述」+「方法 1 的关键词」处理。若生成满意的图要记得保存,下次同种类型可直接喂图,效果更好。
2024-11-07
照片修复
以下是关于照片修复的相关知识: 图像高清修复与无损放大的流程通常分为三部分: 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,搭配 Stable SR Upscaler 模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:用 realisticVision 底膜进行二次修复,使用提示词反推 node 提取画面提示词,搭配 tile ControlNet 提升细节感,再用合适的高清放大模型二次放大。 用 AI 给老照片上色: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时将图片放大。 可在 PS 里调整角度和裁切照片,然后上色。对于复杂照片,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,如使用 t2ia_color 模型,关键词如蓝天、绿树、灰石砖。 将照片放入后期处理,使用 GFPGAN 算法清晰人脸,五官重绘后,再将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型修复,vae 选择 vqgan,可不写提示词以免干扰原图。
2024-11-06
老照片修复
以下是关于用 AI 给老照片上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 4. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 5. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 6. 对于复杂的照片,如人物多、场景复杂、像素低的,可先放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 参考文章: 1. 2. 作者:白马少年,发布时间:20230910 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2024-11-06
能修复老照片吗
AI 可以修复老照片。以下是一些相关的方法和工具: 可以使用 Stable Diffusion(SD)中的 controlnet 模型中的 Recolor 新模型为黑白老照片重新上色。提示词可直接描述颜色和对应的内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 辅助工具方面: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 其他工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-11-05
ai生成配图
以下是关于 AI 生成配图及相关内容的信息: 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,关于 Runway 生成 AI 动画,可以使用图片+文字描述功能,将 MJ 生成的图片增加对应的动态描述,输入 Runway,同时增加镜头变换的设置(具体教程看)。悦音 AI 配音具有旁白质感,如磁性浑厚、大片质感、娓娓道来。
2024-11-17
用AI生成动画的教程
以下是用 AI 生成动画的一些教程: 1. 端午节动态视频: 可以使用即梦或 runway 等工具。如果要字不动,可以先在剪映里添加文字 logo 素材。 先什么关键词都不写,如果效果不满意,再添加关键词。 将视频放入剪映,放上 PNG 透明底图后导出。 2. Runway 生成 AI 动画: 使用图片+文字描述功能,将 MJ 生成的图片增加对应的动态描述,输入 Runway,同时增加镜头变换的设置。具体教程可查看。 3. 利用 AI 批量生成、模仿和复刻《小林漫画》(内含 coze 搭建视频教程): 作者景淮会带着大家试着搭建一个扣子(Coze)工作流来直接生成文字和图片。本文会按照需求分析、扣子搭建、扣子使用链接分享、批量生产图片、总结的顺序进行。
2024-11-17
AI 语音生成
以下是一些与 AI 语音生成相关的信息: 人工智能音频初创公司: :将书面内容转化为引人入胜的音频,并实现无缝分发。 :提供专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 游戏开发中的 AI 语音生成工具: Coqui Studio:https://coqui.ai Bark:https://github.com/sunoai/bark Replica Studios:https://replicastudios.com 生成式 AI 在游戏领域的机会: 许多创业公司正在尝试创造人工智能生成的音乐,如 Soundful、Musico、Harmonai、Infinite Album 和 Aiva。 对话&语音方面,很多公司试图为游戏中的人物创造逼真的声音,包括 Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai 等。 即时对话生成,角色可以对玩家的行为做出充分反应。 角色扮演,使用与玩家的化身相匹配的生成的声音保持幻想。 控制音效,可控制声音的细微差别。 本地化,对话可翻译成任何语言并以同样的声音说话,如 Deepdub 专注于这个细分市场。
2024-11-17
我想要让ai生成svg代码,如何保证其生成质量
目前知识库中没有关于如何保证让 AI 生成 SVG 代码质量的相关内容。但一般来说,要保证 AI 生成 SVG 代码的质量,可以从以下几个方面考虑: 1. 清晰明确地向 AI 描述您的需求,包括图形的特征、尺寸、颜色、线条样式等具体要求。 2. 提供足够的示例或参考资料,让 AI 更好地理解您期望的代码风格和质量标准。 3. 对生成的代码进行多次测试和验证,检查其在不同场景下的显示效果和兼容性。 4. 尝试使用不同的 AI 模型或工具,并比较它们生成的 SVG 代码质量,选择最适合您需求的。
2024-11-15
我想要让ai生成svg图片,如何保证其生成质量
要保证 AI 生成 SVG 图片的质量,您可以参考以下方法: 在使用 AI 生成图片时,可能会遇到即使输入相同关键词,生成的图片仍有很强随机性的情况。为了让生成的图片更加可控,可以利用 seed 参数进行反向生成。 首先,从官方文档中了解 seed 参数的作用:Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。种子号为每张图随机生成,但可以使用 Seed 或 same eseed 参数指定。使用相同的种子号和提示符将产生类似的结尾图片。详细参数可查看官方文档: 默认情况下,种子是随机给定的。若想要获得比较相似的图,需要将 seed 固定下来。简单来说,使用时在关键词后添加 seed 参数即可,具体数字在 0–4294967295 范围内均可。例如:caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k seed 8888 这样就能保证每次生成的都是相同的图。此外,还可以反向利用这个特性对已经确定的效果图进行微调。比如当发现有一张图已比较接近目标,还需要一些微调时,可以利用确定图片的 seed,在此基础上添加新的关键词来实现。
2024-11-15