Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

即梦AI里做儿童绘本制作、故事绘本里,怎么做到人物一致,风格一致,场景风格一致。

Answer

要在即梦 AI 中制作儿童绘本并做到人物、风格和场景风格一致,可以按照以下步骤进行:

  1. 描述故事场景:利用 ChatGPT 或者自行构思一段适合画绘本的故事,将其分为多个场景,用一句包含环境、人物、动作的话描述每个场景。例如,故事名《Lily 的奇妙之旅》,场景 1 为“探险开始,Lily 来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴”。
  2. 生成场景图片:为每个场景生成图片时,使用固定的 prompt 风格词,如“super high details,HDsmooth,by Jon Burgerman,--s 400--niji 5--style expressive--ar 3:4”。为了使熊和人物有更好的互动感,生成场景时也包括人物主角。如场景 2 的 prompt 为“Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,--s 400--niji 5--style expressive--ar 3:4”。如果需要,可使用 mj 的 region vary 工具将小女孩完全框选,在提示词中完全删除 Lily 的描述词,重新生成得到场景图像。
  3. 绘制绘本主角:确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像,且一套绘本中风格词语不要改变。
  4. 保持一致性描述:在写 prompt 时,应从多个角度描述需求,包括人种、画风、宠物品种等,以稳定内容符合预期。例如,如果想生成一个关于“狗”的视频,提供不同狗的品种、外貌、行为等信息,确保物种和画风的一致性。
Content generated by AI large model, please carefully verify (powered by aily)

References

MJ应用篇 儿童绘本制作、人物一致性解

[heading1]描述故事场景[content]利用ChatGPT或者自行构思一段适合画绘本的故事,分为场景1/2/3/...,用一句包含环境、人物、动作的话描述每个场景故事名:《Lily的奇妙之旅》场景1:探险开始Lily来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴。场景2:洞穴躲雨突然森林下起了瓢泼大雨,Lily和小熊发现了一个洞穴,他们来到洞穴躲雨。场景3:发光洞穴Lily和小熊往洞穴深处走,发现洞穴里竟然布满了闪烁的宝石。她好奇地探索着,仿佛进入了另一个世界。场景4:洞穴尽头洞穴尽头是一个美丽的花园,花园里开满了夜晚绽放的奇异花朵。Lily和小熊一起跳舞,度过了愉快的时光。[heading1]生成场景图片[content]prompt:场景+风格(一套绘本中风格词语不要改变)super high details,HDsmooth,by Jon Burgerman,--s 400--niji 5--style expressive--ar 3:4为了使得熊和人物有更好的互动感,生成场景时也包括人物主角如场景2,prompt:Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,--s 400--niji 5--style expressive--ar 3:4抠图由于我们只需要得到一张场景图像,使用mj的region vary工具将小女孩完全框选,在提示词中完全删除Lily的描述词,重新生成得到场景图像。依次得到4个场景的图像:

MJ应用篇 用cref制作儿童绘本

[heading1]场景描绘我们使用[MJ应用篇儿童绘本制作、人物一致性解](https://qa3dhma45mc.feishu.cn/wiki/C3l1whZ5QiWHnikdEKXcvjAYnVh?from=from_copylink)中GPT为我们描述的场景进行绘本绘制利用ChatGPT或者自行构思一段适合画绘本的故事,分为场景1/2/3/...,用一句包含环境、人物、动作的话描述每个场景故事名:《Lily的奇妙之旅》场景1:探险开始Lily来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴。场景2:洞穴躲雨突然森林下起了瓢泼大雨,Lily和小熊发现了一个洞穴,他们来到洞穴躲雨。场景3:发光洞穴Lily和小熊往洞穴深处走,发现洞穴里竟然布满了闪烁的宝石。她好奇地探索着,仿佛进入了另一个世界。场景4:洞穴尽头洞穴尽头是一个美丽的花园,花园里开满了夜晚绽放的奇异花朵。Lily和小熊一起跳舞,度过了愉快的时光。[heading2]绘本主角绘制[content]确定人物形象:a little girl wearing a yellow floral skirt+人物动作+风格词,在mj中生成直到得到一张满意的人物图像(一套绘本中风格词语不要改变)little girl Lily wearing a yellow floral skirt,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,--s 400--niji 6

即梦AI 视频生成 | 教你如何写好prompt

prompt应该从多个角度描述你的需求,这样可以帮助即梦生成更加全面的视频。人种、画风、宠物品种都可以来稳定您的内容符合您的预期。例如,如果你想生成一个关于“狗”的视频,你可以提供不同狗的品种、外貌、行为等信息,这样可以帮助即梦生成更加丰富的视频内容。物种一致性[一只白色萨摩耶狗在公路上向前奔跑,背景是公路和公路两旁的树木_1970-01-21 04_54_40.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/ZEeDbCJ0JoVgzgxQyRSc6BzFnrc?allow_redirect=1)一只白色萨摩耶狗在公路上向前奔跑,背景是公路和公路两旁的树木[一个有金色头发的亚洲女性坐在红色的沙发上,背景是白色花卉的壁纸_1970-01-21 04_54_41.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/G5o6bm9GRoPaNaxEQCKcTnRvnCd?allow_redirect=1)一个有金色头发的亚洲女性坐在红色的沙发上,背景是白色花卉的壁纸画风一致性

Others are asking
如何让文生图,做到风格一致,人物一致,场景风格一致,
要让文生图在风格、人物和场景风格上保持一致,可以参考以下方法: 1. 图片生成工具:可使用 Midjourney 进行图片生成。 2. 画面电影感: 画幅:常用 21:9 的画幅比例,其会影响构图和光影。 Prompt 风格后缀:例如“________.Shot on Sony Venice 2,muted color tones,green and dark gray,awardwinning composition,cinematic scenear 21:9”。 专用摄影机:在 Prompt 里可添加电影专用摄影机,如 RED Helium 8K 等。 3. 人物一致性: 对于主角,可先跑一张定妆照。 利用 Midjourney 的新功能 Cref 保持发型、人脸、衣服,但对亚洲人脸尤其是老人的一致性效果较差,且对画面审美和构图有一定破坏性,能不用则不用,如只有背影时简单描述即可。 4. 场景一致性:目前尚无很好的解决办法,基本随缘。 此外,还可参考以下方式: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 Midjourney 中生成满意的人物图像,为确保人物一致性,取“iw 2”。 2. 合成人物和场景:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(“iw 2”),在 Midjourney 中重新生图。
2025-01-23
怎么用ai完成淘宝模特图片的批量修改,风格都是一致的
以下是使用 AI 完成淘宝模特图片批量修改且风格一致的方法: 1. 利用 Stable Diffusion 进行局部重绘: 真人穿衣服拍照,获取真实质感的照片。若身材方面有问题,可借助美图秀秀或 PS 处理。 选好真人照片风格的底模,如 majicmixRealistic_v7。 根据不同平台需求换头,如面向海外市场换白女头。 在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置好 prompts 和 parameters。 2. 大淘宝设计部的实践: 对于定制化真人模特实景素材的主题活动,通过 AI 可将策划、搭建、拍摄、设计融为一个闭环流程,短时间内完成页面所有素材的生产和输出。 在 UI 设计场景中,采用 AI 能力可快速定制多种视觉效果,通过 SD 中 controlnet 的有效控制,生成指定范围内的 ICON、界面皮肤等内容。 通过对 AI 大模型的训练和应用,算法从模特姿态、背景风格、装饰元素等多个维度进行效果升级,结合用户数据提供定制化的线上真人化模特体验。 一张商品图,结合用户的自定义输入,可生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。 此外,字节发布的新模型 SeedEdit 也可用于图片编辑,每次编辑尽量使用单指令,多指令最好少于 3 种变化。为保证效果,局部编辑时下指令要精准,参考图要清晰、分辨率高。若编辑效果不明显或变化过多,可调整编辑强度。
2025-01-21
图的角色 用 cref 去控制一致性 风格可以用 sref 去控制
在 Midjourney 中,cref 和 sref 是用于引用图片的功能,它们有以下区别和使用方法: 1. 角色参考(cref): 作用:保持图像角色的一致性。 使用方法:在提示后添加“cref”,紧接着指向人物参考图像的 URL。例如:/imagine prompt beautiful girlcref。可以使用“cw”调整参考图像对生成图像的影响程度,数值范围从 0 到 100。强度 100(“cw 100”)是默认值,会使用面部、头发和衣服,cw 为 0 的话仅保证脸部一致。基础格式为“cref 图片链接,cw 100”。 参考链接: 2. 风格参考(sref): 作用:生成类似风格的图片,保持画风的一致性。 使用方法:在提示后添加“sref”,紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girlsref。可以使用“sw”调整参考风格对生成图像的影响程度,数值范围从 0 到 1000。基础格式为“sref 图片链接,sw 100”。 参考链接: 如果想引用一张图,但只是把它作为新图的一部分,可以使用“sref”或“cref”,并通过调整“sw”或“cw”的值来控制引用图像的影响程度。例如:/imagine prompt beautiful girlsrefsw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格。
2025-01-13
flux lora调参数,我训练出来的人物模型和数据集的人物图片不像,出现这种情况的原因都有哪些,应该调整哪些参数,我需要我的flux模型训练出来的模型是一致性还原性,和泛化性比较不错的,按照这个方向给我指导
以下是关于 flux lora 调参数以获得一致性、还原性和泛化性较好的人物模型的指导: 打标环节: 选择基础大模型,如“麦橘写实”,并为 lora 命名。 将照片导入,选择合适分辨率,可勾选“脸部加强训练”,然后进行预处理。手动裁剪图片比自动裁剪更可靠。 预处理后会出现脸部和整体文件夹,且每张照片自动打好 tag 标签。 可为整体添加统一标签,也可单独修改每张图片的标签。标签有助于 AI 理解图片,描述越详细,人物变化可能越多,泛化性可能越好。仔细检查每张图片的标签,其质量会影响人物 lora 的泛化性。 参数调整环节: 大部分参数是固定的,主要的几个按照人物参数配置一遍。后期根据生成结果再调整。 炼丹环节: 例如 18 张脸部图片,20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1。训练总步数和时长会有所不同,loss 值可作为参考,但最终效果仍需通过测试判断。 此外,在 Lora 串联方面,多个 Lora 串联时左右顺序不影响结果,可复制并点对点连接。CLIP 层 1 和 2 的效果不同,加 Lora 时某些 Lora 可能更适合 2。Lora 可用于生成底模无法画出的内容。在运行中点击取消可打断正在渲染跑的图。图像放大可通过 up scale image using model 节点,选择放大模型,用 resize 节点调整尺寸,再用编码器和采样器处理。放大模型直接放大的图像效果不佳,需再次采样增加细节。添加飞桨缺失节点可通过拖入工作流查看标红节点,从管理器安装或从 GitHub 获取节点包放入文件管理系统。采样器和调度器参数设置建议参考模型作者推荐,并结合自己调试。Web UI 中 Lora 库有刷新按钮,将 Lora 丢到文件夹后多点几次刷新即可。
2025-01-04
LLM输出的结果一致性如何保证
要保证 LLM 输出结果的一致性,可以采取以下几种策略: 1. Prompt 工程: 明确的待处理内容指引:在构建 Prompt 时,清晰地定义需要处理的文本,并使用标记框起来,让模型准确识别待处理内容范围,从中提取信息。 提供明确字段定义:具体化每个字段的名称、用途及要求,为 LLM 提供明确的提取方向和标准。 异常处理:设置异常处理原则,如规定缺失数据使用默认值填充,特殊数据类型符合标准格式,确保模型输出的完整性和一致性。 要求结构化输出:指示 LLM 以结构化格式(如 JSON)输出数据,便于后续处理和系统集成。 2. 自我一致性增强可靠性:促使 LLM 对同一问题产生多个答案,通过一致性审查衡量其可信度。一致性评估可从内容重叠、语义相似性评估及高级指标(如 BERT 分数或 ngram 重叠)等多方面进行,增强 LLM 在事实核查工具中的可靠性。 3. 衡量和评估不确定性:如牛津大学通过生成一个问题的多个答案,并使用另一个模型根据相似含义分组来衡量 LLM 不确定性。 4. 利用外部工具验证:如 Google DeepMind 推出的 SAFE,通过将 LLM 响应分解为单个事实、使用搜索引擎验证事实以及对语义相似的陈述进行聚类来评估 LLM 响应的真实性。 5. 借助其他 LLM 发现错误:如 OpenAI 推出的 CriticGPT,使用基于大量有缺陷输入数据集训练的 GPT 式 LLM 来发现其他 LLM 生成代码中的错误。 6. 利用 LLM 生成的评论增强 RLHF 的奖励模型:如 Cohere 使用一系列 LLM 为每个偏好数据对生成逐点评论,评估提示完成对的有效性。
2025-01-02
可灵ai如何保持人物一致性
要保持可灵 AI 中人物的一致性,可以参考以下方法: 1. 人物设定: 明确主角、配角等人物的性格特点、外貌特征等,如主角是一位 40 岁的中年男探险家,性格特点是面对挑战从不轻言放弃,外貌特征是健壮、棕色头发、常穿探险服。 2. MJcref 控制人物一致性: 先根据人物设定,在 MJ 里筛选适合的人物形象,选中后右键复制图片链接。 在尾缀加入【cref 图片链接】控制人物一致性,【cw 数值】控制权重。 对于镜头较多的角色,建议炼个人物模型出来控制,不然 MJ 容易不稳定。 3. 控制多人物场景统一: 先控制一个角色再进行重绘。 选一张合适的图片后,点击 Vary进行局部重绘,并把尾缀机器人的 cref 链接改成主角的 cref 链接。 4. 通过 prompt 格式实现“角色一致性”: 公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。 发型/衣物:构造尽可能多的角色非面部视觉元素,产生观众对角色的“一致性观感”。 年龄:约束角色年龄特征。 环境:约束能够产生相同观感的环境空间,尤其是光环境,增加观众对于形象认识的“一致性”认知。例如: 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。
2024-12-21
AI绘画风格网站
以下是一些常见的 AI 绘画风格网站及相关风格介绍: MewXAI(https://www.mewxai.cn/):这是一款强大且新手友好、操作简单的 AI 绘画创作平台。其功能包括: MX 绘画:拥有众多超火模型和上百种风格,支持文生图、图生图。 MX Cute:自研的可爱风动漫大模型,在某些风格场景下可媲美当下最火的 NJV5 模型。 MJ 绘画:创意度和想象力极高,适用于多种创作需求。 边缘检测:对草图上色,有多种渲染风格可选。 室内设计:上传空间图,一键完成多种不同风格的室内/建筑设计。 姿态检测:精准控制人物动作,可生成单人或多人姿势。 AI 艺术二维码:几秒内创建令人惊叹的下一代艺术二维码。 AI 艺术字:将光影文字、隐藏文字、艺术字融入作品。 常见的 AI 绘画风格有: 像素艺术(Pixel art) 当代写实主义(Contemporary Realism) 纪实的(NonFiction) 同步性(Synchronism) 建构主义(Constructivism) 超现实主义(surreal,hyperrealistc) 未来主义(futuristic) ww3 风格 适合科幻场景的幻想风格(fantasy) 科幻的(Fiction) 科幻(Science Fiction) 赛博朋克(cyber punk) 概念艺术(concept art) 超现实主义(Hyperrealistic) 黑暗奇幻(Dark Fantasy) 飘渺奇幻(Ethereal Fantasy) 宫崎骏风格(studio Ghibli) 山水画(landscape) A 站趋势风格(Trending on artsation) 超现实风格(surrealism) 油画风格(oil painting) 原画风格(Original) 赛博朋克风格(Cyberpunk) 后印象主义风格(postimpressionism) 废土风格(Wasteland Punk) 数字雕刻风格(digitally engraved) 建筑设计风格(architectural design) 海报风格(poster style) 东方山水画(Tradition Chinese Ink Painting) 浮世绘(Japanese Ukiyoe) 日本漫画风格(Manga style) 童话故事书插图风格(stock illustration style) 梦工厂动画风格(CGSociety、DreamWorks Pictures) 皮克斯(Pixar) 时尚(Fashion) 日本海报风格(poster of Japanese graphic design) 90 年代电视游戏(90s video game) 法国艺术(french art) 包豪斯(Bauhaus) 日本动画片(Anime) 像素画(卜绘 and Pixel Art) 古典风(Vintage,1819 世纪) 黑白电影时期(Pulp Noir) 乡村风格(Country style) 抽象风(Abstract) 印刷风(risograph iso) 设计风(Graphic)
2025-01-22
照片转换风格
以下是关于照片转换风格的相关内容: SDXL Prompt Styler 插件: 转绘成折纸风时,最好不加入线稿边缘(canny)的 ControlNet 控制,或把其控制强度调到较小,因为原始手绘风格图像的手绘线条和折纸风格互斥。 转成漫画风格并想较好保留人物外轮廓时,加入 canny 控制能更好还原人物造型。 直接用插件内置预设的提示词组合不一定能达到想要效果,如转成印象派风格时,需在 prompt 中添加更多印象派风格关键词,如 impressionism、monet、oil painting 等。 该工作流结合 Vid2Vid Style Transfer with IPA&Hotshot XL 工作流,可实现视频不同风格的稳定转绘。 SeedEdit 模型: 能通过输入文字指令对图像进行修改,如让戴珍珠耳环的少女手里拿着一杯奶茶,让《老友记》中的瑞秋戴上时髦墨镜,给奥黛丽・赫本更换帽子颜色,给黑白老照片上色,移除画中无关元素,进行元素替换等。 可以随意切换各种风格,如涂鸦、乐高、3D、皮克斯、迪士尼等。 莱森的教程: 利用醒图或美图秀秀等 App 调整脸部,如在醒图中关注【人像>面部重塑>面部>比例】,调整上庭、中庭、下庭。 在照片转绘为 Minecraft 风格时,若sw 风格权重拉满仍复制不了像素小人风格,可能是cw 太高,调低可成功复制。 cref 和 sref 同时参考多张 url 时,上传同一个人不同角度照片不一定更容易直出,可能导致形状畸形。 若 MJ 直出的皮肤缺乏质感,可在醒图中【人像>手动美颜>皮肤肌理】进行调整。若想快速调整光源,可使用 Luminar。
2025-01-21
如何生成一个c4d风格的抽象模型
以下是生成一个 C4D 风格抽象模型的步骤: 1. 字体设计: 在 Adobe Illustrator 中,先用钢笔工具勾出字体形状,然后加粗扩展外观,删掉多余的线或者直接填充白色摆放好正确的图层样式。 2. 到 SD 里做效果: 模型:revanimatedv122 Control Weight:0.85 1,低一点的话形状会稍微随意点。 Control 预处理器:lineart_standard,模型:control_v11p_sd15_lineart Lora: Wool felt v1.0 https://civitai.com/models/113321 felt_v1.0 羊毛毡质感 https://www.liblibai.com/modelinfo/5d37951d90684318b4c596eb4a2ecacf 关键词:felt style, cute, wool material, made yarn, Light and clean background, C4D style, 3D rendering, <lora:symaozhan:0.4>, rich color palette Negative prompt: lowres, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, blurry, black (可以替换另一个 lora 和颜色得到不一样的结果)
2025-01-20
如果借助AI开启2周岁女儿的绘本启蒙之旅
对于借助 AI 开启 2 周岁女儿的绘本启蒙之旅,目前知识库中没有相关的直接内容。但以下是一些可能的建议: 首先,可以利用 AI 生成简单、有趣、色彩鲜艳的绘本故事,内容可以是关于小动物、日常生活中的常见事物等,以吸引孩子的注意力。 其次,通过语音交互的 AI 工具,为孩子朗读绘本故事,培养孩子的听力和语言感知能力。 还可以借助具有互动功能的 AI 应用,让孩子在观看绘本的过程中进行一些简单的操作,增强参与感。 希望这些建议能对您有所帮助。
2024-12-21
关于儿童绘本的Prompt
以下是关于儿童绘本的 Prompt 相关内容: 对于儿童故事读物,通常需要具备以下特点: 1. 语言简单易懂,使用简洁的语言和短句子,便于孩子理解和跟随故事情节。 2. 具有丰富的想象力,充满奇幻和想象,带有魔法、奇妙的生物和奇异的世界,激发孩子的创造力和想象力。 3. 包含教育意义,常包含道德教训或生活启示,帮助孩子理解基本价值观。 4. 拥有生动的角色,包括可爱的动物、勇敢的英雄、善良的公主等,以有趣的人物形象吸引孩子注意力。 5. 经常使用重复的句子或韵律感强的语言,增强记忆力和语言的音乐感。 6. 具备互动性,许多儿童故事设计为互动式,鼓励孩子参与情节发展。 7. 有明确的情节结构,故事情节简单明了,有清晰的开始、发展和结局,方便孩子跟随和理解。 8. 配有丰富的插图和图画,增强视觉吸引力,帮助孩子更好地理解和记忆故事内容。 在让 LLM 生成故事时,需要限定生成的内容主题、风格、适合人群等的 prompt,例如生成「漫画小书虫📚🐛」的相关故事,并按照格式返回文本内容,以方便后续对数据解析、配图。 此外,小七姐在 K12 领域应用中提到儿童 PBL 项目 Prompt,原始设计思路包括: 1. 作为家长,获取 10 个生活中可能的 PBL 项目主题。 2. 对感兴趣的主题进一步拓展 5 个相关主题。 3. 选择主题后,设计包含目标、项目周期、项目阶段和任务、项目评估的 PBL 项目。 4. 根据反馈优化项目。 5. 设计测试评估孩子在项目中的知识与能力、提升可能、学习风格和兴趣点。 6. 根据孩子的真实反馈设计个性化学习方案。 7. 明确家长在项目中承担的角色和提供的支持。 8. 写一封信吸引孩子参与家长设计的学习项目。 例如为一位特别喜欢识认汽车品牌、喜欢交通工具、挖掘机等工程机械车的 3 岁小朋友设计一个包含能练习中、英文的 PBL 项目式学习任务,包含项目目标、项目周期、项目阶段和任务、项目评估。 在提示简介中,提示是给 Claude 的用于引发相关输出的文本,通常以问题或指示的形式出现,Claude 回答的文本被称为“响应”,有时也被称为“输出”或“完成”。
2024-11-15
stable diffusion 绘本一致性
Stable Diffusion 绘本一致性相关知识如下: 工作原理: Stable Diffusion 生成随机噪声,并逐步更改噪声以努力获得与提示一致的图像。其基本结构包括 encoder + diffusion + decoder 的流程。Checkpoint 记录某个训练周期整个 diffusion 及可能的 encoder decoder 的参数,VAE 是 encoder decoder 的参数,在 SDXL 等大型模型中需配对以避免花屏现象。LoRA 模型训练时先冻结 SD 模型权重,然后在 UNet 结构中注入 LoRA 模块并与 CrossAttention 模块结合,只对部分参数微调。 相关论文: AnyDoor: MixofShow: LyCORIS: 影响生成结果的因素: 影响生成的图与他人不同的因素包括随机数种子(Seed)。随机数种子控制最底层形状,决定照片基础轮廓,如人物外形轮廓、姿势和站位等。当随机数为“1”时,SD 会随机生成种子。可在点击生成的照片下面的一大串英文中查看 seed 值。只有所有参数包括随机数种子都与他人相同时,才能生成相似的照片。
2024-09-30
请问国内用什么ai制作绘本是免费且角色统一的?
目前国内有一些可用于制作绘本的免费 AI 工具和相关资源,以下为您提供部分参考: 您可以根据自己的需求选择适合的工具和资源来制作绘本。
2024-09-26
想知道目前市面上做AI绘本的有哪些产品
目前市面上做 AI 绘本的产品信息较少,但以下为您提供一些相关领域的类似产品供参考: 在 AI 虚拟陪伴方面,有以下产品和项目: 1. Character.ai:这是一个 AI 虚拟陪伴平台,用户可以与数百个 AI 驱动的角色进行信息交流,包括名人、动漫角色等。用户还可以创建自己的角色,赋予他们描述、图像、个性,甚至更高级的特性。 2. Replika:这是一款 AI 虚拟陪伴应用,用户可以设计理想的伴侣,随着时间的推移,你们的关系会有所发展。您的 Replika 会存储记忆,以便在未来的对话中参考,甚至可以给您发送照片。 3. Talkie:这是一款 AI 虚拟陪伴应用,主打情感路线。Talkie 中设计有大量的 npc,游戏和休闲娱乐体验感更强,每个 npc 即带着一个自己的剧情体系,在与角色交流过程中会触发抽取卡牌机会。 在制作 PPT 方面,有以下 AI 产品: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。https://gamma.app/ 2. 美图 AI PPT:美图 AI PPT 是由知名图像编辑软件“美图秀秀”的开发团队推出的 AI PPT 工具。它允许用户通过输入简单的文本描述来生成专业的 PPT 设计。美图 AI PPT 可能包含了丰富的模板库和设计元素,用户可以根据自己的需求选择不同风格和主题的模板,快速打造出适合行业分析、工作汇报、创意设计方案等多种场合的 PPT。https://www.xdesign.com/ppt/ 3. Mindshow:Mindshow 是一款 AI 驱动的 PPT 辅助工具,它可能提供了一系列的智能设计功能,如自动布局、图像选择和文本优化等,以帮助用户更高效地创建演示文稿。Mindshow 的目标是通过简化设计流程,让用户能够专注于内容的表达和创意的发挥,而不是繁琐的设计工作。它可能还包括了一些互动元素和动画效果,以增强演示文稿的吸引力。https://www.mindshow.fun/ 在图生图方面,有以下产品: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 需要注意的是,这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。 以上内容由 AI 大模型生成,请仔细甄别。
2024-08-13
想知道目前市面上做AI绘本的有哪些公司
目前市面上做 AI 绘本的公司有: 阿里:通义千问大模型的问答能力不错,能满足绘本故事创作。通义万相在文生图方面,生图效果还可以但不稳定,提示词有难度,文字理解能力较弱,每日有 50 灵感值限制出图次数,但有相似图像生成和图像风格迁移功能。 字节跳动:Dreamina 有很多实用功能,如基本的扩图和消除笔功能,可直接用自然语言出图且理解到位,对新手友好,文生图限时免费且无出图次数限制。
2024-08-13