Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

请问现在好用的AI图片生产工具有哪些,对人物一致性要求高

Answer

以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高:

  1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。
  2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。
  3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。
  4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。

在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。

另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。

Content generated by AI large model, please carefully verify (powered by aily)

References

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

更多写剧本的方法、小技巧、格式还有软件,希望后面有时间可以多写一些。照例,先放上我写的分镜,这是非常粗糙且不规范的分镜,正常的分镜是要更仔细的,所以大家凑活看。与上一次制作不同的是,因为更了解AI生图的局限,所以我这次写的分镜,有百分之八十都用上了。也算提高了效率,但还是写得太粗糙了,下次尽量按照正规格式写得准确一些,如果我的肝还好的话(主要是就只有我和Zoik看就有点偷懒了)……给大家推荐一些编剧相关的书,虽然我觉得写短片看这些书还是太多了,但基本涵盖了常见的剧作书,供参考吧~其实也不用看这么多书,只不过我看到同类型的书就想买来对比,没时间的话,看《救猫咪》或《电影剧本写作基础》的第一册就行。主要还是练习,写。第二步,生图这次生图,我明显感觉到Midjourney的语义理解比之前好了很多。很多人在生图上都遇到了人物和场景一致性的问题。有两个取巧的方式,一个是像我上个视频一样生成动物,动物会比较容易保持一致性,另一个方式是特定的名人/或者有特殊属性的人物。这次我们用的是第二种方式。首先,先确定好影片风格,这次用的是皮克斯动画风格。真的不是我们不做其他题材,是因为这个故事比较适合用动画呈现,后面的片子我们会多尝试别的题材风格。其次,先确定好人物形象。短片有两个主要角色,角色一:扎马尾、穿白色T恤、穿牛仔裤的14岁女孩;角色二:戴眼镜、灰色头发、穿灰色短衬衫的50岁男人。

问:有哪些好用的图生图产品?

目前比较成熟的通过输入图片生成类似图片的AI产品主要有:1.Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。2.Retrato:AI工具,将图片转换为非凡肖像,拥有500多种风格选择,适合制作个性头像。3.Stable Diffusion Reimagine:新型AI工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。4.Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的AI工具,将上传的照片转换为芭比风格,效果超级好。这些AI模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。内容由AI大模型生成,请仔细甄别

从游戏截图升级到KV品质,AI居然可以这样用!

目前市面上有线上和线下本地部署的两种AI:线上的优势为出图速度快,不吃本地显卡的配置,且无需自己下载动辄几个G的模型,还能看其他创作者的制作的涩图,但为了节约算力成本他们只支持出最高1024X1024左右的图,制作横板、高清等图片就会受限线下部署的优势为可以自己添加插件,不卡算力,出图质量高于线上平台,但是使用期间电脑基本处于宕机状态,如果配置不高的话还会出现生成半天之后爆显存的情况,导致出图失败[heading3]所以我们这里充分发挥线上和线下平台的优势[content]线上:找参考,测试模型线下:主要的出图工具在线上绘图网站的绘图广场上发现自己想要的画风点击创作,会自动匹配创作的使用的模型lora和tag截取一小张游戏人物作为底图,目的是将线上平台有限的算力全部堆在人物身上多批次,多数量的尝试不同的画风,得出最符合游戏的一款模型+lora组合最后在C站([https://civitai.com/](https://civitai.com/))上下载对应模型到本地,加载部署后就可以开始正式生图了!

Others are asking
可以帮忙做excel表格的ai工具
以下是一些可以帮忙做 Excel 表格的 AI 工具: 1. Excel Labs:这是一个 Excel 插件,基于 OpenAI 技术,新增了生成式 AI 功能,允许用户在 Excel 中直接利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件,用户通过聊天形式告知需求,Copilot 会自动完成如数据分析或格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 随着技术的不断发展,未来可能会有更多 AI 功能被集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。
2024-12-23
国内好用的ai
以下是为您推荐的一些国内好用的 AI 产品: 1. 图像类产品: 可灵:由快手团队开发,可生成高质量的图像和视频,图像质量高,但价格相对较高,重度用户年费可达几千元,轻度用户有每日免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可,但存在一些局限性,如某些类型的图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色。 2. 聊天对话类产品: Kimi:具有超长上下文能力,最初支持 20 万字,现提升到 200 万字,对处理长文本或大量信息任务有优势,但文字生成和语义理解、文字生成质量方面可能不如其他产品,且不支持用户自定义智能体。 智谱清言:背后技术源自清华大学研发团队的科研成果转化,模型质量出色,以 ChatGPT 为对标打造用户体验,是国内首批开放智能体应用的公司之一,在逻辑推理和处理复杂提示词方面表现出色。 3. 其他类产品: 美趣 AI:原生图片生成,所属公司为兴利和。 说得相机提词器:功能写作软件。 AI 智能写作:原生写作软件,所属公司为汉酷网络。 创客贴 AI:功能平面设计,所属公司为艺源酷科技。 360AI 搜索:功能智慧搜索,所属公司为 360。 图趣 AI:原生图片生成。 Molica AI:原生图片生成。 文案宝:原生个人助理。
2024-12-23
电商用的AI工具
以下是一些电商常用的 AI 工具: 1. 电商 AI 工具库基础版(作者:清酒): 收集了十几款电商领域能用得上的 AI 工具,结合场景特别直观。 按照电商的角色进行了区分,无论您是买家、卖家、渠道还是生产者,都能找到合适的 AI 工具。 不仅有产品形态,还有非常具体的使用描述。您可以通过链接 https://i1lfku7w5p.feishu.cn/sheets/PJZTsTnDQhZnAatp2dccKYjQnnh 查看。 2. 生成式 AI 工具: 像这样的工具帮助品牌创建引人注目的产品照片,这对于向在线购物者销售产品非常重要。 可以制作用于电子邮件或社交媒体的营销材料。 可以编写经过 SEO 优化的产品描述。 3. 营销领域的 AI 工具: Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频。提供多种定价计划,从免费到商业级不等,可用于制作营销视频、产品演示等。 HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频。适合制作营销视频和虚拟主持人等。 Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等。提供多种语气和风格选择,写作质量较高。 Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容。有免费和付费两种计划。 Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等。提供多种语气和行业定制选项。 更多的营销产品可以查看 WaytoAGI 网站:https://www.waytoagi.com/sites?tag=8 。总的来说,这些 AI 工具能够帮助电商从业者高效创作各种营销内容,提高工作效率。用户可根据实际需求选择合适的工具。需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-23
我现在是一家公司的实习生,目前参与的项目是AI法律大模型未来法官助手,这个系统的功能是提取案件中的信息,自动填写到预设好的要件中,比如犯罪嫌疑人的姓名、身份证号、出生日期、事发经过等等,我该如何去学习提示词
以下是关于如何学习提示词运用的建议: 1. 理解提示词的作用:提示词为模型提供上下文和指示,其质量直接影响模型输出质量。 2. 学习提示词的构建技巧: 明确任务目标,用简洁准确的语言描述。 给予足够的背景信息和示例,帮助模型理解语境。 使用清晰的指令,如“解释”“总结”“创作”等。 对特殊要求应给予明确指示,如输出格式、字数限制等。 3. 参考优秀案例:研究和学习已有的优秀提示词案例,在领域社区、Github 等资源中获取大量案例。 4. 实践、迭代、优化:多与语言模型互动,根据输出结果提高提示词质量,尝试各种变体,比较分析输出差异,持续优化提示词构建。 5. 活用提示工程工具:如 Anthropic 的 Constitutional AI 等,辅助构建和优化提示词。 6. 跟上前沿研究:提示工程是前沿研究领域,持续关注最新研究成果和方法论。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。同时,在与大模型交互时,方法论不是关键,不断尝试和交互是最佳方法,无需严格遵循规则,未达成目的就锲而不舍地再尝试或更换模型。另外,用 Markdown 格式清晰表达问题有助于提高与模型交流的效率和精确性,其具有结构清晰、格式化强调、适用性广等优点。
2024-12-23
有必要报学习AI的课程吗
学习 AI 是否有必要报课程取决于您的具体情况和需求。 如果您想深入学习 AI 中的美学概念和操作,可以考虑报野菩萨课程。对于入门学习,有多种途径可供选择。比如,可以先从国内模型工具入手,因为其不花钱。学习过程可以从提示词开始,国内的大语言模型工具好用,并且在与各类模型对话中提示词具有重要性,结构化提示词还有优势。您还可以参考温达、李弘毅老师的课程等。 另外,若想进阶学习,可能需要考虑高阶方向。在学习过程中,对于账户投资,初期可先从国内模型工具入手。同时,若想深入学习某些内容,可查看官方 cookbook,创作者将内容做成可视化形式也会发到群里。入门经典必读和面向开发者的文章也值得阅读,欢迎上传相关 PPT 用作参考。 总之,是否报课程要综合考虑您的学习目标、预算和现有基础等因素。
2024-12-23
目前最有优势的几款ai软件是什么
以下是目前一些具有优势的 AI 软件: 在移动设备上,图片和视频内容编辑方面,传统创意工具转型的生成式 AI 优先,如排名较高的美图秀秀(第 9 位)、SNOW(第 30 位)和 Adobe Express(第 35 位)。 ChatGPT 第三次以巨大优势成为网络和移动端排名第一的产品。 Perplexity 在网络上排名第三,是一款专注于提供简明、实时和准确查询答案并引用来源的人工智能搜索引擎,其在访问时长方面略胜于 ChatGPT,且首次进入移动端前 50 名榜单。 Anthropic 的 Claude 是 ChatGPT 的直接竞争对手,在网页排名中进入前五,排名第 4。
2024-12-23
什么ai视频工具好用
以下是一些好用的 AI 视频工具: Runway:https://runwayml.com/ 。在真实影像方面质感好,战争片全景镜头处理出色,控件体验感好,但爱变色,光影不稳定,控制能力强,可指定局部对象设置运动笔刷。有网页和 app 方便。工具教程: Pixverse:https://pixverse.ai/ 。在高清化方面有优势,对偏风景和纪录、有特定物体移动的画面友好,能力全面,缺点是同时只能进行 4 个任务。工具教程: Haiper:https://app.haiper.ai/ 。默默无闻,只能生成 2s,但有不错的镜头,稳定性强,优点是没有并发任务限制。 Pika:https://pika.art/ 。对奇幻感画面把控好,自然,有嘴型同步功能,对二次元友好。工具教程: SVD:https://www.stablevideo.com/ 。整体略拉垮,唯一能打的是在风景片,优点是不带水印,动作幅度大,但崩坏概率大。工具教程: 此外,还有以下 AI 视频工具: 即梦:https://dreamina.jianying.com/ 。剪映旗下,生成 3 秒,动作幅度有很大升级,最新 S 模型,P 模型。工具教程: Kling:kling.kuaishou.com 。支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。视频模型: Vidu:https://www.vidu.studio/ 智谱清影:https://chatglm.cn/video 。开源了,可以自己部署 cogvideo 。工具教程: 美图旗下:https://www.miraclevision.com/ Neverends:https://neverends.life/create 。操作傻瓜 SD:Animatediff SVD deforum 。自己部署 Leiapix:https://www.leiapix.com/ 。可以把一张照片转动态 Krea:https://www.krea.ai/ Opusclip:https://www.opus.pro/ 。利用长视频剪成短视频 Raskai:https://zh.rask.ai/ 。短视频素材直接翻译至多语种 invideoAI:https://invideo.io/make/aivideogenerator/ 。输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频 descript:https://www.descript.com/?ref=feizhuke.com veed.io:https://www.veed.io/ 。自动翻译自动字幕 clipchamp:https://app.clipchamp.com/ typeframes:https://www.revid.ai/?ref=aibot.cn 还有一些其他的工具,如: Morph Studio:https://app.morphstudio.com/ 。还在内测 Heygen:https://www.heygen.com/ 。数字人/对口型 Kaiber:https://kaiber.ai/ Moonvalley:https://moonvalley.ai/ Mootion:https://discord.gg/AapmuVJqxx 。3d 人物动作转视频
2024-12-20
好用的视频创作AI工具有哪些
以下是一些好用的视频创作 AI 工具: 1. 根据视频脚本生成短视频的工具: ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架,实现从文字到画面的快速转化。 PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 Runway:将文本转化为风格化视频内容,适用于多种场景。 艺映 AI:专注人工智能视频,提供文生视频、图生视频、视频转漫等服务。 2. 给视频配音效的 AI 工具: Wavel Studio:支持 30 多种语言配音,音质自然流畅,能自动去除背景噪音和杂音,提供添加字幕和文本叠加层工具,界面友好且有多种自定义选项。 Elai.io:支持 65 多种语言配音,音色和语调真实,自动将唇形与语音同步,生成字幕提高视频可访问性,支持多位配音者。 Rask AI:支持 130 多种语言配音,包括稀有和濒危语言,采用先进语音合成技术,音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 Notta:提供快速实惠的多语言配音解决方案,保留原声说话风格和细微差别,提供调整语音速度和音调工具,支持批量处理。 Dubverse:支持 60 多种语言配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具,与多种视频平台和社交媒体渠道整合。 此外,在进行 AI 短片创作时,除了使用上述工具,还需考虑故事来源。比如原创,可基于自身或周围人的经历、做过的梦、想象的故事等;也可改编经典 IP、名著、新闻或进行二创。剧本写作方面,短片创作篇幅较小、情节和角色相对简单,可从自身或朋友经历改编入手,或对触动自己的短篇故事进行改编。多与他人讨论故事,有助于修改和进步。
2024-12-20
比较好用的制作PPT的AI
以下是一些比较好用的制作 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 另外,有人通过与 GPT4 交流来制作 PPT 大纲,经过多次迭代完成。WPS AI 也能帮助优化 PPT 大纲、快速生成 PPT 并进行主题配色和字体修改等操作。但需注意,WPS 可能未来会对相关功能收费。
2024-12-19
国内那种会议记录语音转文字的免费AI产品好用
国内有以下免费的会议记录语音转文字的工具,不过大部分有使用时间限制,超过免费时间可能需要付费: 1. 飞书妙记:飞书的办公套件之一,网址为 https://www.feishu.cn/product/minutes 。 2. 通义听悟:阿里推出的 AI 会议转录工具,网址为 https://tingwu.aliyun.com/home 。 3. 讯飞听见:讯飞旗下智慧办公服务平台,网址为 https://www.iflyrec.com/ 。 4. Otter AI:转录采访和会议纪要。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 内容由 AI 大模型生成,请仔细甄别。
2024-12-19
去除视频中不要的部分什么AI好用
以下是为您整理的一些关于去除视频中不要部分的 AI 工具和相关介绍: 1. Topaz Video AI: 这是一个用于消除视频抖动和运动模糊的插件。 解压对应文件,推荐使用绿色版。 右键管理员运行 VideoAIportable.exe 文件,导入处理好的视频。 主界面左边是原视频,右边是待处理视频,下面是视频轨道。 右边部分是主要的视频处理方式,预设部分包括放大视频、提升画质、提升帧率等。 稳定 AI 用于画面稳定和减少抖动,模式分为自动裁切和完整帧,强度在 60 左右,抖动需开启,次数一般选择 2 保持默认不变。 帧插值 AI 主要是识别帧和帧之间进行修复替换,有多种模型。 增强 AI 选择不同模型对视频进行整体优化,包括面部、去噪、锐化提升等。 2. VSR 字幕去除工具: 利用 AI 去除视频和图片中的字幕。 支持智能填充处理,确保视觉质量。 您可以根据自己的需求和电脑配置选择适合的工具。
2024-12-18
怎么通过ai做一个关于视频批量生产工具
要创建一个基于AI的视频批量生产工具,您需要结合多个技术和组件,包括视频编辑、内容生成、自动化处理等。以下是一个基本的步骤指南: 1. 需求分析: 确定您的视频生产需求,例如视频类型、内容主题、目标观众等。 分析视频生产的各个环节,如脚本编写、素材收集、剪辑、后期制作等。 2. 选择合适的AI工具和平台: 根据需求选择合适的AI服务,如自然语言处理(NLP)服务、图像和视频识别、自动剪辑工具等。 考虑使用现有的AI视频生成平台或API,如Google Video AI、Adobe Sensei、Wibbitz等。 3. 开发自动化脚本或软件: 使用编程语言(如Python、JavaScript等)开发自动化脚本或软件。 集成AI服务API,以自动执行视频制作的各个步骤。 4. 内容生成: 利用AI生成或辅助生成视频内容,如自动脚本编写、图像和视频素材生成等。 使用AI进行语音合成,为视频添加自动配音。 5. 视频剪辑和后期制作: 利用AI进行视频剪辑,如自动剪辑、过渡效果添加、颜色校正等。 使用AI工具进行视频后期处理,如添加字幕、水印、特效等。 6. 测试和优化: 测试自动化工具生成的视频,确保质量和内容的准确性。 根据测试结果优化AI模型和自动化流程。 7. 部署和监控: 部署自动化视频生产工具到服务器或云平台。 监控工具的性能和视频生产过程,确保稳定运行。 请注意,这个过程需要一定的技术背景,特别是在编程和AI技术方面。如果您不熟悉这些技术,可能需要聘请专业的开发人员或与AI服务提供商合作。此外,确保遵守所有适用的法律和政策,尤其是在内容版权和隐私方面。
2024-04-26
可灵ai如何保持人物一致性
要保持可灵 AI 中人物的一致性,可以参考以下方法: 1. 人物设定: 明确主角、配角等人物的性格特点、外貌特征等,如主角是一位 40 岁的中年男探险家,性格特点是面对挑战从不轻言放弃,外貌特征是健壮、棕色头发、常穿探险服。 2. MJcref 控制人物一致性: 先根据人物设定,在 MJ 里筛选适合的人物形象,选中后右键复制图片链接。 在尾缀加入【cref 图片链接】控制人物一致性,【cw 数值】控制权重。 对于镜头较多的角色,建议炼个人物模型出来控制,不然 MJ 容易不稳定。 3. 控制多人物场景统一: 先控制一个角色再进行重绘。 选一张合适的图片后,点击 Vary进行局部重绘,并把尾缀机器人的 cref 链接改成主角的 cref 链接。 4. 通过 prompt 格式实现“角色一致性”: 公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。 发型/衣物:构造尽可能多的角色非面部视觉元素,产生观众对角色的“一致性观感”。 年龄:约束角色年龄特征。 环境:约束能够产生相同观感的环境空间,尤其是光环境,增加观众对于形象认识的“一致性”认知。例如: 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。
2024-12-21
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
sd角色一致性
在 Stable Diffusion(SD)中实现角色一致性多角度头像绘制的方法如下: 1. 准备工作: 准备一张人物的多角度图片,共有 15 个不同视图,尺寸设置为 1328×800px,放大两倍后保证每张小图为 512×512px。 加上网格图,通过 lineart 分割不同块面。 设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区。 增加 ADetailer 的脸部修复插件防止小图模式下人脸崩坏。 2. 开始生图: 大模型:majicmixRealistic_v6.safetensors 正向提示词:,auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography 负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w 参数设置:迭代步数 50,采样方法 DPM++ 2M Karras,尺寸 1328×800px。 3. 细节放大: 发送到图生图,重绘幅度设置为 0.55,使用 controlnet 的 teil 模型增加细节,控制模式选择“更倾向 controlnet”。 使用 Ultimate SD upscale 脚本放大为 2 倍,采用 4xUltraSharp 放大算法。 4. 尝试不同风格: 例如使用 AnythingV5 大模型绘制浅绿色侧马尾女孩形象,使用 revAnimated 大模型绘制粉色头发的长发公主形象。 需要注意的是,由于 AI 绘画的随机性存在,15 个角度的画面不可能完美,controlnet 的控制能让我们更大程度接近想要的效果,想要好的结果需要多刷图。如需 stable diffusion 相关资料,可关注公众号【白马与少年】发送【sd】获取链接。
2024-11-25
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
图片的前后一致性,如何实现
要实现图片的前后一致性,可以参考以下步骤: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,描述其内容并在提示词中加入第一张图的构图风格(使用 iw 参数)。需注意,输入 ar、iw 等参数时,要与前面的提示词用空格隔开,否则会报错。例如:“a dog 空格 ar 16:9 空格 iw 1”。将生成的多张图中选择一张图作为垫图,通过右键图片获取其地址。按照格式将提示词、垫图关键词写入。通过微调提示词,得出满意图。 3. 确定图片角色一致性:在得到构图相同后,利用 MJ 重绘功能对画面里的角色重绘。在重绘提示词里输入 cref cw 来保证角色一致性,cref 所垫图还是用之前的图,因为它包含构图和人物两个内容。如果出现黑边,可将黑边部分框住,重绘输入关键词“background”去除黑边,保证背景一致。 由于 MJ 存在不可控因素,如果要保证前后两张图画风、构图等都保持一致,可以按照上述三个确定来处理。需要注意的是,MJ 在重绘时,相较于改变整个画面结构,固定位置重绘局部内容会容易很多。先保证构图再确认角色一致性,就好比美术课画画,把背景风格做好了在固定位置添加内容,比将整个页面内容全部重绘且保证画面主题内容与参考图一样要容易,后者随机性更大。
2024-10-10
stable diffusion 绘本一致性
Stable Diffusion 绘本一致性相关知识如下: 工作原理: Stable Diffusion 生成随机噪声,并逐步更改噪声以努力获得与提示一致的图像。其基本结构包括 encoder + diffusion + decoder 的流程。Checkpoint 记录某个训练周期整个 diffusion 及可能的 encoder decoder 的参数,VAE 是 encoder decoder 的参数,在 SDXL 等大型模型中需配对以避免花屏现象。LoRA 模型训练时先冻结 SD 模型权重,然后在 UNet 结构中注入 LoRA 模块并与 CrossAttention 模块结合,只对部分参数微调。 相关论文: AnyDoor: MixofShow: LyCORIS: 影响生成结果的因素: 影响生成的图与他人不同的因素包括随机数种子(Seed)。随机数种子控制最底层形状,决定照片基础轮廓,如人物外形轮廓、姿势和站位等。当随机数为“1”时,SD 会随机生成种子。可在点击生成的照片下面的一大串英文中查看 seed 值。只有所有参数包括随机数种子都与他人相同时,才能生成相似的照片。
2024-09-30