直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

请问现在好用的AI图片生产工具有哪些,对人物一致性要求高

回答

以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高:

  1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。
  2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。
  3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。
  4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。

在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。

另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

更多写剧本的方法、小技巧、格式还有软件,希望后面有时间可以多写一些。照例,先放上我写的分镜,这是非常粗糙且不规范的分镜,正常的分镜是要更仔细的,所以大家凑活看。与上一次制作不同的是,因为更了解AI生图的局限,所以我这次写的分镜,有百分之八十都用上了。也算提高了效率,但还是写得太粗糙了,下次尽量按照正规格式写得准确一些,如果我的肝还好的话(主要是就只有我和Zoik看就有点偷懒了)……给大家推荐一些编剧相关的书,虽然我觉得写短片看这些书还是太多了,但基本涵盖了常见的剧作书,供参考吧~其实也不用看这么多书,只不过我看到同类型的书就想买来对比,没时间的话,看《救猫咪》或《电影剧本写作基础》的第一册就行。主要还是练习,写。第二步,生图这次生图,我明显感觉到Midjourney的语义理解比之前好了很多。很多人在生图上都遇到了人物和场景一致性的问题。有两个取巧的方式,一个是像我上个视频一样生成动物,动物会比较容易保持一致性,另一个方式是特定的名人/或者有特殊属性的人物。这次我们用的是第二种方式。首先,先确定好影片风格,这次用的是皮克斯动画风格。真的不是我们不做其他题材,是因为这个故事比较适合用动画呈现,后面的片子我们会多尝试别的题材风格。其次,先确定好人物形象。短片有两个主要角色,角色一:扎马尾、穿白色T恤、穿牛仔裤的14岁女孩;角色二:戴眼镜、灰色头发、穿灰色短衬衫的50岁男人。

问:有哪些好用的图生图产品?

目前比较成熟的通过输入图片生成类似图片的AI产品主要有:1.Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。2.Retrato:AI工具,将图片转换为非凡肖像,拥有500多种风格选择,适合制作个性头像。3.Stable Diffusion Reimagine:新型AI工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。4.Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的AI工具,将上传的照片转换为芭比风格,效果超级好。这些AI模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。内容由AI大模型生成,请仔细甄别

从游戏截图升级到KV品质,AI居然可以这样用!

目前市面上有线上和线下本地部署的两种AI:线上的优势为出图速度快,不吃本地显卡的配置,且无需自己下载动辄几个G的模型,还能看其他创作者的制作的涩图,但为了节约算力成本他们只支持出最高1024X1024左右的图,制作横板、高清等图片就会受限线下部署的优势为可以自己添加插件,不卡算力,出图质量高于线上平台,但是使用期间电脑基本处于宕机状态,如果配置不高的话还会出现生成半天之后爆显存的情况,导致出图失败[heading3]所以我们这里充分发挥线上和线下平台的优势[content]线上:找参考,测试模型线下:主要的出图工具在线上绘图网站的绘图广场上发现自己想要的画风点击创作,会自动匹配创作的使用的模型lora和tag截取一小张游戏人物作为底图,目的是将线上平台有限的算力全部堆在人物身上多批次,多数量的尝试不同的画风,得出最符合游戏的一款模型+lora组合最后在C站([https://civitai.com/](https://civitai.com/))上下载对应模型到本地,加载部署后就可以开始正式生图了!

其他人在问
作为一名媒体从业者,可以用AI做出哪些作品
作为一名媒体从业者,可以利用 AI 做出以下作品: 1. 写东西: 草拟任何东西的初稿,如博客文章、论文、宣传材料、演讲、讲座、剧本、短篇小说等。 让写作变得更好,将文本粘贴到 AI 中,要求其改进内容,或就如何为特定受众提供更好的建议,还可要求其以不同风格创建多个草稿,使其更生动或添加例子。 帮助完成任务,如写邮件、创建销售模板、提供商业计划的下一步等。 从困难挑战中解锁自己,让自己更有动力。 2. 撰写公众号文章: AI 生产文章的过程相对简单,关键在于提供清晰且具有指导性的提示词。基本提示词能生成基础文章,更详细、具创意的提示词能提升文章质量,更好地捕捉文章的语气、风格和重点。 例如,可给 AI 这样的提示词:“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”AI 会生成结构完整、内容丰富、观点鲜明的文章,但最终产出的内容可能需要微调以符合预期和公众号风格。
2024-11-23
国内的,AI学习类关于阅读和听力提升的应用(具备AI能力的应用)或者工具有哪些?
目前国内具备 AI 能力、有助于提升阅读和听力的应用和工具相对较多。例如,流利说英语在听力和口语训练方面表现出色,它能通过 AI 技术为用户提供个性化的学习方案和精准的发音纠正。还有百词斩,其在单词记忆和阅读拓展方面有独特的功能,利用 AI 算法推荐适合用户水平的阅读材料。此外,网易有道词典也具备一定的 AI 辅助功能,能帮助用户提升听力理解和阅读能力。
2024-11-23
AI学习类关于阅读和听力提升的应用或者工具有哪些?
以下是一些有助于提升阅读和听力的 AI 学习应用或工具: 英语学习方面: 1. 智能辅助工具:如 Grammarly,可进行英语写作和语法纠错,改进英语表达和写作能力。 2. 语音识别和发音练习:例如 Call Annie,用于口语练习和发音纠正,提供实时反馈和建议。 3. 自适应学习平台:像 Duolingo,利用 AI 技术为您量身定制学习计划,提供个性化学习内容和练习。 4. 智能导师和对话机器人:比如 ChatGPT,可进行英语会话练习和对话模拟,提高交流能力和语感。 数学学习方面: 1. 自适应学习系统:如 Khan Academy,结合 AI 技术提供个性化数学学习路径和练习题,精准推荐。 2. 智能题库和作业辅助:例如 Photomath,通过图像识别和数学推理技术提供数学问题解答和解题步骤。 3. 虚拟教学助手:如 Socratic,利用 AI 技术解答数学问题、提供教学视频和答疑服务。 4. 交互式学习平台:如 Wolfram Alpha,参与数学学习课程和实践项目,进行数学建模和问题求解。 此外,在教育领域,还有一些其他的应用: 1. 语言学习:Speak、Quazel、Lingostar 等,提供实时交流和发音反馈。 2. 数学指导:Photomath、Mathly 帮助学生解决数学问题。 3. 历史学习:PeopleAI、Historical Figures 通过模拟与杰出人物聊天教授历史。 4. 写作辅助:Grammarly、Orchard、Lex 帮助学生克服写作难题,提升写作水平。 5. 内容处理:Tome、Beautiful.ai 协助创建演示文稿。 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2024-11-23
excel的ai应用软件
以下是一些与 Excel 相关的 AI 应用软件: 1. Excel Labs:是 Excel 插件,新增基于 OpenAI 技术的生成式 AI 功能,用于数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的整合办公软件的 AI 工具,能通过聊天形式完成数据分析、格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器功能,支持自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,可生成公式、文本内容、执行情感分析、语言翻译等任务。 此外,还有以下相关的 AI 应用: 1. WPS 文档翻译功能:可快速翻译办公文档,如 Word、Excel、PPT 等,提高工作效率。 2. 在表格类的 AI 产品中,6 月访问量排名靠前的有 Highcharts、Fillout.com、Coefficient 等。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和智能化水平。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-23
如何搭建利用产品原图和模特模板生成商业图的工作流 或者有没有这类ai 应用
以下是关于利用产品原图和模特模板生成商业图的工作流及相关 AI 应用的信息: 美国独立站搭建工作流中,有给模特戴上珠宝饰品的应用。 大淘宝设计部在主题活动页面、超级品类日传播拍摄创意、产品营销视觉、定制模特生成、产品场景生成等方面应用了 AI。例如,七夕主题活动页面通过 AI 生成不受外部拍摄条件限制的素材;在 UI 设计场景中,利用 SD 中 controlnet 生成指定范围内的 ICON、界面皮肤等;通过对 AI 大模型的训练和应用,提升合成模特的真实性和美感,提供定制化线上真人模特体验,如 AI 试衣间、AI 写真等;还能根据商品图和用户自定义输入生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。
2024-11-22
是AI聪明还是人的大脑聪明
AI 和人的大脑谁更聪明是一个复杂的问题,不能简单地一概而论。 从某些方面来看,AI 具有强大的计算能力和处理大量数据的能力,能够快速准确地完成特定任务。例如,在处理复杂的数学计算、大规模数据的分析和模式识别等方面表现出色。 然而,人的大脑具有独特的智慧和能力。大脑是一个混沌系统,具有创造性、适应性、情感理解、综合判断和复杂情境处理等能力。人类能够进行抽象思维、创新创造、理解情感和道德等方面的思考。 AI 是通过学习人类大脑结构来发展的,但目前仍存在诸多不足和缺陷。例如,大模型内部也是混沌系统,即使是科学家也无法解释其微观细节。 在绘画方面,人类的绘画创作通常是线性发展的过程,先学习线稿表达、色彩搭配、光影表现等,而 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图,经常会在同一张图中呈现出不同绘画级别的细节。 总之,AI 和人的大脑各有优势和局限性,不能简单地判定谁更聪明。
2024-11-22
中国国产最好用的免费视频AI是哪个呢
以下是一些中国国产好用的免费视频 AI 工具: Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA(国内):https://etna.7volcanoes.com/ 。是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。 Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。 此外,还有一些其他的相关工具: Leiapix:https://www.leiapix.com/ ,免费,可把一张照片转动态。 Krea:https://www.krea.ai/ ,12 月 13 日免费公测。 luma: ,30 次免费。 hailuoai:https://hailuoai.video/ ,新账号 3 天免费,过后每天 100 分,语义理解能力强。 Opusclip:https://www.opus.pro/ ,可利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材可直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法生成脚本和分镜描述,生成视频后可人工二编合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,有一次免费体验,可自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ ,免费,高级功能付费。 typeframes:https://www.revid.ai/?ref=aibot.cn ,有免费额度。
2024-11-22
请介绍图片搜索最好用的AI工具
以下为您介绍一些在图片搜索相关方面表现出色的 AI 工具: 图片去水印工具: 1. AVAide Watermark Remover:在线工具,支持多种图片格式,操作简单,可去除水印、文本、对象等。 2. Vmake:可上传最多 10 张图片,自动检测并移除水印,适合快速处理。 3. AI 改图神器:能一键去除图片中的多余物体、人物或水印,支持粘贴或上传手机图像。 图生图产品: 1. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 2. Retrato:将图片转换为非凡肖像,有 500 多种风格选择。 3. Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:将上传照片转换为芭比风格。 图片生成 3D 建模工具: 1. Tripo AI:在线 3D 建模平台,能利用文本或图像快速生成高质量 3D 模型。 2. Meshy:支持文本、图片生成 3D 及 AI 材质生成。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 可通过手绘草图实时设计 3D 形象。 4. Sudo AI:通过文本和图像生成 3D 模型,适用于游戏领域。 5. VoxCraft:免费工具,能将图像或文本快速转换成 3D 模型,提供多种功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。这些工具各有特点,您可以根据具体需求选择最适合您的工具。
2024-11-21
有没有免费的好用的ai
以下为一些免费且好用的 AI 工具: 获取信息和学习东西:最佳免费选项为必应(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)。对于儿童,来自可汗学院的 Khanmigo(https://www.khanacademy.org/khanlabs)提供由 GPT4 驱动的良好的人工智能驱动辅导。 写东西:最佳免费选项为 Bing(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)和 Claude 2(https://claude.ai/)。 在写代码方面的免费替代品有: Tabnine(https://tabnine.com/):AI assistant that speeds up delivery and keeps your code safe Codeium(https://codeium.com/):Free AI Code Completion & Chat Amazon CodeWhisperer(https://aws.amazon.com/codewhisperer/):Build applications faster and more securely with your AI coding companion SourceGraph Cody(https://cody.sourcegraph.com/):The AI that knows your entire codebase Tabby(https://tabby.dev/):Opensource, selfhosted AI coding assitant fauxpilot/fauxpilot(https://github.com/fauxpilot/fauxpilot):An opensource alternative to GitHub Copilot server 需要注意的是,虽然 ChatGPT 功能强大,但它是收费的且不面向中国。此外,虽然 ChatGPT 的开发者 OpenAI 并不像其名字那样开放,其源码与模型数据不对外开放,但 Meta 在 2023 年 2 月开源了 LLaMA 1,并在 7 月发布了进阶的 Llama 2 且允许商用。
2024-11-21
目前比较好用的AI辅助制作ppt的工具,推荐
以下是一些比较好用的 AI 辅助制作 PPT 的工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果,以增强演示文稿的吸引力。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品中表现出色,背后拥有强大的团队,能敏锐把握 AI 与 PPT 结合的市场机遇,已确立市场领先地位。 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-20
你认为目前最好用的大模型有哪些?
目前最好用的大模型包括: 1. OpenAI 的 GPT4:是最先进和广泛使用的大型语言模型之一,在多种任务上表现卓越,如文本生成、理解、翻译及各种专业和创意写作任务,能通过大量数据学习理解和生成人类语言,处理复杂问题和理解上下文能力出色。 2. Anthropic 公司的 Claude 3。 3. 谷歌的 Gemini。 4. 百度的文心一言。 5. 阿里巴巴的通义大模型。 大型模型主要分为两类: 1. 大型语言模型:专注于处理和生成文本信息。 2. 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息。 大型多模态模型与大型语言模型的不同点: 1. 处理的信息类型不同:大型语言模型专注于文本,大型多模态模型能处理多种类型信息。 2. 应用场景不同:大型语言模型主要用于自然语言处理任务,大型多模态模型应用领域更广泛。 3. 数据需求不同:大型语言模型依赖大量文本数据训练,大型多模态模型需要多种类型数据训练。 此外,如果想了解国内的大模型效果,可以参考第三方基准评测报告: 。需注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-19
最好用的AI工具有哪些
以下是一些好用的 AI 工具: AI 新闻写作工具: Copy.ai:功能强大,提供丰富的新闻写作模板和功能,可快速生成新闻标题、摘要、正文等内容,提高写作效率。 Writesonic:专注写作,提供新闻稿件生成、标题生成、摘要提取等功能,智能算法能生成高质量新闻内容,适合新闻写作和编辑人员。 Jasper AI:主打博客和营销文案,也可用于生成新闻类内容,写作质量较高,支持多种语言。 访问量较大的 AI 工具: ChatGPT:在 2022 年 9 月至 2023 年 8 月期间拥有 146 亿次访问量,在美国使用率最高,其次是印度和巴西,大多数受众通过移动设备访问,性别分布偏向男性用户。 Character AI QuillBot Midjourney Hugging Face Google Bard NovelAI CapCut JanitorAI Civitai 能够帮助建筑设计师审核规划平面图的 AI 工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载建筑大模型,软件 UI 和设计成果颜值在线。 Maket.ai:面向住宅行业,在户型和室内软装设计方面有探索,能根据输入需求自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,提供全新设计模式,可引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能将建筑全寿命周期内的信息集成,实现数据汇总与管理。 需要注意的是,每个工具都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的工具。同时,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-19
怎么通过ai做一个关于视频批量生产工具
要创建一个基于AI的视频批量生产工具,您需要结合多个技术和组件,包括视频编辑、内容生成、自动化处理等。以下是一个基本的步骤指南: 1. 需求分析: 确定您的视频生产需求,例如视频类型、内容主题、目标观众等。 分析视频生产的各个环节,如脚本编写、素材收集、剪辑、后期制作等。 2. 选择合适的AI工具和平台: 根据需求选择合适的AI服务,如自然语言处理(NLP)服务、图像和视频识别、自动剪辑工具等。 考虑使用现有的AI视频生成平台或API,如Google Video AI、Adobe Sensei、Wibbitz等。 3. 开发自动化脚本或软件: 使用编程语言(如Python、JavaScript等)开发自动化脚本或软件。 集成AI服务API,以自动执行视频制作的各个步骤。 4. 内容生成: 利用AI生成或辅助生成视频内容,如自动脚本编写、图像和视频素材生成等。 使用AI进行语音合成,为视频添加自动配音。 5. 视频剪辑和后期制作: 利用AI进行视频剪辑,如自动剪辑、过渡效果添加、颜色校正等。 使用AI工具进行视频后期处理,如添加字幕、水印、特效等。 6. 测试和优化: 测试自动化工具生成的视频,确保质量和内容的准确性。 根据测试结果优化AI模型和自动化流程。 7. 部署和监控: 部署自动化视频生产工具到服务器或云平台。 监控工具的性能和视频生产过程,确保稳定运行。 请注意,这个过程需要一定的技术背景,特别是在编程和AI技术方面。如果您不熟悉这些技术,可能需要聘请专业的开发人员或与AI服务提供商合作。此外,确保遵守所有适用的法律和政策,尤其是在内容版权和隐私方面。
2024-04-26
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
图片的前后一致性,如何实现
要实现图片的前后一致性,可以参考以下步骤: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,描述其内容并在提示词中加入第一张图的构图风格(使用 iw 参数)。需注意,输入 ar、iw 等参数时,要与前面的提示词用空格隔开,否则会报错。例如:“a dog 空格 ar 16:9 空格 iw 1”。将生成的多张图中选择一张图作为垫图,通过右键图片获取其地址。按照格式将提示词、垫图关键词写入。通过微调提示词,得出满意图。 3. 确定图片角色一致性:在得到构图相同后,利用 MJ 重绘功能对画面里的角色重绘。在重绘提示词里输入 cref cw 来保证角色一致性,cref 所垫图还是用之前的图,因为它包含构图和人物两个内容。如果出现黑边,可将黑边部分框住,重绘输入关键词“background”去除黑边,保证背景一致。 由于 MJ 存在不可控因素,如果要保证前后两张图画风、构图等都保持一致,可以按照上述三个确定来处理。需要注意的是,MJ 在重绘时,相较于改变整个画面结构,固定位置重绘局部内容会容易很多。先保证构图再确认角色一致性,就好比美术课画画,把背景风格做好了在固定位置添加内容,比将整个页面内容全部重绘且保证画面主题内容与参考图一样要容易,后者随机性更大。
2024-10-10
stable diffusion 绘本一致性
Stable Diffusion 绘本一致性相关知识如下: 工作原理: Stable Diffusion 生成随机噪声,并逐步更改噪声以努力获得与提示一致的图像。其基本结构包括 encoder + diffusion + decoder 的流程。Checkpoint 记录某个训练周期整个 diffusion 及可能的 encoder decoder 的参数,VAE 是 encoder decoder 的参数,在 SDXL 等大型模型中需配对以避免花屏现象。LoRA 模型训练时先冻结 SD 模型权重,然后在 UNet 结构中注入 LoRA 模块并与 CrossAttention 模块结合,只对部分参数微调。 相关论文: AnyDoor: MixofShow: LyCORIS: 影响生成结果的因素: 影响生成的图与他人不同的因素包括随机数种子(Seed)。随机数种子控制最底层形状,决定照片基础轮廓,如人物外形轮廓、姿势和站位等。当随机数为“1”时,SD 会随机生成种子。可在点击生成的照片下面的一大串英文中查看 seed 值。只有所有参数包括随机数种子都与他人相同时,才能生成相似的照片。
2024-09-30
如何用midijurney生生人物一致性
在 Midjourney 中实现人物一致性,主要通过以下方式: 1. Midjourney V6 更新了角色一致性命令“cref ”。您可以根据需要重复此过程,但要注意不要过多操作,以免丧失保真度。添加角色参考图像,并选择一个“cw”以达到效果。Midjourney 能够从参考图像中识别的角色属性将与提示混合,从而创建出角色的最终表现。您可以通过使用“cw N”参数(cref 权重)来大致控制转移,其中 N 的值可以从 1 到 100,默认值为 100。“cw”参数不会改变角色参考图像的强度/影响力,其作用如下: “cw 100”的值(默认值)将捕捉整个角色。 “cw 99 到cw 1”之间的值将开始捕捉较少的整个角色,仅集中于转移面部。 “cw 0”的值将仅捕捉面部,大致类似于面部替换。且无法关闭面部的转移。 2. 在群像人物一致性保持及空间深度控制方面,以双人画面人物一致性的保持为例,分为 5 步: Step 1:将初始图(A)以及人物图(B)作为风格(sref)及人物(cref)的参考内容,提示词中需要注意: 描述好空间关系(下方画线部分),视角问题可以略过(风格参考会自带角度)。 成功输出图(C),可能会遇到女同事 Lisa 无法保持跟初始图(A)一致的问题。其中:sref 为风格参考,cref 为人物参考,cw 范围为 0 100,默认 100 但建议写上去确保万无一失。 Step 2:找到已生成的 Lisa 纯人物的图,提取图片链接(url)做准备工作。 Step 3:基于 Step 1 生成的构图清晰但人物失控的成图(C)基础上,进行重绘 Vary Region,步骤为: 框选需要被替换的人物。 然后将 Step 2 准备好的链接,贴入框内界面 cref 后面,注意先把原始的 cref(即红色部分)删掉。
2024-09-23
ipadapter的作用是什么,能实现人物的一致性吗?比如参考人物的脸部特征
IP Adapter 即图像提示词适配器,其作用包括: 能够“复刻图像”,用户输入图像可直接生成内容或风格相似的图像。 注重图像风格和语义的复刻,兼容性强,可与结构控制插件一起使用,既控制结构,也控制图像的语义和风格。 是解决角色和风格一致性的优雅方法,能够非常精准地提取风格参考图中的角色和风格特征。 在处理人物一致性方面,IP Adapter 有一定的应用,例如在相关的图生图操作中会用到。关于其使用,之前有文章介绍。同时,Midjourney 也有类似的人物一致性相关功能。
2024-08-25
lora训练的数据集没有闭眼,如何保证人物一致性前提让角色闭眼
在训练 Lora 模型以保证人物一致性的前提下让角色闭眼,以下是一些可能的方法和参考信息: 得益于对 AI 大模型微调 finetuning 技术的研究,摸索出的训练特定画风 Lora 和特定角色 Lora 的方法,对角色一致性的锁定有决定性帮助。比如完善哪吒短褂、小短裤、额前火焰印记、流苏耳饰等细微之处的统一,最终针对不同主要角色分别训练角色 Lora,保障多人同框镜头的一致性。 实现角色一致性最好的方法是使用 Lora。训练 Lora 时,至少要有 15 到 20 张图片的训练集。对于固定形象,面部五官最重要,其次是体型、服装、配饰等。收集训练集时,收集形象的头部图片很重要。对于现实人物可通过照片训练,虚构角色则要能稳定输出多张不同角度的图片以达到训练集要求。 在预处理生成 tags 打标文件后,对文件中的标签进行优化。保留全部标签适用于训练画风或省事快速训练人物模型,优点是省时省力、过拟合出现情况低,缺点是风格变化大、训练时间长。删除部分特征标签适用于训练特定角色,将特征与 Lora 做绑定,优点是调用方便、更精准还原特征,缺点是容易过拟合、泛化性降低。需要删掉如人物特征 long hair、blue eyes 这类标签,不需要删掉如人物动作 stand、run,人物表情 smile、open mouth,背景 simple background、white background,画幅位置 full body、upper body、close up 这类标签。过拟合会导致画面细节丢失、模糊、发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。
2024-08-12