Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

照片使用mj做风格转化

Answer

以下是利用 Midjourney 进行照片风格转化的详细教程:

一、角色一致性

  1. 得益于 --cref[image url]和 --cw[0~100],Midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。
  2. 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,因为 --cref 会帮完成这件事情。
  3. 风格复制和服装的替换,应当用提示词(prompt)和 --sref[image url]来解决。--sref 代表 style reference,权重参数为 --sw[0~1000],默认值 100,越高越接近参考图像的风格。

二、解决“形似而神不似”问题

  1. 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好。如果用醒图,建议关注【人像->面部重塑->面部->比例】,调整上庭、中庭、下庭。
  2. 对于照片转绘为 Minecraft 这种风格幅度变化很大的情况,如果发现 --sw 风格权重拉满仍复制不了像素小人风格,可能是 --cw 太高,调低 cw 可能成功复制。

三、其他补充

  1. cref 和 sref 还可以同时参考多张 url,但上传同一个人不同角度的照片,容易导致形状畸形。
  2. 如果 MJ 直出的皮肤缺乏质感(过于光滑),可以打开醒图【人像->手动美颜->皮肤肌理】。
  3. 如果想快速调整光源但又不想学 PS,可以试试 Luminar。

四、sref 相关

  1. Midjourney v6 版本提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作。
  2. 使用指令:垫图链接(可选择)+关键词+ “--sref” +图片链接+风格化参数+ “--v 6.0”。指令:url +关键词+ “--sref” + url + “--sw” + “--v 6.0”。--sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为[0,1000]。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。
  3. sref 模仿图片风格,垫图模仿图片结构、元素。

生成 url 时,准备一张照片(可以使用 AI 生成一张人物图像代替真人)和想要的写真风格参考图片。Prompt:垫图 url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism --niji 6 --ar 3:4 --sw 200 --sref url

Content generated by AI large model, please carefully verify (powered by aily)

References

莱森:利用一致性MJ 出海马体写真的教程来啦

Midjourney cref海马体写真教程来啦!10分钟不到出写真~视频在下面(记得mark看文字笔记)超低学习成本,你只要会用任意手机修图软件...就能解决Midjourney Cref角色一致性直出之后的「形似而神不似」的问题。简而言之,文字笔记:得益于--cref[image url]和--cw[0~100],midjourney能够迅速达成角色一致性的目的而无需Lora。其中,cref代表character reference(角色参考);cw则代表character weight(参考权重),默认为100,会参考角色的人脸和服装特点。如果你只想关注人脸,请调低到0。你不需要对角色原图使用/describe来贴近目标生成角色的形象,因为--cref会帮你完成这件事情。于是,风格复制和服装的替换,则应当用提示词(prompt)和--sref[image url]来解决。顾名思义,--sref代表style reference,权重参数为--sw[0~1000],默认值100,越高越接近参考图像的风格举个例子,现在我们要海马体这张图像,我们先用/describe指令反推海马体的提示词,再配合--sref[海马体图像的url],就可以轻松复制图像风格。在回车之前,检查你的提示词,不要出现和sref风格差异过大的prompt;也可以增加一些你之前学过的有用的prompt。Upscale最满意的那一张。接下来解决大家最关心的「形似而神不似」的问题。其实非常简单,这个问题其实是:MJ直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距。

莱森:利用一致性MJ 出海马体写真的教程来啦

如果你不控制变量一个个调整,就会觉得「怎么眼睛嘴巴合在一起就不像我了?」此时,用醒图(英文版叫做hypic)或者美图秀秀等App调整脸部,拖拖修图进度条就好了~完成度就从50%->80%甚至更高!如果你用的是醒图,我建议关注一下【人像->面部重塑->面部->比例】,调整一下上庭、中庭、下庭。其他备注1:在转绘这部分有一个重点案例是照片-> Minecraft这种风格幅度变化很大的。有小伙伴的问题是发现即便--sw风格权重拉满了还是复制不了像素小人风格。经过实验发现:原因是--cw太高。猜想原理:cref提取的人物本身包含了一定程度的风格特性。MJ把这部分特质也当成了「作为你character的一部分」。调低cw发现成功复制,猜想正确。(见视频)其他备注2:cref和sref还可以同时参考多张url,那是不是说我只要上传同一个人不同角度的照片,就更容易直出呢?实验发现不是..用语言描述的感觉是:MJ它会把多张照片理解为多张人脸,直接把形状揉在一起。结果非常容易畸形。补充笔记3:如果你觉得MJ直出的皮肤缺乏质感(过于光滑),那么还是打开醒图【人像->手动美颜->皮肤肌理】就可以了。如果你想快速调整光源但又不想学PS,那就试试Luminar吧。可以直接官方下载和购买完整版,或者如果你是macos订阅了setapp也能使用有基础功能的Luminar版本。视频如下

MJ应用篇 用sref/cref定制你的专属ai写真

[heading1]sref:风格一致[content]Midjourney v6版本提供“风格一致性”的功能,换句话说就是:用户给mj输入一幅图像,mj根据这幅图像的风格进行创作,比如素描风啦、油画风啦等等(此处指路[MJ关键词库魔法咒语](https://qa3dhma45mc.feishu.cn/wiki/TgSrwwey6ipqxJkoaO3cnlIDn0f))[heading2]使用指令[content]指南:垫图链接(可选择)+关键词+ “--sref” +图片链接+风格化参数+ “--v 6.0”指令:url +关键词+ “--sref” + url + “--sw” + “--v 6.0”--sw风格化参数:用于控制整体的风格强度,默认为100,数值范围为[0,1000]参考多张图像风格:url间使用空格隔开,权重代表不同参考风格的权重,如-- sref url A::2 url B::3 url C::5适用模型:V6和Niji V6[heading2]sref、垫图比较[content]sref:模仿图片风格垫图:模仿图片结构、元素原图像and参考风格图像:左(垫图)and右(sref)对比:[heading1]sref实践——定制你的专属ai写真[content]生成url:准备一张你的照片(此处我们使用AI生成一张人物图像代替真人~)和想要的写真风格参考图片~Prompt:垫图url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism --niji 6 --ar 3:4 --sw 200 --sref url

Others are asking
去哪里使用mj
Midjourney 的使用方法如下: 模型个性化: 工作原理:模型个性化会学习您的喜好,以更符合您的口味生成图像。 要求:目前从成对排名中的投票和您喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效。您可以在排名页面查看评分数量,或在 Discord 上输入/info。 使用方法:在提示后输入p,或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”,您可以分享此代码让他人使用应用于该图像的个性化效果。还可以使用s 100 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。 注意事项:个性化目前不是稳定功能,会随您进行更多成对排名而变化,且可能会在接下来几周内推出算法更新。 在 Discord 上的使用: 与 Midjourney Bot 互动:可以在 Discord 上进行,Midjourney 服务器具有不同的界面和频道。 直接消息:与直接消息中的 Midjourney 机器人进行一对一合作,获得更安静的体验。 Midjourney 官方服务器:提供协作和计费/技术支持渠道。 频道列表:包括support 频道获取计费和技术支持,newbies 频道创建图像。 会员名单:Midjourney Bot 使用命令生成图像,版主和指南可帮助解决计费和技术问题。 V6 更新风格参考命令 2.0"sref": 初次更新 1.0 说明:2 月 1 日,MJ 发布首个“一致风格”测试算法,称为“风格参考”,可提供一个或多个描述想要的一致风格的图像的 URL。 如何使用:在提示后面输入sref 及图像的 URL,例如sref url A。系统会将图像 URL 视为“风格参考”,并尝试生成与其风格或美学相匹配的内容,适用于 V6 和 Niji V6(不适用于 V5 等)。 高级设置:可使用多个图像 URL 并设置相对权重,例如sref urlA::2 urlB::3 urlC::5,通过sw 100 设置风格化的总体强度(100 是默认值,0 表示关闭,1000 表示最大值),常规图像提示必须在sref 之前。 注意事项:MJ 可能会在接下来几周内更新此功能,若提示倾向于照片逼真而想要冲突的插图风格,可能仍需在提示中添加文本说明,风格参考对图像提示没有直接影响,仅对至少包含一个文本提示的作业产生影响,计划稍后添加“一致角色”功能,与cref 参数使用方式相同。
2025-02-28
如何用mj有效地画三视图
要有效地用 Midjourney(MJ)画三视图,可以参考以下步骤: 1. 对于核心角色创建,如局长的三视图设计,先明确角色特点,使用 GPT4 生成相关描述。 2. 进行多次尝试和修改,根据团队成员的反馈不断调整。 3. 可以用 MJ 进行垫图生成,在保持原 IP 特点的基础上重新设计。 4. 如果 MJ 生成的效果不理想,可以结合其他工具,如用 Illustrator 手绘,再用 Stable Diffusion(SD)控图,后期利用 AI 工具生成拓展视频。 需要注意的是,MJ 虽然在美术效果和设计能力上有进步,但仍可能存在局限,需要不断尝试和改进。
2025-02-25
Mj
以下是关于 Midjourney(MJ)的相关信息: 1. 文字生成效果测试:MJ 在圣诞节前夕推出新版本 V6,聚焦于文字生成方面。使用英文文本输入,对英语提示词的识别效果变好,将需要生成的文本用双引号“text”包裹,输出的图片中便能出现所要求的文字。但带文字的图片生成仍受文本量、文字在画面中的占比、其他提示词数量和画面复杂程度等因素影响。为探究 V6 的文字生成能力开展了进一步实践测试。 2. 更新风格参考命令 2.0“sref”:2 月 1 日,MJ 发布首个“一致风格”测试算法,称为“风格参考”。工作方式类似于图像提示,在提示后面输入sref 及图像的 URL,可提供一个或多个 URL 并设置相对权重,还可通过sw 100 设置风格化总体强度。此功能适用于 V6 和 Niji V6,不适用于 V5 等。MJ 可能在接下来几周内更新此功能,风格参考对图像提示无直接影响,仅对至少包含一个文本提示的作业产生影响,计划稍后添加“一致角色”功能。 3. 角色一致性功能使用报告:MJ 推出角色一致性功能,以甜茶的图片为例进行测试。使用方式是在提示后输入`cref URL`附上人物图像的 URL,注意要在提示词后面,可使用`cw`修改参考强度,强度 100 是默认值,会使用面部、头发和衣服,强度 0 时只会关注面部。
2025-02-20
mj提示词
以下是关于 MJ 提示词的相关内容: 1. MidJourney 图片生成大师能够根据您的故事内容创作出全面的分镜提示词,包括分镜描述、人物描述、环境描述、氛围描述、灯光描述、色彩描述、构图描述、风格描述等。还会考虑您所使用的相机类型、摄影风格和镜头位置,您分享故事内容和具体需求即可获得专业服务。 2. 在提示词中,文本前置、后置等效果相近,过长的文本难以控制文本出现的位置,建议只要求 AI 生成部分主要文本内容,自行嵌字仍是当前最佳方法。加入引号“”包裹文本能达到 MJ 生成文字的效果,不必要特殊说明“生成一段文本......”等内容。MJ 能够自行判断文本应当存在的位置,会将文本安排在符合逻辑的位置上。后续有机会可进一步测试【局部重绘】能否控制文本在规定位置出现。总结来说,MJ 进行文本输出任务,提示词没有特别固定的语法结构,只需要认识其文本生成的能力范围和使用场景,即可高效应用 V6 模型生成有趣画面内容。 3. 让 Claude 出 MJ 提示词的提示词结构是:让大模型告诉你如何出 MJ 提示词效果会更好+让大模型出提示词+加上一些要求。先让大模型告诉你如何出 MJ 提示词效果会更好,因为大模型输出的过程也是思考的过程,所以对大模型循循善诱效果更好。对于有名的产品,如奔驰 E300L,每个出图的提示词都需包含“奔驰 E300L”。再加上一些要求,比如参数“ar 16:9”是要求 MJ 生成比例图片 16:9 的宽频图片,“q 2”是画面质量最高的参数。出 MJ 提示词还有更方便好用的办法,就是使用 chatgpt 里面的 gpts,如“Mid Journey V6 Prompt Creator”。可以理解为:chatgpt 是手机安卓系统,gpts 就是手机里的 app,不同的 gpts 能实现不同的功能,有的能绘画,有的能帮您总结文献,有的能生成更专业的 MJ 提示词。
2025-01-22
MJ中如何精准控制颜色
以下是关于在 Midjourney 中精准控制颜色的一些方法和相关信息: 1. 在使用 MJ 生成兔子贴纸的过程中,关键词中限制了颜色,生成的图片会一种情绪对应一种颜色。若不想让模型把情绪和颜色做挂钩,同一种情绪可多生成几张不同色系的;若需要挂钩,也可反其道而行之。 2. 进行 SD 上色时,正关键词主要前面添加了增加照片质感常用的+mj 生成线稿的关键词调整(去掉 mj 里线稿的关键词,一开始嘴巴效果不好,添加了张开嘴巴等关键词,颜色都是可以单独调整控制)+风格参数。负关键词看自己的效果添加,添加一切不想要的东西。 3. 在 MJ 的公式方面: 角色人物公式:人物姓名(命名)+描述词(重要描述词和人物特征描述词)+风格+官方命令词。 3D 公式:主体+描述词(重要描述词和物体特征描述词)+风格+灯光+官方命令词。 插画公式:主题描述词语+风格(风格名称或画家)+描述+颜色灯光+官方命令。 特定公式: 连续场景变化公式: 角色/场景公式:上传图片(喂图)+人物描写(融入其他场景需要关键词 white background,结合场景后换成 walking in a futuristic cyberpunk city)+场景风格描写+官方命令。 木偶公式:人物图片+场景+人物+动作+风格+官方命令。 等距粘土公式: 等距+物体+max emoji(表情符号),soft(柔和)lighting soft(柔和光线)pastel colors/pastel background(背景)+3Dicon+clay(粘土)+blender 3d+背景颜色=等距粘土物体。 安子布莱斯娃娃/也可以换成其他知道的娃娃名称+灯光/颜色/背景/材质+clay(粘土)+良奈吉友画风/或者其他名人风格=人。 3D 图标公式(未测试,可用):喂图(1~3 张相似的风格)+描述的 icon(和喂图一致的关键词)+颜色(和喂图颜色一致的)+渲染词+官方命令。 通用公式:角色/物体描述+背景描述+灯光风格+官方命令。
2025-01-17
请问如何学习MJ
以下是关于学习 Midjourney 的相关内容: 1. Midjourney 今天发布了模型个性化 Personalization 或'p'的早期测试版本。其工作原理是:每次写提示时,很多信息是“隐含的”,MJ 的算法通常会用社区的综合偏好填补空白,而模型个性化会学习您的喜好来填补空白。使用模型个性化的要求包括:目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效,可在排名页面查看评分数量或在 Discord 上输入/info。使用方法为:在提示后输入p,或使用提示栏中的设置按钮为所有提示启用个性化功能,启用时会在提示后添加一个“代码”,可分享此代码让他人使用应用于该图像的个性化效果,还可以使用s 100 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。但需注意个性化目前不是稳定功能,会随更多成对排名而变化,且可能会推出算法更新。 2. 训练 Midjourney 的 prompt 流程:可以复制每一步,按照步骤跟 GPT 聊下去。原理是把 MJ 的官网说明书喂给 GPT,让它根据说明了解机制和结构,给出适合的提示词。 3. MJ 很长一段时间内依赖 discord 进行操作,可简单理解为一个微信群/钉钉群,群里有机器人,@它并给一段文字,它就会出图片。也可自己创建群组(服务器),把机器人拉进来对话创作。开始创作时@机器人,MJ 会返回 4 宫格图片。想要放大一张图,点击上面的 U 1——4,MJ 会发大图回来。或者看看其他风格,点击上面的 v 14,MJ 会返回新的 4 宫格。简单来说,步骤包括告诉 MJ 要什么,MJ 给 4 个不同风格小图,放大或再看其他风格,在这些图片基础继续处理。初学可能会有一些想法,比如第一次出图感觉不错,但再改可能难,此时设计师技能上线。以前除了氪金多练习没好办法,现在可以去离谱村进修。
2025-01-09
怎么免费生成一张我需要的场景照片
以下是几种免费生成您需要的场景照片的方法: 1. 利用 MJ 应用: 构思适合画绘本的故事,将其分为多个场景,用包含环境、人物、动作的话描述每个场景。例如:故事名《Lily 的奇妙之旅》,场景 1 为“Lily 来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴。” 为每个场景生成图片时,设置 prompt 包括场景和风格,如“Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,s 400niji 5style expressivear 3:4”。 若只需要场景图像,可使用 mj 的 region vary 工具将人物完全框选,删除人物描述词后重新生成。 2. 悠船的使用: 写好提示词,右上可下载对应图片。 进行参数调整,注意任何点击都会重新生成图片,免费用户可能会提示超出套餐。 常用的图片调整内容包括变化(幅度有细微和强烈之分)、高清(有“直接”和“创意”两种方式)、风格变化(基于生成的图片再创作)、拓展(上下左右拓展图片)、缩放(指镜头)、局部重绘(选择区域要大)。 可以使用垫图、参考风格和提示词配合生成符合要求的图片。 3. Stable Diffusion 的使用: 把觉得好看的照片导进去,如果是从 SD 下载下来的 PNG 格式照片,右边会自动弹出照片的信息,包括正面关键词、负面关键词等,复制这些信息到“文生图”页面的关键词文本框中,点击生成按钮下的第一个小按钮,SD 会自动分配信息,就能得到差不多的照片(前提是有一样的大模型和 Lora)。 如果导入照片后右边没有生成信息,可用“标签器(Tagger)”来生成照片的关键词。
2025-03-07
怎么用AI生成照片?
以下是几种用 AI 生成照片的方法: 1. 使用 Stable Diffusion 模型:它可以根据您输入的文本指令,利用文本中包含的语义信息与图片中包含的像素之间的对应关系生成图片。生成的图片样子完全取决于您输入的提示词,在非排列组合的工作模式下难以出现完全相同的两张输出图片。就像使用画笔,线条、色彩由它提供,而构造出什么样的图画取决于您自己的设计。 2. 利用即梦生成定制化人物肖像写真: 打开即梦官网链接:https://jimeng.jianying.com/aitool/home/?utm_medium=baiduads 。 选择写实肖像。 选择心仪的模板,比如人鱼风,点击“做同款”。 为生成定制肖像,一定要点击“导入参考图”。 点击“人物长相”,注意很多名人的脸无法使用生成。 点立即生成。 查看生成好的照片,若不满意可再点击生成,找出最满意的一张或几张。 生图模型选择最新的 2.0PRO,有照片质感。图片比例可改,有八种比例可选,图片尺寸可自由选择。 3. 使用 Stable Diffusion 的涂鸦功能: 点击空白的地方上传一张纯白的图片作为画纸。 右边的两个小按钮点开可调节画笔的大小和颜色。 在画纸上随便画画。 挑合适的大模型,想要什么画风就挑什么模型。 输入关键词,先输入关于照片质量的词,再告诉它您画的是什么。 把重绘幅度拉到 0.6 0.8,点击生成。
2025-03-07
老照片修复
以下是关于老照片修复的相关内容: ComfyUI 老照片修复 Flux Controlnet Upscale: 以前的高清放大工作流复杂,新模型结合工作流只需十几个基础节点就能实现更好效果。 参数调节方面,一般先确认放大倍数,再根据图片调整 ControlNet 强度。 ControlNetUpscaler 放大模型是 Jasper 研究团队为低分辨率图像开发的,可与 diffusers 库一起使用,采用多种方式对真实图像进行人工退化训练,训练方式类似 Wang,Xintao 等人发表的文献中的方法,遵循 Flux.1dev 模型许可证范畴。 Flux Ultimator 能增加小细节,增强鲜艳色彩,在 0.1 强度设置下有显著效果,能顺利集成到工作流程中,与其他 LORA 结合使用时强度需小于 0.5。 若图片质量细节不够,可选择 T5 Clip 的 fp16 版本。 ControlNet 传递的应是上传的原始图片。 【SD】用 AI 给老照片上色,岁月不改它模样: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 对于复杂的老照片,可在 PS 中进行角度调整和裁切,若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,使用 t2ia_color 模型和简单关键词。 新上线的 controlnet 模型中,Recolor 模型可将黑白图片重新上色。 人物照片还原可选择 realisian 的写实大模型,用提示词描述颜色和内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果更好。
2025-03-06
证件照片生成
以下是关于证件照片生成的相关内容: 可以通过搭建证件照应用页面来实现。先创建应用并设置第一个 div 容器,页面分为上中下三块,顶部为标题,中间有原图、过渡和最终结果,底部为展示区域和表单。还需对容器的高度、宽度、排列方向以及文本组件的字体、颜色、加粗等属性进行设置。图片上传处理方面,介绍了图片组件的本地上传和绑定数据功能,需注意微信截图可能导致上传问题。页面也可分为左右两块,左侧展示区域,右侧为表单,左侧还需嵌套容器处理图片和文字展示。此外,前端页面搭建有一些技巧,如在 DIV10 中选择子容器、复制搭建元素等,包括调整表单组件的尺寸、按钮文案和上传文件类型等设置。业务逻辑流程包括用户上传照片、图片理解、图像生成、智能换脸、背景修改等步骤,各步骤中有参数设置、提示词调整和测试方法。 普通人现在可以利用 AI 生成自己的证件照,无需去影楼拍摄。有能将上传照片生成白底、蓝底和红底的证件照生成工具。
2025-03-06
我需要找到一个方法来把我爷爷迷迷糊糊的老照片上的样子生成样貌特征完全一致的数字人脸,如何可以实现?
以下是一种可能实现将您爷爷老照片生成数字人脸的方法: 1. 利用剪映软件: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,比如“婉婉青春”。 软件会播放数字人的声音,您可判断是否需要,点击右下角“添加数字人”,将其添加到当前视频中。剪映会根据提供的内容生成对应音视频并添加到轨道中。 左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”本地图片,将其添加到视频轨道上(会覆盖数字人)。 拖动背景图的角将其放大到适合尺寸,将数字人拖动到合适位置。 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 完成后点击右上角“导出”按钮导出视频备用。 2. 若希望数字人脸换成特定的面孔,可能需要使用其他工具进行换脸。 3. 对于老照片的处理,还可以启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够的情况下放大图片。 对于复杂的老照片,可先在 ps 里进行角度调整和照片裁切,然后上色。若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定。 可加入第二个 controlnet 来控制颜色,使用 t2ia_color 模型,给出简单的关键词,如“蓝天、绿树、灰石砖”。最后经过脸部修复和放大得到最终效果。
2025-03-06
老旧照片修复
以下是关于用 AI 给老旧照片修复上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,在显存不够的情况下,仅使用分块渲染功能将图片放大到足够倍数。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。 4. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 5. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 6. 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 7. 对于复杂的照片,如人物多、场景复杂、像素低的情况,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色,还可从网上找参考照片让 AI 匹配色调,加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 作者为白马少年,发布时间为 2023 年 9 月 10 日 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 。
2025-03-06
有没有什么AI工具可以把文档性质的内容转化为表格形式
以下是一些可以将文档性质的内容转化为表格形式的 AI 工具和相关方法: 1. GPT4:可以通过指令让其以表格形式输出细节描述,具有打破叙事习惯、便于局部调整和确保内容具体细节等优点。 2. Claude:可用于处理相关内容,但可能存在修改关键情节等问题。 3. Langchain: 对于表格: 方法 1:读入表格 markdown 格式,嵌入 template。 方法 2:直接使用 function call,绕过 langchain 定义数据库读取的方式。 对于文字:包括文字相似度检索过程,如读入文字、进行清洗、句子切分、向量化、计算相似度、取前几的答案等。 此外,还可以参考相关的代码和脚本,如 https://github.com/yuanzhoulvpi2017/DocumentSearch 。同时,https://gitee.com/cyz6668/langchainsimplerag 也对相关内容进行了整理。
2025-03-03
如何通过文字就直接转化成视频
以下是使用 Morphstudio 将文字直接转化为视频的方法: 1. MorphVideoBot 的使用: 命令:/video 示例:/video Hello World!ar 16:9motion 5camera zoom infps 30s 5 2. MorphBot 的使用: 命令:/animate 示例:/animateA cat is walkingar 16:9motion 5camera pan upfps 30 3. 参数说明: ar(仅 MorphVideoBot):设置视频的宽高比,例如 16:9、4:3、1:1、3:4、9:16 等。 motion:调整视频中运动的强度。值越低,运动越微妙;值越高,运动越夸张。 camera:控制相机运动,包括缩放(camera zoom in/out)、平移(camera pan up/down/left/right)、旋转(camera rotate clockwise/counterclockwise 或 camera rotate cw/ccw)和静态(camera static)。 fps:设置视频的帧率,默认是每秒 24 帧。 s(仅 MorphVideoBot):设置视频的时长(秒)。 提示:更详细和描述性的提示可能会使生成的视频效果更好。您可以自由尝试不同的设置以获得期望的结果。
2025-02-07
有没有什么网站可以免费将低精度的图片转化为高清图片
以下是一些可以免费将低精度图片转化为高清图片的网站和相关信息: Stability AI 推出的基于 Discord 的媒体生成和编辑工具: :可将任何低分辨率、低质量的图像转换为 4k 杰作,价格为 25 积分。 :简单、低成本的分辨率提升,价格为 0.2 积分。 图像高清修复放大的流程分为三部分: 1. 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,分辨率越大处理时间越长。 2. 图像高清修复:把原本模糊的图片修复,并进行 2 倍放大。Checkpoint 大模型使用 Iceclear/StableSR,搭配 Stable SR Upscaler 模型能最大程度修复图像,推理图片每个噪点以还原图像。提示词部分应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear);反向:3d,cartoon,anime,sketches,(worst quality),(low quality)(杰作),(最高品质),(逼真的),(非常清晰);3D,卡通,动漫,素描,(最差质量),(低质量)。全程采取两次高清修复,第一次修复原始图像分辨率并且放大,若分辨率不够继续下一步。 3. 图像高清放大:针对第一次放大修复后的图像进行二次修复,realisticVision 底膜最合适,使用提示词反推 node 对图像进行画面提示词提取,搭配 tile ControlNet 提升画面细节感,然后用合适的高清放大模型进行二次放大。
2025-01-16
你可以把PDF转化为word吗
以下是将 PDF 转换为 Word 的几种方法: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 此外,如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。 内容由 AI 大模型生成,请仔细甄别。
2025-01-03
能直接把中文word转化成英文word的ai
目前暂时没有直接将中文 Word 文档转化为英文 Word 文档的通用 AI 工具。但有一些在线翻译平台和软件可以帮助您实现这个需求,例如谷歌翻译、百度翻译等。您可以将中文 Word 中的内容复制粘贴到这些翻译工具中进行翻译,然后再整理到新的 Word 文档中。
2024-12-28
有哪些AI可以帮我将视频内容转化成文字
以下是一些可以帮助您将视频内容转化成文字的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果您熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的相关网站可以查看: 另外,如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 根据视频脚本生成短视频的 AI 工具有: 1. ChatGPT + 剪映:ChatGPT 可以生成视频小说脚本,剪映则可以根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 将帮助生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助您快速生成吸引人的视频内容。请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-25
手绘风格的提示词
以下是关于手绘风格提示词的相关内容: 给自己做一个卡通头像: 1. 简单提示词:在聊天窗口输入/imainge 找到/imagine prompt,然后把刚才的链接放进去,然后空格。加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 2. 设置参数: iw 1.5:设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间的某个值并调整。 s 500:设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力。可设置为 0 1000 间任意整数。 v 5:指用 midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses:指不戴眼镜,若不喜欢戴眼镜的图片,可以加上这个设置。 3. 效果示例:完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的图片不满意,可以选择调整s 和iw 的值来进行多次尝试。 AI 绘画常用提示词: 1. 风格提示词: pointillism 点彩派 Claude Monet 克劳德莫奈 quilted art 桁缝艺术 partial anatomy 局部解剖 color ink on paper 彩墨纸本 doodle 涂鸦 Voynich manuscript 伏尼契手稿 book page 书页 realistic 真实的 3D 3D 风格 sophisticated 复杂的 photoreal 真实感 national geographic 国家地理 hyperrealism 超写实主义 cinematic 电影股的 architectural sketching 建筑素描 symmetrical portrait 对称肖像 clear facial features 清晰的面部特征 interior design 室内设计 weapon design 武器设计 subsurface scattering 次表面散射 Game scene graph 游戏场景图 character concept art 角色概念艺术 风格提示词|STYLE PROMPTS: Gusty:强劲和充满活力的音乐风格,通常具有风起云涌和激烈的特质。典型使用于表现强劲和充满活力情感的音乐作品,示例为 Led Zeppelin 的《Immigrant Song》,关联流派为 Rock,Hard Rock,Metal。 Halcyon:宁静和美好的音乐风格,通常具有平静和祥和的特质。典型使用于表现宁静和美好情感的音乐作品,示例为 Enya 的《Only Time》,关联流派为 New Age,Ambient,Folk。 Hammering:敲击和强烈节奏的音乐风格,通常具有强烈和激烈的特质。典型使用于表现强烈节奏和激烈情感的音乐作品,示例为 Metallica 的《Master of Puppets》,关联流派为 Metal,Rock,Industrial。 Handcrafted:精心制作和手工艺的音乐风格,通常具有细腻和独特的特质。典型使用于表现精心制作和独特情感的音乐作品,示例为 Fleet Foxes 的《White Winter Hymnal》,关联流派为 Folk,Indie,Acoustic。
2025-03-07
生成动画的各种设计师风格有哪些?
以下是一些常见的生成动画的设计师风格: 1. 赛博朋克风:关键词为“A dog wearing holographic cyberpunk clothing::0.6,cartoon,disney style,surrounded by neonlit cityscape reflections,vray render,ray tracing,subsurface scattering”。 2. 皮克斯动画:关键词为“At night,a little girl is running in the forest,surrounded by fireflies,the moonlight is very bright,carrying a lantern,Chinese style,c4d,octane render,atmosphere,highquality pictures,3d art,animation lighting,Pixar trend”。 3. 某设计师风格的场景原画:关键词为“environment design by Adriaen van de VenneAlien,planets,deserts,giant technological structures,a wandererar 16:9”。 4. 卡通头像:关键词为“喂图+cartoon boy,PIXAR STYLE”。 5. 宫崎骏风格插画:关键词为“studio Ghibli,Blueberry,flowerRich details,girl and boy”。 6. 乐高风格场景:关键词为“chibi boy made of Lego,domsday survival,8k,HD,cinematography,photorealistic,epic,compositio”。 7. 微缩场景:关键词为“Tiny cute laboratory,3d blender render,soft smooth lighting,science and technology background,100mm lens,4k UHD,isometric,tiltshiftar 3:4”或“Tiny cute Forest laboratory,3d blender render,soft smooth lighting,rain background,100mm lens,4k UHD,isometric,tiltshiftar 3:4”。 此外,还有 Yoshitaka Amano 风格,包括 V6 出图、Niji 6 出图和 V6 舞台设计等。Ideogram 2.0 作为工具,具有精准文本生成、多样化风格、创意控制、开发者友好、支持手机端和免费使用额度等特点。
2025-03-07
生成特定风格的图片用什么工具
生成特定风格的图片可以使用以下工具: 1. 悠船: 进入官网,可以选择桌面端下载或浏览器使用。为方便起见,可选择浏览器使用。首次使用需注册,选择企业用户注册,输入名称和手机号即可注册成功(目前无需填写企业信息)。 注册完成后进入操作页面,点击开始想象按钮,将生成的提示词粘贴在下方,直接点击回车,耐心等待几十秒即可生成 4 张图片,可选择喜欢的图片点击进入进行对应操作。 若想生成不同尺寸风格的图片,可对创作参数进行调整: 风格化:数字越大越艺术,但并非越大越好,取决于创作,人像不用调整过高。 怪异化:数字越大越奇怪,可不碰。 多样化:数字越大结果越意想不到,越低越接近提示词。建议新手一开始不用怪异和多样化,可做实验测试。 模式:默认标准,朴实 raw 会让图片质感更好,依个人喜爱选择。 版本:默认最高 V6,二次元可选 NIJI。 生成图片的速度:默认快速,越快对支付套餐要求越高。 2. 吐司: 在首页有对话生图对话框,输入文字描述即可生成图片,不满意可通过对话让其修改。 Flex 模型对语义理解强,不同模型生成图片的积分消耗不同,生成的图片效果受多种因素影响。 可通过电图基于图片做延展,生图时能调整尺寸、生成数量等参数,高清修复会消耗较多算力建议先出小图。 国外模型对中式水墨风等特定风格的适配可能存在不足,可通过训练 Lora 模型改善。 新用户通过特定链接注册或填写邀请码 BMSN,7 天内可额外获得 100 算力。
2025-03-04
如果我想基于一条视频的视频风格,结合我自己的视频内容创作需求,生成一条新的demo视频,怎么使用AI更加高效和达到我想要的效果?
要基于一条视频的风格结合自己的需求生成新的 demo 视频,您可以参考以下步骤,更高效地达到想要的效果: 1. 准备内容 先准备一段视频中播放的内容文字,比如产品介绍、课程讲解、游戏攻略等。您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容,这将为数字人提供语音播放的内容以及生成与文字内容相对应的口型。 另外,如果您想用 AI 把小说做成视频,可以按照以下流程: 1. 小说内容分析 使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述 根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成 使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作 将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作 利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成 使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理 对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整 观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享 完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-04
我准备装修,地板是冷灰色,想装修成中古风的风格,需要出设计图,有什么AI工具推荐
以下是一些可以辅助您生成中古风装修设计 CAD 图的 AI 工具: 1. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,涵盖图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:这是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,有助于创建复杂的几何形状和优化设计。 3. nTopology:一款基于 AI 的设计软件,能够帮助创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:这是一款基于 AI 的 CAD 软件,可根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,能根据用户输入的设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后再尝试使用这些 AI 工具来提高设计效率。以上内容由 AI 大模型生成,请仔细甄别。
2025-02-28
文章风格提示词逆向工程
文章风格提示词逆向工程是指通过分析和检查现有文章,了解其设计和创作方式,从而生成更优提示词的过程。 利用 ChatGPT 进行逆向工程的步骤包括: 1. 利用 ChatGPT 对指定文章进行改写。 2. 对改写后的版本进行原创性检验。 3. 根据检验结果,指导 ChatGPT 进行进一步优化。 4. 重复上述过程,直至满足高度原创的标准。 5. 采用逆向工程的方法,梳理 ChatGPT 的改写策略。 6. 整合这些策略,形成一套提高文章原创性的高效提示词。 在进行逆向提示词工程时,需要注意以下几点: 1. 检测原创度的大多是机器,不能仅凭肉眼判断改写效果。 2. 对相同提示词多次改写或从元提示词中挑选部分深入改写,可有效提升文章质量。 3. 逆向提示词要提炼文章的语气、写作风格、用词、句式等各种写作要素,包括修辞手法、文章布局、论点和证据、段落长度和句子节奏等多个维度。 4. 不同领域的逆向分析需要相应的专业知识,如文学作品和编程领域。 这种逆向工程方法在营销、商业分析、心理学等领域均适用,能够在智能写作等领域持续产生可商用的提示词。但也需注意,掌握逆向分析技术可能导致一些 AI 创业公司被替代。
2025-02-25