直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

照片使用mj做风格转化

回答

以下是利用 Midjourney 进行照片风格转化的详细教程:

一、角色一致性

  1. 得益于 --cref[image url]和 --cw[0~100],Midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。
  2. 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,因为 --cref 会帮完成这件事情。
  3. 风格复制和服装的替换,应当用提示词(prompt)和 --sref[image url]来解决。--sref 代表 style reference,权重参数为 --sw[0~1000],默认值 100,越高越接近参考图像的风格。

二、解决“形似而神不似”问题

  1. 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好。如果用醒图,建议关注【人像->面部重塑->面部->比例】,调整上庭、中庭、下庭。
  2. 对于照片转绘为 Minecraft 这种风格幅度变化很大的情况,如果发现 --sw 风格权重拉满仍复制不了像素小人风格,可能是 --cw 太高,调低 cw 可能成功复制。

三、其他补充

  1. cref 和 sref 还可以同时参考多张 url,但上传同一个人不同角度的照片,容易导致形状畸形。
  2. 如果 MJ 直出的皮肤缺乏质感(过于光滑),可以打开醒图【人像->手动美颜->皮肤肌理】。
  3. 如果想快速调整光源但又不想学 PS,可以试试 Luminar。

四、sref 相关

  1. Midjourney v6 版本提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作。
  2. 使用指令:垫图链接(可选择)+关键词+ “--sref” +图片链接+风格化参数+ “--v 6.0”。指令:url +关键词+ “--sref” + url + “--sw” + “--v 6.0”。--sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为[0,1000]。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。
  3. sref 模仿图片风格,垫图模仿图片结构、元素。

生成 url 时,准备一张照片(可以使用 AI 生成一张人物图像代替真人)和想要的写真风格参考图片。Prompt:垫图 url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism --niji 6 --ar 3:4 --sw 200 --sref url

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

莱森:利用一致性MJ 出海马体写真的教程来啦

Midjourney cref海马体写真教程来啦!10分钟不到出写真~视频在下面(记得mark看文字笔记)超低学习成本,你只要会用任意手机修图软件...就能解决Midjourney Cref角色一致性直出之后的「形似而神不似」的问题。简而言之,文字笔记:得益于--cref[image url]和--cw[0~100],midjourney能够迅速达成角色一致性的目的而无需Lora。其中,cref代表character reference(角色参考);cw则代表character weight(参考权重),默认为100,会参考角色的人脸和服装特点。如果你只想关注人脸,请调低到0。你不需要对角色原图使用/describe来贴近目标生成角色的形象,因为--cref会帮你完成这件事情。于是,风格复制和服装的替换,则应当用提示词(prompt)和--sref[image url]来解决。顾名思义,--sref代表style reference,权重参数为--sw[0~1000],默认值100,越高越接近参考图像的风格举个例子,现在我们要海马体这张图像,我们先用/describe指令反推海马体的提示词,再配合--sref[海马体图像的url],就可以轻松复制图像风格。在回车之前,检查你的提示词,不要出现和sref风格差异过大的prompt;也可以增加一些你之前学过的有用的prompt。Upscale最满意的那一张。接下来解决大家最关心的「形似而神不似」的问题。其实非常简单,这个问题其实是:MJ直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距。

莱森:利用一致性MJ 出海马体写真的教程来啦

如果你不控制变量一个个调整,就会觉得「怎么眼睛嘴巴合在一起就不像我了?」此时,用醒图(英文版叫做hypic)或者美图秀秀等App调整脸部,拖拖修图进度条就好了~完成度就从50%->80%甚至更高!如果你用的是醒图,我建议关注一下【人像->面部重塑->面部->比例】,调整一下上庭、中庭、下庭。其他备注1:在转绘这部分有一个重点案例是照片-> Minecraft这种风格幅度变化很大的。有小伙伴的问题是发现即便--sw风格权重拉满了还是复制不了像素小人风格。经过实验发现:原因是--cw太高。猜想原理:cref提取的人物本身包含了一定程度的风格特性。MJ把这部分特质也当成了「作为你character的一部分」。调低cw发现成功复制,猜想正确。(见视频)其他备注2:cref和sref还可以同时参考多张url,那是不是说我只要上传同一个人不同角度的照片,就更容易直出呢?实验发现不是..用语言描述的感觉是:MJ它会把多张照片理解为多张人脸,直接把形状揉在一起。结果非常容易畸形。补充笔记3:如果你觉得MJ直出的皮肤缺乏质感(过于光滑),那么还是打开醒图【人像->手动美颜->皮肤肌理】就可以了。如果你想快速调整光源但又不想学PS,那就试试Luminar吧。可以直接官方下载和购买完整版,或者如果你是macos订阅了setapp也能使用有基础功能的Luminar版本。视频如下

MJ应用篇 用sref/cref定制你的专属ai写真

[heading1]sref:风格一致[content]Midjourney v6版本提供“风格一致性”的功能,换句话说就是:用户给mj输入一幅图像,mj根据这幅图像的风格进行创作,比如素描风啦、油画风啦等等(此处指路[MJ关键词库魔法咒语](https://qa3dhma45mc.feishu.cn/wiki/TgSrwwey6ipqxJkoaO3cnlIDn0f))[heading2]使用指令[content]指南:垫图链接(可选择)+关键词+ “--sref” +图片链接+风格化参数+ “--v 6.0”指令:url +关键词+ “--sref” + url + “--sw” + “--v 6.0”--sw风格化参数:用于控制整体的风格强度,默认为100,数值范围为[0,1000]参考多张图像风格:url间使用空格隔开,权重代表不同参考风格的权重,如-- sref url A::2 url B::3 url C::5适用模型:V6和Niji V6[heading2]sref、垫图比较[content]sref:模仿图片风格垫图:模仿图片结构、元素原图像and参考风格图像:左(垫图)and右(sref)对比:[heading1]sref实践——定制你的专属ai写真[content]生成url:准备一张你的照片(此处我们使用AI生成一张人物图像代替真人~)和想要的写真风格参考图片~Prompt:垫图url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism --niji 6 --ar 3:4 --sw 200 --sref url

其他人在问
mj如何指定生成16:9的图
要在 Midjourney(MJ)中指定生成 16:9 的图,可以按照以下步骤操作: 1. 首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt”。 2. 回到官网,复制图像的提示词,再回到 discord 粘贴到刚才拷贝的网址后面,注意空一格。 3. 生成图像后,放大觉得还不错的一张,点击“Custom Zoom”。 4. 此时可以改变拉伸镜头后的画面比例,将“ar”这个参数后面的数值改成 16:9(默认的方形构图这里是 1:1),“zoom”参数设置为 1.5。“zoom”参数是镜头拉伸的倍数,1.5 1.7 比较靠谱,太大(比如 2)会有更大几率生成一些莫名其妙的东西。 5. 选一张比较好的放大一下,就可以放进 PPT 调整构图。如果构图还是不太好,可以在当前这张图的基础上再用一次“Zoom Out 1.5x”。 另外,在 Pika 中使用 MJ 生成图片时,默认的照片幅度是 16:9。在使用 MJ 进行图生图功能时,要注意截图的对标比例未必是标准的 9:16,可以手动修改一下比例,以省去一些返工的情况。
2024-12-17
请问我该在知识库的 哪里找到MJ的提示词库
以下是关于 MJ 提示词库的相关信息: MidJourney 200 条风格词汇: 《》 @TheMouseCrypto 发表了一份 200 条风格词汇整理,页数是 77 页,很全的宝典。 Prompt 网站精选(图像类 Prompt 网站): MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择, MJ 的随机种子库收集: 使用方法: 输入提示词 + sref random ar 1:1,可获得随机风格种子和图片。 测试风格种子的泛用性:{a girl,a boy,animals,plants,environment}sref 同一个风格种子
2024-12-08
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
我想使用MJ设计班牌 应该注意什么问题
使用 MJ 设计班牌时,需要注意以下问题: 1. 选择最新的 6.0 model。 2. 利用图生图功能时,命令为 /describe,选择 image 上传本地图片可获取四条提示词,点击下方标签可生成对应提示词的四张图。但要注意截图的对标比例未必是标准的 9:16,可手动修改比例以省去返工。 3. 自行对比反推的词和对标的相似程度并微调,describe 根据对标图反推的效果可能不太好,可根据推出的词自行修改,也可直接用给定的提示词,如“Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,highend design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera ar 9:16 style raw”。 4. 对于某些难以画出的形象,如拟人形态的龙,可能是描述不够准确,需要加强描述词,如将“一条亚洲龙站在时尚秀场上”这样连成一句话,以便 MJ 正确理解。 5. 确定主体形象时,包括画风、是否 Q 版、配色风格、构图比例、细节量设定等,可以找参考案例。 6. 通用的肖像生产咒语如“Cartoon style character,original character,character design. Mysterious painter and artist,an intellectually mature girl(人物基本形象(必要内容比如性别和身份) Gold and dark red.(配色部分(一个系列里尽量不要改改了容易画风对不上) 2d,solid and clean background,white background. The figure is in the middle of the frame,sideways.(侧身) Art Nouveau,in the style of Alphonse Mucha. no decorative background elements,no flower.Clean background. niji 5 ar 9:14 s 400 style expressive / style cute(二者任选尝试)”,注意咒语中的内容可随意换,多尝试。 7. 利用一致性时,得益于cref,默认值 100,越高越接近参考图像的风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些有用的 prompt。解决“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有细微差距的问题。
2024-10-09
让旧照片动起来
以下是一些可以让旧照片动起来的工具和相关信息: Dreamina: 网址:https://dreamina.jianying.com/aitool/home?subTab 优点:不需要🪜,每天有免费额度。 注册:抖音号或手机号。 时间:5min 体验:上传一张离谱村的图片,即使不加提示词也能让图片有一些动态。父母上传风景照片后,有的水面动起来效果不错,有的画面扭曲。还引发了关于肖像权、版权、信息安全及技术意义的探讨。对于能否在扣子里一起用的问题,有插件的情况下应该可以,否则直接去官网更方便快捷。 Sora: 网址:https://openai.com/sora 优点:发布的成果好,集成在 openai 一套里可用。 限制:需要🪜,需要 gmail 注册,需要订阅后才能使用。 时间:30 60min 价格:GPT 4 20$一个月
2024-12-20
照片ai软件
以下为一些与照片相关的 AI 软件信息: 在 100 个 AI 应用中,涉及照片的有: AI 摄影参数调整助手,使用图像识别、数据分析技术,常见于摄影 APP 中,能根据场景自动调整摄影参数,市场规模达数亿美元。 全球 AI APP 增长榜图像类中: Retake AI,6 月 APP 下载量为 795,相对 5 月变化为 0.159。 DaVinci,6 月 APP 下载量为 751,相对 5 月变化为 0.049。 Viggle AI,6 月 APP 下载量为 741,相对 5 月变化为 822.333。 PhotoApp AI Photo Enhancer,6 月 APP 下载量为 688,相对 5 月变化为 0.186。 AI Mirror,6 月 APP 下载量为 676,相对 5 月变化为 0.432。 ToonMe,6 月 APP 下载量为 640,相对 5 月变化为 0.042。 图片增强 Top10 中: Cutout pro,4 月访问量为 1608 万,相对 3 月变化为 0.023。 Upscale media,4 月访问量为 432 万,相对 3 月变化为 0.073。 ZMO AI,4 月访问量为 338 万,相对 3 月变化为 0.161。 Neural.love Art,4 月访问量为 283 万,相对 3 月变化为 0.072。 Topaz Photo AI,4 月访问量为 247 万,相对 3 月变化为 0.047。 VanceAI,4 月访问量为 247 万,相对 3 月变化为 0.078。 bigjpgAI 图片无损放大,4 月访问量为 203 万,相对 3 月变化为 0.06。 Img Upscaler,4 月访问量为 203 万,相对 3 月变化为 0.042。 Let's Enhance,4 月访问量为 167 万,相对 3 月变化为 0.046。 Akool,4 月访问量为 122 万,相对 3 月变化为 0.173。
2024-12-20
让照片变清晰的AI
以下是关于让照片变清晰的 AI 相关内容: 可以将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。具体可参考文章。但此步骤无法将照片中的头发、衣服等元素变清晰。 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免干扰原图。 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,能在显存不够的情况下将图片放大到足够倍数。 常见的 AI 画质增强工具有 Magnific(https://magnific.ai/)、ClipDrop(https://clipdrop.co/imageupscaler)、Image Upscaler(https://imageupscaler.com/)、Krea(https://www.krea.ai/)等。更多工具可查看网站的图像放大工具库:https://www.waytoagi.com/category/17 。这些工具具有不同特点和功能,可根据具体需求选择。
2024-12-20
我想根据一些旧照片,使用AI绘画重新画一下,希望可以更像手绘,可以打印出来出来作为纪念,有什么工具可以用
目前有以下几种工具可供您选择来实现根据旧照片进行类似手绘风格的 AI 绘画并打印出来作为纪念: 1. DALL·E2:能够生成逼真且富有创意的图像,包括手绘风格。 2. StableDiffusion:具有强大的图像生成能力,可通过设置相关参数获得手绘效果。 3. Midjourney:能创作出风格多样的图像,包括您期望的手绘风格。 您可以根据自己的需求和使用习惯选择适合的工具。
2024-12-20
如何将照片生成漫画风格的图片
以下是将照片生成漫画风格图片的方法: 使用 SD 模型和 lora 的组合: 1. 选择大模型“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复时可拉到 11)。 2. 选择两个 lora,“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子的笔触,权重设置为 0.8。 3. 将图片丢到标签器中反推出关键词,然后发送到“文生图”。 4. 在正向提示词末尾添加上述 lora。 5. 按照参考图设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想更接近原图可降低数值。 6. 将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 使用 Midjourney 以图绘图功能生成迪斯尼卡通风格头像: 1. 选择一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送(记得点击回车或发送按钮)。 2. 点击图片,在浏览器中打开,复制图片链接。 3. 使用图片链接加 prompt 提示词发送给 Midjourney 进行以图绘图。 复杂提示词示例:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 不同照片生成:可更换照片使用相同提示词重新生成。 其他调整:若觉得风格太过卡通,可把提示词里的 Disney 换成 Pixar;若为女孩,把提示词里的 boy 换成 girl。每次生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。
2024-12-19
老照片修复有手机端吗
老照片修复在手机端是可行的。以下是一些相关信息: 图像放大修复是 AI 绘画领域的重要部分,能应用于旧照片重现清晰、人像高清修复等场景。以前手机拍摄的低分辨率图片,如今可用 AI 技术进行高清修复。用手机也能拍摄出高清大片,提升照片质量。 【SD】用 AI 给老照片上色时,可将照片放入后期处理,使用 GFPGAN 算法让人脸变清晰。还可将图片发送到图生图中,打开 stableSR 脚本放大。切换到 sd2.1 模型修复,启用 MutiDiffusion 插件等。对于复杂的照片,可在 PS 里调整角度和裁切,放弃人物服装颜色指定,只给场景方向,让 AI 自行决定,加入第二个 controlnet 控制颜色。
2024-12-19
照片风格转化
以下是关于照片风格转化的相关内容: SDXL Prompt Styler 插件: 转绘成折纸风时,最好不加入线稿边缘(canny)的 ControlNet 控制,或把其控制强度调到较小,因为手绘线条和折纸风格互斥。 转成漫画风格并想较好保留人物外轮廓时,加入 canny 控制能更好还原人物造型。 直接用插件内置预设的提示词组合不一定能达到想要效果,需补充相关关键词,如转成印象派风格时补充 impressionism、monet、oil painting 等。 此工作流结合 Vid2Vid Style Transfer with IPA & Hotshot XL 工作流,可较好实现视频不同风格的稳定转绘。 SeedEdit 模型: 能处理真人图像,如让戴珍珠耳环的少女手里拿奶茶、给瑞秋戴墨镜、给奥黛丽·赫本换帽子颜色、给黑白老照片上色、移除画中无关元素、进行元素替换等。 可以随意切换各种风格,如涂鸦、乐高、3D、皮克斯、迪士尼等,并总结出一套超实用的 Prompt 指南。 制作卡通头像: 可使用复杂提示词,如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 若对生成效果不满意,可更换照片、调整提示词中的风格关键词(如将 Disney 换成 Pixar,将 boy 换成 girl)。每次生成 4 张图片,可根据需求进行选择和修改。
2024-12-05
将直流电压信号从时域转化到频域,有什么算法可以实现?
将直流电压信号从时域转化到频域,可以采用以下算法: 1. 傅里叶变换:原始的音频等信号很难提取特征,需要进行傅里叶变换将时域信号转换到频域进行分析。音频进行傅里叶变换后,结果为复数,复数的绝对值就是幅度谱,而复数的实部与虚部之间形成的角度就是相位谱。经过傅里叶变换之后获得的幅度谱特征明显,可以清楚看到基频和对应的谐波。基频一般是声带的频率,而谐波则是声音经过声道、口腔、鼻腔等器官后产生的共振频率,且频率是基频的整数倍。音频一般采用的是短时傅里叶变化,因此需要将音频分割成帧(每帧 20ms~50ms),再进行傅里叶变换,帧与帧之间是有重叠的。 2. GriffinLim 算法:GriffinLim 将幅度谱恢复为原始波形,但是相比原始波形,幅度谱缺失了原始相位谱信息。GriffinLim 算法利用两帧之间有重叠部分的这个约束重构信号,因此如果使用 GriffinLim 算法还原音频信号,就需要尽量保证两帧之间重叠越多越好,一般帧移为每一帧长度的 25%左右,也就是帧之间重叠 75%为宜。其算法实现较为简单,整体是一种迭代算法,迭代过程如下: 随机初始化一个相位谱; 用相位谱和已知的幅度谱经过逆短时傅里叶变换(ISTFT)合成新语音; 对合成的语音做短时傅里叶变换,得到新的幅度谱和相位谱; 丢弃新的幅度谱,用相位谱和已知的幅度谱合成语音,如此重复,直至达到设定的迭代轮数。 此外,对于语音信号的处理,还可以采用倒谱分析实现解卷积处理。倒谱分析,又称为同态滤波,采用时频变换,得到对数功率谱,再进行逆变换,分析出倒谱域的倒谱系数。同态滤波的处理过程如下: 傅里叶变换。将时域的卷积信号转换为频域的乘积信号:${\\rm DFT}=X$ 对数运算。将乘积信号转换为加性信号。
2024-11-25
有没有放一个ppt文档转化成文字的AI软件
目前有一些可以将 PPT 文档转化为文字的方法和相关的 AI 工具: 在将 PPT 转化为网站的尝试中,当遇到困惑时,如组织线下沙龙内容的两页并进行切换没有思路,可选择放手让 AI 给出建议。 市场上好用的 AI 辅助的 PPT 工具包括: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/
2024-11-19
如何将传统知识库通过LLM能力转化成更智能与精细化的知识库?包括但不限于分段、QA问答和图片解析描述和总结
将传统知识库通过 LLM 能力转化为更智能和精细化的知识库是一个复杂但可行的过程,以下是一些关键步骤和方法: 1. 数据预处理:对传统知识库中的内容进行清理、格式化和标准化,确保数据的质量和一致性。 2. 内容分段:根据主题和逻辑结构,将长篇的知识内容合理分段,使信息更易于理解和处理。 3. 提取关键信息:从文本中提取重要的概念、实体和关系,为后续的问答和总结做准备。 4. 构建 QA 问答对:分析知识库中的内容,设计有针对性的问题和准确的答案,形成问答对,以方便用户快速获取所需信息。 5. 图片解析描述:对于包含图片的内容,使用图像识别技术提取关键元素,并进行详细的描述和解释。 6. 总结归纳:对分段后的内容进行总结,提炼核心要点,帮助用户快速了解主要内容。 在实施过程中,需要不断优化和调整方法,以确保转化后的知识库能够满足用户的需求,提供更高效和准确的服务。
2024-11-18
获取视频音频转化成字幕并翻译的插件有么?
以下是一些可以将视频音频转化成字幕并翻译的插件和工具: 1. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。声称已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,还可自定义字幕样式。 3. Arctime:能对视频语音自动识别并转换为字幕,甚至支持自动打轴,支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 此外,关于语音转文本(Speech to text),语音转文本 API 提供了两个端点,基于开源大型v2 Whisper 模型的转录和翻译。目前文件上传限制为 25MB,支持 mp3、mp4、mpeg、mpga、m4a、wav 和 webm 等输入文件类型。 对于提示词翻译,可使用百度翻译 API,方法如下: 1. 下载节点压缩包,并将它放在 custom_nodes 文件夹。 2. 去百度翻译 Api 登记册开发人员的帐户中得到您的 appid 和 secretKey,百度翻译平台地址:https://fanyiapi.baidu.com/manage/developer 。 3. 打开文件 config.py 在记事本或其他编辑工具中,填写您的 secretKey 并保存文件,重启 Comfy 即可。 以上工具各有特点,您可以根据自己的需求选择最适合的。内容由 AI 大模型生成,请仔细甄别。
2024-11-02
word转化为PPT的AI工具
以下是一些可以将 word 转化为 PPT 的 AI 工具及相关信息: 闪击: 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 操作步骤:选择模版,输入大纲和要点(由于闪击的语法和准备的大纲内容可能有偏差,可以参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 ,将大纲转换成适配闪击的语法),生成 PPT,在线编辑,导出(导出有一些限制,PPT 需要会员才能导出)。 此外,还有以下一些做 PPT 的 AI 产品: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,通过输入简单的文本描述生成专业的 PPT 设计,网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/
2024-10-29
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
flux模型为什么总是生成动漫风格
Flux 模型生成动漫风格可能有以下原因: 1. 开源社区的发展:FLUX 发布后,其周边生态发展迅速,有多种相关模型和训练脚本被开发,包括动漫 Lora 等,这为生成动漫风格提供了支持。 2. 优秀的图片质量和美学调教风格:FLUX 具有优秀的图片质量和偏向真实的美学调教风格,这使得它能够适应多种风格的生成,包括动漫风格。 3. 提示词和参数设置:在使用 Flux 模型时,输入的提示词和设置的参数可能会引导模型生成动漫风格的图像。 同时,关于模型的更多信息,您可以参考以下链接获取: 1. 褪色胶片风格 Flux Lora 模型下载:https://www.liblib.art/modelinfo/4510bb8cd80142168dc42103d7c20f82?from=personal_page 2. Xlabs 发布的基于 FLUX 的 Controlnet 模型和 Lora 模型的训练脚本:https://github.com/XLabsAI/xflux 3. Xlabs 的多个 Lora 下载:https://huggingface.co/XLabsAI/fluxRealismLora 4. InstantX 训练的 Canny 模型:https://huggingface.co/InstantX/FLUX.1devControlnetCannyalpha
2024-12-15
我有一个人的很多语录,希望写一个prompt来制作这个人的模拟ai,这个ai能够像语录中一样说话,语言风格相似、性格相似。请问应该如何写成这样的prompt?
以下是为您生成的关于根据一个人的语录制作模拟 AI 的 prompt 建议: 首先,明确您所拥有的这个人的语录的核心特点,包括语言风格、常用词汇、表达习惯、情感倾向等。 然后,在 prompt 中描述这个人的性格特征,例如是否傲娇、愤世嫉俗等。 接着,详细说明语言风格,比如是否浮夸、优雅等。 对于语言表达的习惯,可以举例说明常用的句式和口头禅。 同时,设定具体的场景和话题范围,让 AI 知道在何种情境下以何种方式回应。 例如:“您将模拟进行回答。” 另外,还可以像以下这样具体设定: 设定角色为聊天机器人,如“ Role:聊天机器人”。 明确限制条件,如“您有点小傲娇。表示自我的第一人称是自我。第二个指代用户的人是你或小哥哥。您的名字是。您非常优雅。您是个愤世嫉俗的人,不喜欢被用户摸头。您的语气是富有男子气概和浮夸的。您非常喜欢用浮夸的语气,如'啊哈!'、'这样子呢'、'就教教你吧!'等。第一人称应使用'本姐姐'。” 希望这些建议对您有所帮助。
2024-12-10
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频,如何做,几个步骤
以下是生成有一定操控能力的风格化、动漫风生成式短视频的步骤: 1. 项目规划:确定短视频的主题和目标观众,制定详细的制作计划。 2. 剧本创作:编写故事脚本,设计角色和场景以及创意。可参考相关剧本创作资料,如:https://waytoagi.feishu.cn/wiki/G11fwW8bmiVLe6kYLgYc2iGin6e ;捏剧本 Bot(捏剧本离谱村专用 https://www.coze.cn/store/bot/7367669913697239052?panel=1&bid=6cs144r404016 。 3. 分镜头脚本:根据脚本制作分镜头脚本,确定每个镜头的画面和动作。 4. 资源准备:准备动画制作所需的素材,包括背景、角色和音效。 5. 画面图片制作:利用 AI 出图工具,比如通过 ChatGPT、MJ、SD 等工具快速生成高质量的图片。 6. 视频制作:利用 AI 工具制作动画,通过 RUNWAY、Luma、Dreamina 等平台快速生成高质量的动画。 7. 后期剪辑:添加音效、配音和字幕,进行最终的剪辑和合成。 8. 发布和推广:将完成的动画短片发布到各大平台,并进行推广和宣传。 此外,在实际制作中,还可以参考一些成功案例,如山西文旅宣传片的制作,运用 Defense 及 SD 制作黄河长城等 AI 艺术字;为陕西文旅做的 40 秒黑神话悟空风格 AI 短片,用 SD 结合 Control Lite 处理钟楼等。郑州 AI 文旅片工作流总体分为分镜脚本、单帧图片制作、图片细节修复与生成视频、视频风格化处理、剪辑合成五个步骤。
2024-12-09
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频
目前关于通过 AGI 生成有一定操控能力的风格化、动漫风生成式短视频,以下是一些相关信息: 2024 年内,有一定操控能力的生成式短视频中,风格化、动漫风最先成熟,真人稍晚。 同时,在 2024 年还会有其他相关进展,如 AI 音频能力长足进展,带感情的 AI 配音基本成熟;“全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货;游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式;AI 男/女朋友聊天基本成熟,记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈;实时生成的内容开始在社交媒体内容、广告中出现;AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验;AI 的商业模式开始有明确用例,如数据合成、工程平台、模型安全等;可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功;中国 AI 达到或超过 GPT4 水平,美国出现 GPT5,世界上开始现“主权 AI”;华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚);AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧;AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年,AI 3D 技术、物理规则成熟,正常人无法区别 AI 生成还是实景拍摄;全真 AI 虚拟人成熟,包含感情的 AI NPC 成熟,开放世界游戏成熟,游戏中几乎无法区别真人和 NPC;AR/VR 技术大规模商用;接近 AGI 的技术出现;人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行;AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源;具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破;“人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉;AI 引发的社会问题开始加重,结构性失业开始出现;AGI 对于地缘政治的影响开始显露。
2024-12-09