直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

sd和mj各自的优缺点在哪?分别更适合什么样的工作内容

回答

Midjourney(MJ)的优点:

  1. 角色一致性精度较高,对于 70 - 80%的工作能大幅提升效率。
  2. 高可用性、极佳的用户体验、不错的效果。
  3. 不需要像 Stable Diffusion(SD)一样高门槛、高成本地训练自己的 LoRA,只需要一张图。
  4. 能生成更多样、更具设计感的角色设计,不受制于特定的模型风格。
  5. 有更加可控的设计内容和更多的细节调整空间,比如使用 Midjourney + Stable Diffusion 混合模式进行原画设计,有两到三次的 Prompt 调整空间,并且能够运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节。
  6. 可以产出比单纯使用一种 AI 进行设计更加合理的结构和更丰富的细节。
  7. 效率极高,在使用合适的 Prompt 情况下,使用较好的硬件,一个完整的方案产出示例不会超过十五分钟。
  8. 能极大地避免可能造成的版权争议和信息泄露风险。

Midjourney(MJ)的缺点:可能还达不到绝对一致性的标准。

Midjourney(MJ)更适合的工作内容:首当其冲的是所有非真人领域,比如游戏、漫画、动漫、绘本等,在商业领域和专业工作流中也有一席之地。

Stable Diffusion(SD)的优点:

  1. 提示词占比相对较低,模型和参数及插件占比较高,分别为 30%和 40%,有更多可调节的空间。

Stable Diffusion(SD)的缺点:提示词的重要性相对较低,需要高门槛、高成本地训练自己的 LoRA。

Stable Diffusion(SD)更适合的工作内容:暂无明确提及。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

半个AI圈期待的Midjourney角色一致性首发评测 - 再入迷梦

在角色一致性上,MJ终于踏出了坚实的一步。首当其冲的,肯定是所有非真人领域,比如游戏、漫画、动漫、绘本等等。MJ的角色一致性精度,是一个很棒的杀器。可能他还达不到绝对一致性得标准,但是对于70~80%的工作,我觉得是有巨幅的效率提升的。同时它也不需要像SD一样,去高门槛、高成本的训练自己的LoRA,只需要一张图。就完事了。高可用性、极佳的用户体验、不错的效果。我觉得足够它在商业领域和专业工作流中。有他的,一席之地。以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

人人可以做原画,如何运用Midjourney+Stable Diffusion 进行角色原画设计

1.更好的设计感,更多种的设计对象,更多样的设计风格:相较于SD,使用MJ可以生成更多样的更具设计感的角色设计,不会受制于特定的模型风格。2.更加可控的设计内容,更多的细节调整空间:使用Midjourney+Stable Diffusion混合模式进行原画设计,我们将有两到三次的Prompt调整空间,并且能够运用SD Controlnet的各种功能,对设计细节进行更多更细致的调节。3.更高的完成度,更合理的结构和细节:使用Midjourney+Stable Diffusion混合模式进行原画设计,我们可以产出比单纯使用一种AI进行设计更加合理的结构和更丰富的细节。4.极高的效率:在使用合适的Prompt情况下,使用较好的硬件,一个完整的方案产出示例,不会超过十五分钟。5.更低的风险:使用Midjourney+Stable Diffusion混合模式进行原画设计,可以极大的避免Midjourney可能造成的版权争议和信息泄露风险,虽然不能完全避免风险,但作为脑暴是没有问题的。下面我将通过一些示例详细说明该流程的步骤和方法,为了保证说明准确连贯,以下示例均采用写实角色风格,展示同样世界观下的五名角色设计,形成一个故事:

学社精华

今日日报🌟今日关键词:Memphis style孟菲斯风格🎨以大胆几何图案、鲜艳色彩、挑战传统设计规则闻名🏠影响领域:家具、纺织品、陶瓷、平面设计、建筑等🌈特点:1⃣强烈色彩对比:鲜艳、对比强烈色彩组合2⃣几何图案:大量不规则、重叠几何图形3⃣抽象装饰性:强调视觉享受,非功能目的4⃣材料质感混合:玻璃、金属、塑料、木材等5⃣反传统功能主义:强调情感表达,非单纯实用💡建议:结合插画或简笔画,niji出图效果更佳🧩 AI绘画技巧1⃣像乐高一样,多组合现有关键词💡顺序代表权重,重点表现的放前面2⃣使用"/blend"指令,丢两张形象背景相似图比直接刷图效率更高,形象保持更好3⃣尝试加入刺绣风格关键词:🪡苏绣Su embroidery🧵湘绣Hunan embroidery🎀粤绣Cantonese embroidery🧶蜀绣Sichuan embroidery🛠 AI绘画工具——SD的讨论☁ https://www.esheep.com/workflow 云端,无需考虑配置👨💻 ComfyUI:适合理科生、学计算机的 Nenly的SD教程视频推荐📺 https://www.bilibili.com/video/BV1D7421N7xN/来来认为:📝 MJ:提示词最核心,占比100%🎨 SD:提示词30%,模型30%,参数+插件40%

其他人在问
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
我想使用MJ设计班牌 应该注意什么问题
使用 MJ 设计班牌时,需要注意以下问题: 1. 选择最新的 6.0 model。 2. 利用图生图功能时,命令为 /describe,选择 image 上传本地图片可获取四条提示词,点击下方标签可生成对应提示词的四张图。但要注意截图的对标比例未必是标准的 9:16,可手动修改比例以省去返工。 3. 自行对比反推的词和对标的相似程度并微调,describe 根据对标图反推的效果可能不太好,可根据推出的词自行修改,也可直接用给定的提示词,如“Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,highend design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera ar 9:16 style raw”。 4. 对于某些难以画出的形象,如拟人形态的龙,可能是描述不够准确,需要加强描述词,如将“一条亚洲龙站在时尚秀场上”这样连成一句话,以便 MJ 正确理解。 5. 确定主体形象时,包括画风、是否 Q 版、配色风格、构图比例、细节量设定等,可以找参考案例。 6. 通用的肖像生产咒语如“Cartoon style character,original character,character design. Mysterious painter and artist,an intellectually mature girl(人物基本形象(必要内容比如性别和身份) Gold and dark red.(配色部分(一个系列里尽量不要改改了容易画风对不上) 2d,solid and clean background,white background. The figure is in the middle of the frame,sideways.(侧身) Art Nouveau,in the style of Alphonse Mucha. no decorative background elements,no flower.Clean background. niji 5 ar 9:14 s 400 style expressive / style cute(二者任选尝试)”,注意咒语中的内容可随意换,多尝试。 7. 利用一致性时,得益于cref,默认值 100,越高越接近参考图像的风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些有用的 prompt。解决“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有细微差距的问题。
2024-10-09
怎么让mj生成的图片色调保持一致
要让 MJ 生成的图片色调保持一致,可以参考以下方法: 1. 在关键词中限制颜色时,同一种情绪最好多生成几张不同色系的图片,这样可以减少后续训练中模型把情绪和颜色做挂钩。但如果您需要将情绪和颜色关联,也可以反其道而行之。 2. 注意数据集中正面情绪与负面情绪的比例应差不多。如果都是正面积极的,在生成一些负面情绪(如 sad、cry)的图片时,可能会出现奇怪的问题(如训练的是兔子形象,但 AI 认知的 sad 可能是人的形象,可能会出现人物特征)。 3. 为保证人物一致性,在生成人物图片时,可确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 MJ 中生成直到得到满意的人物图像,并取 iw 2。 4. 为保证画面的一致性,可以使用 MJ 的 cref 参数。
2024-10-06
mj提示词
以下是关于 MJ 提示词的相关知识: 1. 常用的控制画面的提示词指令分别是 cw、sw 和 iw: cref/cw:主要作用是保证人像一致性。使用 cw 需要用 cref 指令,cw 参数范围为 0 100。强度 100(cw 100)是默认值,它会使用面部、头发和衣服,cw 为 0 的话仅保证脸部一致。基础格式:cref 图片链接,cw 100。参考链接: sref/sw:主要作用是保证画面风格和参考图一致(例如:背景基调、画风等)。使用 sw 需要用 sref 指令,sw 参数范围为 0 1000。基础格式:sref 图片链接,sw 100。参考链接: iw:作用是控制画面构图一致性,保证生成图为参考图的构图样式。 2. Pika 作为 MidJourney 图片生成大师,能够根据您的故事内容创作出全面的分镜提示词,包括分镜描述、人物描述、环境描述、氛围描述、灯光描述、色彩描述、构图描述、风格描述。还会考虑您所使用的相机类型、摄影风格和镜头位置,确保生成的提示词能够完美匹配您的创作需求。 3. 在 MJ 的输入法测试中,提示词中,文本前置、后置等效果相近,并没有很大不同。过长的文本难以控制文本出现的位置,建议只要求 AI 生成部分主要文本内容,自行嵌字仍然还是当前最佳方法。加入引号“”包裹文本即能达到 MJ 生成文字的效果,不必要特殊说明“生成一段文本......”等内容。MJ 能够自行判断文本应当存在的位置,会将文本安排在符合逻辑的位置上,不必要特殊描述。后续有机会可以进一步测试【局部重绘】能否控制文本在规定位置出现。总结概括,MJ 进行文本输出任务,提示词并没有特别固定的语法结构。只需要认识清楚其文本生成的能力范围和使用场景,即可高效的应用 V6 模型,生成有趣的画面内容。
2024-09-23
SD 在线上哪里可以使用?
以下是一些可以在线使用 SD 的地方: 1. 哩布哩布 AI:其在线 SD 界面与本地部署的界面区别不大,每天有一百次的生成次数,且已集成最新的 SDXL 模型。 2. stability AI 公司推出的 Clipdrop(https://clipdrop.co/stablediffusion):和 midjourney 的使用方法相似,输入提示词即可直接生成,每天免费 400 张图片,但需要排队,出四张图大概需要二三十秒的时间。
2024-11-22
SD 安装包
以下是关于 SD 安装包的相关内容: 一、Roop 插件安装 1. 安装时间较长,需耐心等待。安装好后,打开 SD 文件目录下的特定文件夹,在地址栏输入“cmd”并回车。 2. 在打开的 dos 界面中,粘贴“python m pip install insightface==0.7.3 user”代码,自动安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),后台回复【SD】可在云盘下载。 3. 安装完成后,重新打开启动器,后台会继续下载模型,全程需科学上网。 4. 选用真实系模型“realisticVisionV20”,启用 ROOP 插件,选择要替换的人物照片,面部修复选择“GFPGAN”,根据需求设置右边参数和放大算法,点击生成。若人脸像素偏低,可发送到“图生图”并使用 controlnet 中的 tile 模型重绘。 5. 想要插件可添加公众号【白马与少年】回复【SD】。 二、SD 云端部署 1. 部署流程 浏览器上按照腾讯云>控制台>云服务器的路径找到购买的实例,点击启动,输入购买时设置的密码进入远程的 Windows 系统环境,安装显卡驱动、配置环境变量。 2. 安装显卡驱动 用内置的 IE 或下载 Chrome,打开英伟达网站,根据购买机器时选定的显卡型号、Windows 版本号下载对应的驱动并安装。 3. 配置环境变量 驱动安装完成后,复制驱动所在目录(一般是在「C:\\Program Files\\NCIDIA Corporation」),找到环境变量配置入口(控制面板>系统和安全>系统),选择「高级系统设置」,在「系统变量」里的 Path 环境变量中新建并粘贴驱动安装地址保存。 4. 下载安装 SD 整合包 以秋叶的 SD 整合包为例,下载地址为:https://pan.baidu.com/s/1uavAJJdYYWhpnfjwQQDviQ?pwd=a123 ,提取码:a123。建议在服务器上安装提高下载速度的工具或有百度会员。安装后打开安装包一级目录,双击启动器运行依赖,安装完成后即可启动 SD。 三、Roop 换脸插件安装的其他步骤 1. 将 inswapper_128.onnx 文件移动到“sdwebuiakiv4\\models\\roop ”目录下(若没有该目录则创建)。 2. 将.ifnude 和.insightface 目录移动到 C:\\Users\\您的用户名目录下(用户名因人而异)。 3. 启动 webui,它会同步内部组件,可能需 5 30 分钟,耐心等待。加载完成后在浏览器打开,可在图生图、文生图中下面列表标签看到 roop V0.0.2。 特别提醒:此插件谨慎使用,切勿触犯法律。
2024-11-22
sd 人物的模样及服装等统一
以下是关于人物模样及服装的 SD 关键词描述: 人物类型:肌肉公主、舞者、啦啦队等。 性别:单人,包括女人和男人。 身体特征:有光泽的皮肤、苍白皮肤、白皙皮肤等。 头发样式:直发、卷发、波浪卷等。 头发颜色:挑染、内层挑染、头发内变色等。 头发长度:长发、很短的头发、短发等。 具体人物:初音未来、绫波(碧蓝航线)、比那名居天子、蛮啾(碧蓝航线)、爱宕、时崎狂三、洛琪希、西住美穗、星街彗星、时雨、蒂法·洛克哈特、中野一花、南达科他州(碧蓝航线)、白上吹雪、白井黑子、岛风等。 发型特点:身前,单侧编发,人妻发型;挑染,条纹发色;短碎发等。 面部特征:死鱼眼、晒痕、眼睛发光、垂耳(狗)等。
2024-11-20
SD 下载
以下是关于 SD 下载的相关内容: 1. 模型下载与安装: 二维码做好后,进入 SD 版块,需下载两个 SD 的 ControlNET 模型和一个预处理器。您可以添加公众号【白马与少年】,回复【SD】获取。 在【QR ControlNET】的文件夹中,后缀为【.yaml】的放在“……\\sdwebuiakiv4.2\\extensions\\sdwebuicontrolnet\\models”路径下,后缀为【.safetensors】的放在“……\\sdwebuiakiv4.2\\models\\ControlNet”路径下。 系统要求为 Win10 或 Win11。Win 系统查看配置:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格;查看电脑配置时,需满足 3 个要求(推荐):电脑运行内存 8GB 以上,是英伟达的显卡,显卡内存 4GB 以上。 配置达标可跳转至对应安装教程页。 如果不会科学上网,也可去启动器的界面直接下载模型。将下载的大模型放在根目录的【……\\models\\Stablediffusion】文件夹下,在左上角的模型列表中选择(看不到就点旁边的蓝色按钮刷新)。 2. 其他相关文件下载与放置: VAE 可直接在启动器里面下载,下载的 VAE 放在根目录的【……\\models\\VAE】文件夹。 Embedding 可在 C 站通过右上角的筛选 Textual Inversion 找到,放在根目录下的 embeddings 文件夹里。
2024-11-18
sd 下载
以下是关于 SD 下载的相关内容: 1. 模型安装设置: 二维码做好后,进入 SD 版块,需下载两个 SD 的 ControlNET 模型和一个预处理器。可添加公众号【白马与少年】,回复【SD】获取。 在【QR ControlNET】的文件夹中,后缀为【.yaml】的放在“……\\sdwebuiakiv4.2\\extensions\\sdwebuicontrolnet\\models”路径下,后缀为【.safetensors】的放在“……\\sdwebuiakiv4.2\\models\\ControlNet”路径下。 选择模型,填入关键词,设置迭代步数为 15,采样选择 DPM++ 2M Karras,图像大小设置为 768768。 2. SD 的安装: 系统需为 Win10 或 Win11。 Win 系统查看配置: 查看电脑系统:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格。 查看电脑配置:检查电脑能否带动 SD,需满足 3 个要求(推荐):电脑运行内存 8GB 以上,是英伟达的显卡,显卡内存 4GB 以上。打开任务管理器(同时按下 ctrl+shift+esc),查看电脑运行内存和显卡内存(显存)。8GB 运行内存可勉强运行 SD,推荐 16GB 以上运行内存;4GB 显存可运行 SD,推荐 8GB 以上显存。 配置达标可跳转至对应安装教程页: 。 配置不够可选择云端部署(Mac 也推荐云端部署): 。 备选:SD 难的话,可先试试简单的无界 AI: 。 3. 软件原理傻瓜级理解: 不会科学上网,可在启动器界面直接下载模型,下载的大模型放在根目录的【……\\models\\Stablediffusion】文件夹下,在左上角模型列表中选择,看不到就点旁边蓝色按钮刷新。 VAE 相当于给模型增加提高饱和度的滤镜和局部细节微调,有的大模型自带 VAE,可不用再加。VAE 可在启动器里下载,放在根目录的【……\\models\\VAE】文件夹下。 Embedding 是提示词打包功能,可在 C 站通过右上角筛选 Textual Inversion 找到,放在根目录下的 embeddings 文件夹里。 LORA 功能强大,可将人物或物品接近完美复刻进图像中,使用时需注意版权和法律问题。
2024-11-18
SD好的模型分享
以下是为您分享的关于 SD 模型的相关内容: 对于 SDXL 的 ControlNet 模型中的 Canny 硬边缘模型,有不同型号,如 4080ti 笔记本测试中,12G 显存下,sdxl base+refiner 模型,使用 diffusers 的 2.5Gfull 模型绘制 10241024 尺寸图片需 2 分 57 秒,320Mb 的 small 模型用时 34s,质量差距不大但时间优势明显。其他作者如 kohya 的用时 33 秒,更接近真实质感。sai 的 128lora 和 256lora 分别用时 39 秒和 1 分 08 秒,偏绘画感觉。t2i 的用时 34s,偏插画。关闭 refiner 能节省一半左右时间,平均 17 秒左右。 在 Depth 深度模型测试中,图形尺寸 6641024,diffusers 的 full 模型用时 2 分 48 秒,small 模型用时 23s,kohya 模型用时 42 秒,sai 模型用时 1 分 12 秒,sargezt 模型用时 1 分 52 秒。 用 Stable Diffusion 时,要先确定照片风格,如生成真人 AI 小姐姐可选用 chilloutmix 的大模型。部分常用大模型可在分享的链接中根据文件夹名称找到。文章第三部分会详细介绍模型下载位置和存放位置。 对于 ControlNet 中线条约束类的预处理器和模型,作者已整理好,如需获取可添加公众号【白马与少年】回复【SD】。同时作者还附上一张图帮助理解 ControlNet 模型的命名规则。
2024-11-17
现在哪几家的大模型支持通过手机视频多模态实时交流?
以下几家的大模型支持通过手机视频多模态实时交流: 1. PandaGPT:能够理解不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 2. VideoLLaMA:引入了多分支跨模式 PT 框架,使语言模型能够在与人类对话的同时处理给定视频的视觉和音频内容。 3. 视频聊天 GPT:专门为视频对话设计,能够通过集成时空视觉表示来生成有关视频的讨论。 4. NExTGPT:端到端、通用的 anytoany 多模态语言模型,支持图像、视频、音频、文本的自由输入输出。
2024-11-22
coze相关资源在哪里
以下是关于 Coze 的相关资源: 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用字节自研的云雀大模型,国内网络可正常访问 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(访问需要突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html) 学习资源: 此外,字节对 Coze 的官方解释为:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。个人认为 Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。字节针对 Coze 这个产品部署了国内版和海外版两个站点。 AI Agent 的开发流程中,Bot 的开发和调试页面布局主要分为如下几个区块:提示词和人设的区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置、触发器(例如定时发送早报)、开场白(用户和 Bot 初次对话时,Bot 的招呼话语)、自动建议(每当和 Bot 一轮对话完成后,Bot 给出的问题建议)、声音(和 Bot 对话时,Bot 读对话内容的音色)。
2024-11-21
coze中的提示词优化节点在哪里
在 Coze 中,提示词优化节点的相关信息如下: 这个节点比较容易理解,如果觉得提示词需要优化,可以加入它进行优化。参数很简单,只有一个要优化的提示词。 以文生图提示词“1 girl in real world”为例进行试用,优化后添加了很多具体信息,如在带着好奇心看书、环境中有阳光、色彩搭配的特点。但修改后的提示词在控制图片生成真实照片的感觉方面,“in real world”控制效果比“realistic”好。 此外,Coze 还涉及其他节点,如智能抠图、画质提升等。在复刻吴恩达开源的 AI 翻译项目时,工作流分为新建工作流、导入核心流程、设置节点等步骤,包括选择翻译的源语言和目标语言、选择大模型、配置反思优化的提示词等。
2024-11-16
chatgpt file uploader extended 在哪里下载
以下是 ChatGPT File Uploader Extended 的下载方法: 安卓系统: 安装 Google Play:到小米自带的应用商店搜索 Google Play 进行安装,安装好后打开,按照提示一步步操作并登录。 下载安装 ChatGPT:到谷歌商店搜索“ChatGPT”进行下载安装,开发者是 OpenAI。注意这步骤可能遇到“google play 未在您所在的地区提供此应用”的问题。解决方法是在 google play 点按右上角的个人资料图标,依次点按:设置>常规>帐号和设备偏好设置>国家/地区和个人资料。如果账号没有地区,可以“添加信用卡或借记卡”,国内的双币信用卡就行,填写信息时地区记得选美。如果回到 google play 首页还搜不到 chatgpt,可以卸载重装 google play,操作过程保持梯子的 IP 一直是美,多试几次。 体验 ChatGPT:如果只想体验 ChatGPT 3.5 版本,不升级 GPT4,直接登录第二部注册好的 ChatGPT 账号即可。 订阅 GPT4 Plus 版本:先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡,然后在 ChatGPT 里订阅 Plus。 苹果系统: 在 Apple Store 下载 ChatGPT:中国区正常下载不了,需要切换到美区才可以下载。美区 Apple ID 注册教程参考知乎链接: 。最终在 Apple Store 搜到 ChatGPT 下载安装,注意别下错。 支付宝购买苹果礼品卡充值订阅付费 App:打开支付宝,地区切换到【美区任意区】,往下滑,找到【品牌精选折扣礼品卡】,点击进去,可以看到【大牌礼品卡】,往下滑找到【App Store & iTunes US】礼品卡,按需要的金额购买即可,建议先买 20 刀。包括支付宝购买礼品卡、在 apple store 中兑换礼品卡、在 chatgpt 中购买订阅 gpt plus,如果中途不想继续订阅了,可到订阅列表中取消订阅。 使用 ChatGPT 4o: 开启对话:打开 ChatGPT 应用或网页,点击开始对话。会员不管是在苹果还是安卓手机上购买的,电脑上都能登录。 体验最新语音对话功能:版本切到 ChatGPT 4o,点击右下角“耳机🎧”图标,选择一个声音,就可以体验流畅的语音对话。
2024-11-15
claude 跟chatgpt的区别在哪
Claude 与 ChatGPT 的区别主要体现在以下几个方面: 1. 所属公司及理念:Claude 是 Anthropic 的产品,Anthropic 重视 AGI 的可解释和安全可靠性,其创始团队是 OpenAI 早期的核心人员,因理念不同自立门户。Anthropic 关注的是 HH(helpful and harmless)特性,即有用且无害,他们发现单纯使用 helpful 的数据训练存在易遭攻击的问题,需要两种数据混合训练。 2. 数据搜集:Anthropic 在亚马逊机器人平台上雇佣标注员扮演两种角色提问。模拟正常用户时,设置蓝队问积极正向的问题,允许多轮对话,选出更 helpful 的回答;模拟恶意用户时,设置红队问消极负面的挑衅问题,选出没那么 harmful 的回答,一般是单轮对话。标注员要求是美国硕士以上,通过筛选保证数据质量。 3. 标注和训练:作者未事先培训标注员什么是 helpfulness 和 harmfulness 以保证数据多样性。标注员筛选看写作水平、表达能力。同时在不同平台标注不同质量和数量的数据。在 RM 和 PPO 方面,Anthropic 称 RM 为 PM(Preference Model),发现 PM 模型越大、数据越多会涨点,这与 ChatGPT 中 RM 模型不能太大的结论不同。PPO 阶段的损失函数少了 InstructGPT 的第三项 SFT 项,因为作者发现 Policy 模型和 PM 模型足够大时,不加那一项效果也会持续提升。
2024-11-15
野菩萨的 AIGC 资深课在哪里获取
野菩萨的 AIGC 资深课由工信部下属单位【人民邮电出版社】开设,是市面上值得推荐的 AI 课程之一,也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识,无论您是 AI 初学者还是进阶者,都能满足学习需求。您可以扫码添加菩萨老师助理,了解更多信息。
2024-11-04
prompt有什么优缺点
以下是关于 prompt 的优缺点: 优点: 能够提升模型对通用任务的解题表现,充分发挥其潜力。 结构化的 prompt 可以降低沟通难度,提高结果的准确度。 缺点: 效果因任务而异,部分情况下可能存在“表演思考”的现象。 结构化的 prompt 会限制更多可能性。 大部分框架不太适合解决过于主观、个人情绪的问题,也没必要解决过于简单的问题。想要完全符合需求,往往不是一个框架能完全搞定的。 相关参考链接: Prompt 项目链接: 网友点评: 详细分析来源: 原推文:
2024-11-23
列出2-3个精选的比较好的文本处理类的AI工具或网站,要求尽量是国内的产品,最好是免费的。罗列时应包含以下信息:名称、简介、2-3个主要功能、横向对比的优缺点
以下为您精选的国内文本处理类 AI 工具或网站: 1. 秘塔写作猫 简介:利用 AI 技术辅助用户进行高质量写作。 主要功能:检查语法、拼写错误;提供写作改进建议;进行智能润色和内容创作辅助。 优点:功能较为全面,能有效提升写作质量。 缺点:可能存在对某些特定领域的适应性不足。 2. Lettria 简介:处理个人文本材料。 主要功能:对个人文本进行分析和处理。 优点:专注于个人文本处理,针对性较强。 缺点:功能相对较单一。
2024-11-19
ai视频优缺点
AI 视频具有以下优点: 1. 方便快捷:部分软件有网页和 APP 版本,使用便利,如 Runway。 2. 免费或有免费额度:一些软件如 haiper、PixVerse 等免费,或者像 SVD 有免费额度。 3. 特定功能优势:例如 Leiapix 可以把一张照片转动态,PixVerse 人少不怎么排队且有换脸功能。 4. 技术多样:采用不同的技术,如 Transformer 自注意力机制对长视频建模更好,可实现细粒度语义控制。 AI 视频也存在一些缺点: 1. 质量问题:生成质量和分辨率较低,如 GAN、VAE 生成的视频。 2. 控制难度:可控性不足,仅靠提示词难以精细化描述,对 AI 的控制力有限。 3. 时长限制:生成时间长,生成的视频时长不足。 4. 稳定性差:视频质量不稳定,语义不连贯、帧间存在闪烁。 5. 物理交互准确性不足:动作存在突变、不连贯,运动合理性有待提高。 6. 训练数据多样性欠缺:同样场景下不同产品表现差异大,平面风格图片生成效果不够好,可能出现不符合预期的情况。 7. 大幅运动模糊感未解决:大幅运动时画面模糊。
2024-11-08
主要AI工具的应用方向及优缺点
以下是一些主要 AI 工具的应用方向及优缺点: 与销售工作有关的 AI 工具: Salesforce 爱因斯坦: 优点:能通过分析大量数据集识别潜在客户,生成预测性潜在客户评分,具有自动化功能,可让销售团队专注于关键方面。 缺点:暂未提及。 Clari: 优点:专门从事智能收入运营,能创建高度准确的收入预测,统一数据并以易理解方式呈现,简化财务预测过程。 缺点:暂未提及。 Hightime: 优点:作为销售团队的 AI 助手,能处理重复性任务和耗时研究。 缺点:暂未提及。 适合软件项目经理的 AI 工具: 项目管理和任务跟踪工具:如 Jira、Trello 等,集成 AI 功能可辅助制定计划、分配任务、跟踪进度。 优点:提高管理效率。 缺点:暂未提及。 文档和协作工具:如微软 Copilot 集成到 Office 套件,云存储服务如 Google Drive 提供 AI 驱动的文档管理和协作功能。 优点:为文档撰写、编辑等提供辅助,优化协作。 缺点:暂未提及。 风险管理和决策支持工具:可帮助识别和分析项目风险,并提供决策建议。 优点:提升决策科学性。 缺点:暂未提及。 沟通和协作工具:AI 助手辅助进行团队沟通协调、客户关系维护等。 优点:优化沟通与协作。 缺点:暂未提及。 创意生成工具:如文心一格、Vega AI 等,帮助快速生成创意图像素材。 优点:提供创意支持。 缺点:暂未提及。 大淘宝设计部 2023 年度 AI 设计实践中的工具: 主要工具为 Midjourney 和 Stable Diffusion,辅助工具有 RUNWAY 和 PS beta 等。但未提及具体的优缺点。
2024-09-03
通往agi之路,比起其他agi产品有哪些优缺点?
以下是关于通往 AGI 之路与其他相关产品的一些信息: 通往 AGI 之路: 优点:由更多业余时间兼职的人组成,凭借热情和自驱迸发出能量。初心良好,选择内容开源,体现出“坦诚、无私、热情、互助”的精神。 缺点:文中未提及。 SmartGPT: 优点:具有更好的推理表现,更易配置,模块化。 缺点:尚未集成内存管理(Memory)模块。 需要注意的是,文中将通往 AGI 之路与李一舟进行了对比,李一舟选择的是内容商业化,而通往 AGI 之路选择内容开源,两者面向的群体虽有相似,但没有直接的可比性。
2024-08-26
目前国内使用率较高的AI软件有哪些?他们的优缺点总结一下
以下是目前国内使用率较高的一些 AI 软件及其优缺点总结: 图像类产品: 通义万相: 优点:在中文理解和处理方面表现出色;用户可选择多种艺术和图像风格,满足不同创作需求;生成图像质量高、细节丰富;操作界面简洁直观,用户友好度高;可与阿里其他产品和服务无缝整合;现在免费,每天签到获取灵感值。 缺点:为符合国内监管要求,某些类型图像无法生成,限制创作自由度;处理非中文语言或国际化内容方面可能不如国际工具出色;处理多元文化内容时可能存在偏差。 可灵: 优点:生成的图像质量非常高,已向所有用户开放使用。 缺点:价格相对较高,重度用户年费可能达几千元,平均每月使用成本在 400 到 600 元,轻度用户有免费点数和较便宜的包月选项。 聊天对话类产品: Kimi: 优点:具有超长上下文能力,最初支持 20 万字,现提升到 200 万字,对于处理长文本或大量信息的任务有优势,对需要长期记忆或参考大量背景信息的任务有用。 缺点:文字生成和语义理解、文字生成质量方面可能不如国内其他产品好,不支持用户自定义智能体。
2024-08-19