直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

sd和mj各自的优缺点在哪?分别更适合什么样的工作内容

回答

Midjourney(MJ)的优点:

  1. 角色一致性精度较高,对于 70 - 80%的工作能大幅提升效率。
  2. 高可用性、极佳的用户体验、不错的效果。
  3. 不需要像 Stable Diffusion(SD)一样高门槛、高成本地训练自己的 LoRA,只需要一张图。
  4. 能生成更多样、更具设计感的角色设计,不受制于特定的模型风格。
  5. 有更加可控的设计内容和更多的细节调整空间,比如使用 Midjourney + Stable Diffusion 混合模式进行原画设计,有两到三次的 Prompt 调整空间,并且能够运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节。
  6. 可以产出比单纯使用一种 AI 进行设计更加合理的结构和更丰富的细节。
  7. 效率极高,在使用合适的 Prompt 情况下,使用较好的硬件,一个完整的方案产出示例不会超过十五分钟。
  8. 能极大地避免可能造成的版权争议和信息泄露风险。

Midjourney(MJ)的缺点:可能还达不到绝对一致性的标准。

Midjourney(MJ)更适合的工作内容:首当其冲的是所有非真人领域,比如游戏、漫画、动漫、绘本等,在商业领域和专业工作流中也有一席之地。

Stable Diffusion(SD)的优点:

  1. 提示词占比相对较低,模型和参数及插件占比较高,分别为 30%和 40%,有更多可调节的空间。

Stable Diffusion(SD)的缺点:提示词的重要性相对较低,需要高门槛、高成本地训练自己的 LoRA。

Stable Diffusion(SD)更适合的工作内容:暂无明确提及。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

半个AI圈期待的Midjourney角色一致性首发评测 - 再入迷梦

在角色一致性上,MJ终于踏出了坚实的一步。首当其冲的,肯定是所有非真人领域,比如游戏、漫画、动漫、绘本等等。MJ的角色一致性精度,是一个很棒的杀器。可能他还达不到绝对一致性得标准,但是对于70~80%的工作,我觉得是有巨幅的效率提升的。同时它也不需要像SD一样,去高门槛、高成本的训练自己的LoRA,只需要一张图。就完事了。高可用性、极佳的用户体验、不错的效果。我觉得足够它在商业领域和专业工作流中。有他的,一席之地。以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

人人可以做原画,如何运用Midjourney+Stable Diffusion 进行角色原画设计

1.更好的设计感,更多种的设计对象,更多样的设计风格:相较于SD,使用MJ可以生成更多样的更具设计感的角色设计,不会受制于特定的模型风格。2.更加可控的设计内容,更多的细节调整空间:使用Midjourney+Stable Diffusion混合模式进行原画设计,我们将有两到三次的Prompt调整空间,并且能够运用SD Controlnet的各种功能,对设计细节进行更多更细致的调节。3.更高的完成度,更合理的结构和细节:使用Midjourney+Stable Diffusion混合模式进行原画设计,我们可以产出比单纯使用一种AI进行设计更加合理的结构和更丰富的细节。4.极高的效率:在使用合适的Prompt情况下,使用较好的硬件,一个完整的方案产出示例,不会超过十五分钟。5.更低的风险:使用Midjourney+Stable Diffusion混合模式进行原画设计,可以极大的避免Midjourney可能造成的版权争议和信息泄露风险,虽然不能完全避免风险,但作为脑暴是没有问题的。下面我将通过一些示例详细说明该流程的步骤和方法,为了保证说明准确连贯,以下示例均采用写实角色风格,展示同样世界观下的五名角色设计,形成一个故事:

学社精华

今日日报🌟今日关键词:Memphis style孟菲斯风格🎨以大胆几何图案、鲜艳色彩、挑战传统设计规则闻名🏠影响领域:家具、纺织品、陶瓷、平面设计、建筑等🌈特点:1⃣强烈色彩对比:鲜艳、对比强烈色彩组合2⃣几何图案:大量不规则、重叠几何图形3⃣抽象装饰性:强调视觉享受,非功能目的4⃣材料质感混合:玻璃、金属、塑料、木材等5⃣反传统功能主义:强调情感表达,非单纯实用💡建议:结合插画或简笔画,niji出图效果更佳🧩 AI绘画技巧1⃣像乐高一样,多组合现有关键词💡顺序代表权重,重点表现的放前面2⃣使用"/blend"指令,丢两张形象背景相似图比直接刷图效率更高,形象保持更好3⃣尝试加入刺绣风格关键词:🪡苏绣Su embroidery🧵湘绣Hunan embroidery🎀粤绣Cantonese embroidery🧶蜀绣Sichuan embroidery🛠 AI绘画工具——SD的讨论☁ https://www.esheep.com/workflow 云端,无需考虑配置👨💻 ComfyUI:适合理科生、学计算机的 Nenly的SD教程视频推荐📺 https://www.bilibili.com/video/BV1D7421N7xN/来来认为:📝 MJ:提示词最核心,占比100%🎨 SD:提示词30%,模型30%,参数+插件40%

其他人在问
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
我想使用MJ设计班牌 应该注意什么问题
使用 MJ 设计班牌时,需要注意以下问题: 1. 选择最新的 6.0 model。 2. 利用图生图功能时,命令为 /describe,选择 image 上传本地图片可获取四条提示词,点击下方标签可生成对应提示词的四张图。但要注意截图的对标比例未必是标准的 9:16,可手动修改比例以省去返工。 3. 自行对比反推的词和对标的相似程度并微调,describe 根据对标图反推的效果可能不太好,可根据推出的词自行修改,也可直接用给定的提示词,如“Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,highend design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera ar 9:16 style raw”。 4. 对于某些难以画出的形象,如拟人形态的龙,可能是描述不够准确,需要加强描述词,如将“一条亚洲龙站在时尚秀场上”这样连成一句话,以便 MJ 正确理解。 5. 确定主体形象时,包括画风、是否 Q 版、配色风格、构图比例、细节量设定等,可以找参考案例。 6. 通用的肖像生产咒语如“Cartoon style character,original character,character design. Mysterious painter and artist,an intellectually mature girl(人物基本形象(必要内容比如性别和身份) Gold and dark red.(配色部分(一个系列里尽量不要改改了容易画风对不上) 2d,solid and clean background,white background. The figure is in the middle of the frame,sideways.(侧身) Art Nouveau,in the style of Alphonse Mucha. no decorative background elements,no flower.Clean background. niji 5 ar 9:14 s 400 style expressive / style cute(二者任选尝试)”,注意咒语中的内容可随意换,多尝试。 7. 利用一致性时,得益于cref,默认值 100,越高越接近参考图像的风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些有用的 prompt。解决“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有细微差距的问题。
2024-10-09
怎么让mj生成的图片色调保持一致
要让 MJ 生成的图片色调保持一致,可以参考以下方法: 1. 在关键词中限制颜色时,同一种情绪最好多生成几张不同色系的图片,这样可以减少后续训练中模型把情绪和颜色做挂钩。但如果您需要将情绪和颜色关联,也可以反其道而行之。 2. 注意数据集中正面情绪与负面情绪的比例应差不多。如果都是正面积极的,在生成一些负面情绪(如 sad、cry)的图片时,可能会出现奇怪的问题(如训练的是兔子形象,但 AI 认知的 sad 可能是人的形象,可能会出现人物特征)。 3. 为保证人物一致性,在生成人物图片时,可确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 MJ 中生成直到得到满意的人物图像,并取 iw 2。 4. 为保证画面的一致性,可以使用 MJ 的 cref 参数。
2024-10-06
mj提示词
以下是关于 MJ 提示词的相关知识: 1. 常用的控制画面的提示词指令分别是 cw、sw 和 iw: cref/cw:主要作用是保证人像一致性。使用 cw 需要用 cref 指令,cw 参数范围为 0 100。强度 100(cw 100)是默认值,它会使用面部、头发和衣服,cw 为 0 的话仅保证脸部一致。基础格式:cref 图片链接,cw 100。参考链接: sref/sw:主要作用是保证画面风格和参考图一致(例如:背景基调、画风等)。使用 sw 需要用 sref 指令,sw 参数范围为 0 1000。基础格式:sref 图片链接,sw 100。参考链接: iw:作用是控制画面构图一致性,保证生成图为参考图的构图样式。 2. Pika 作为 MidJourney 图片生成大师,能够根据您的故事内容创作出全面的分镜提示词,包括分镜描述、人物描述、环境描述、氛围描述、灯光描述、色彩描述、构图描述、风格描述。还会考虑您所使用的相机类型、摄影风格和镜头位置,确保生成的提示词能够完美匹配您的创作需求。 3. 在 MJ 的输入法测试中,提示词中,文本前置、后置等效果相近,并没有很大不同。过长的文本难以控制文本出现的位置,建议只要求 AI 生成部分主要文本内容,自行嵌字仍然还是当前最佳方法。加入引号“”包裹文本即能达到 MJ 生成文字的效果,不必要特殊说明“生成一段文本......”等内容。MJ 能够自行判断文本应当存在的位置,会将文本安排在符合逻辑的位置上,不必要特殊描述。后续有机会可以进一步测试【局部重绘】能否控制文本在规定位置出现。总结概括,MJ 进行文本输出任务,提示词并没有特别固定的语法结构。只需要认识清楚其文本生成的能力范围和使用场景,即可高效的应用 V6 模型,生成有趣的画面内容。
2024-09-23
mj画风整理
以下是关于 Midjourney(MJ)画风的相关整理: 1. Midjourney 200 条风格词汇:@TheMouseCrypto 发表了一份 200 条风格词汇整理,MJ 创始人关注且转发。这些关键词条个人感觉不错,值得推荐,页数达 77 页,很全的宝典。相关链接:《》 2. MJ 多张图保证构图、人物一致性实战教学: 由于 MJ 不可控因素,如果需要前后两张图画风、构图等都保持一致,可以按照三个确定来处理: 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 确定图片角色一致性:在第二步得到构图风格没有问题的基础上,保证人物一致性。 先保证构图再确认角色一致性的原因:MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,相较于把整个画面结构都变了,固定位置重绘局部内容会容易很多,如果整个画面结构变了先保证人物内容的话,会很依赖 MJ 抽卡。 确定画面元素的示例:以本次出图要求“医院病床上呻吟的人们”为例,出了两张躺在病床上的人(一男一女在输液),同时根据整体定的画风偏冷色调漫画风,加入对应 seed 得到提示词。整体看下来,第一张图的效果更方便出第二张图“在健身房做卧推的”的场景,但第一张图主角的四肢存在问题。
2024-09-11
MJ人物姿势
以下是关于 MJ 人物姿势的相关信息: MewXAI 中的 MJ 绘画创意度和想象力极高,在摄影照片、海报、logo 设计、3D 模型、表情包制作等方面表现出色,并且通过姿态识别能够实现对人物动作的精准控制,不仅可以生成单人的姿势,还可以生成多人的姿势,实现对 AI 画图的完美控制。 Midjourney V6 更新了角色一致性命令“cref”。在 MJ 网页社区里随机选一张图片,点击箭头下方的图片 icon 按钮(图 1),在上方输入栏里选择三个按钮(图 2 红框里第一个就是角色参考,点击一下图标),加上描述词,调整设置(图 3),回车即可实现人物面部不变,场景变化(图 4)。同时,按住 Shift 键选择一个选项可将图像用于多个类别。需要注意的是,虽然 MJ V6 还处于 alpha 测试阶段,此功能及其他功能可能会突然更改,但 V6 官方 beta 版本即将推出。
2024-09-10
Stable Diffusion(SD)收费吗
Stable Diffusion 是开源免费的。其优势在于开源免费、可以本地化部署、创作自由度很高,但需要较好的电脑配置,尤其是显卡。 相比较于 DALLE 等大模型,Stable Diffusion 让用户使用消费级的显卡便能够迅速实现文生图。Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,大家可以拷贝使用。 目前有关于 Stable Diffusion 的课程,例如《Stable Diffusion 零基础入门宝典》,共计 77 个课时,定价 298 元,上架 CCtalk。因制作字幕课程在逐步解锁中,目前对前 100 名报名的同学有优惠价 198 元。
2024-10-21
Stable Diffusion(SD),怎么操作
Stable Diffusion(SD)的操作包括以下方面: 技术原理: 核心技术来源于AI视频剪辑技术创业公司Runway的Patrick Esser,以及慕尼黑大学机器视觉学习组的Robin Romabach。其技术基础主要来自于他们之前在计算机视觉大会CVPR22上合作发表的潜扩散模型(Latent Diffusion Model)研究。 是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,能够根据任意文本输入生成高质量、高分辨率、高逼真的图像。 原理步骤包括:使用新颖的文本编码器(OpenCLIP)将文本输入转换为向量表示;使用扩散模型将随机噪声图像逐渐变换为目标图像;在扩散过程中利用文本向量和噪声图像作为条件输入给出变换概率分布;使用超分辨率放大器将生成的低分辨率图像放大到更高分辨率。 用AI给老照片上色: 将照片放入后期处理,使用GFPGAN算法将人脸变清晰。 将图片发送到图生图中,打开stableSR脚本放大两倍,切换到sd2.1的模型进行修复,vae选择vqgan,提示词可不写以免对原图产生干扰。 安装要求: 电脑系统为Win10或者Win11,避免使用更低版本系统。查看方法:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看Windows规格。 检查电脑性能,需满足3个要求:电脑运行内存8GB以上;是英伟达(俗称N卡)的显卡;显卡内存4GB以上。 检查运行内存方法:鼠标右击桌面底部任务栏,点击“任务管理器”,在“性能”里面找到“内存”,查看划线参数。8GB为勉强达到标准,16GB可正常使用,32GB能非常自由使用。 查看“GPU”,先看右上角显卡名字或型号,必须是NVIDIA(英伟达)的显卡,若为AMD或Intel,电脑可能不太支持SD,安装教程较麻烦。
2024-10-21
在哪可以下载sd
以下是关于下载 SD 的详细步骤: 1. 确保您的整合包版本是最新的秋叶 4.2 整合包(6 月 23 号更新),下载包已更新至云盘,后台回复【SD】即可下载。在插件包里面下载相关文件。 2. 将 sdwebuiroop 文件夹拖放到“……\\sdwebuiakiv4.2\\extensions”目录下。 3. 解压 python 压缩包,替换掉根目录下的相应文件。 4. 更改到您想要安装的位置,点击右下角的安装。安装时间较长,请耐心等待。 5. 安装好之后,打开 SD 文件目录下的相关文件夹,在地址栏输入“cmd”,然后回车。在打开的 dos 界面里面,将“python m pip install insightface==0.7.3 user”粘贴进来,会自动开始安装 insightface。如果此阶段出现错误,建议去下载使用最新的秋叶 4.2 整合包(6 月 23 号更新),下载包已更新至云盘,后台回复【SD】即可下载。 6. 安装完成后,重新打开启动器,后台会继续下载一些模型,此时一定要保证全程科学上网。 此外,如果不会科学上网,也可以去启动器的界面直接下载模型,将下载的大模型放在根目录的【……\\models\\Stablediffusion】文件夹下,在左上角的模型列表中进行选择(看不到就点旁边的蓝色按钮刷新一下)。旁边的 VAE 可直接在启动器里面下载,下载的 VAE 放在根目录的【……\\models\\VAE】文件夹下。Embedding 可在 C 站通过右上角的筛选 Textual Inversion 找到,放在根目录下的 embeddings 文件夹里。
2024-10-17
相同的参数下,用SD comfyui出图可以和SD webui出图保持图片效果一模一样么?
理论上,在应用完全相同参数(如 Step、CFG、Seed、prompts)的情况下,SD ComfyUI 出图和 SD WebUI 出图应当能保持图片效果一模一样。但在实际操作中可能会存在一些差异,比如: 提示词的多个条件下,SD 生成的图像可能无法全部满足,这与提示词引导系数有关,该系数关系到出图与文字的相关程度。 不同的模型和配置也可能影响出图效果,例如 SDXL 的大模型分为 base、refiner 以及配套的 VAE 模型,用于调节图片的画面效果和色彩。 需要注意的是,相同参数下要达到完全一致的出图效果并非绝对,还会受到多种因素的综合影响。
2024-10-14
SD教学视频
以下为一些关于 SD 的教学视频推荐: 1. 新手从 0 入门 AI 绘画教程: 推荐系列章节教学视频: 课程内容包括:第一节课 AI 绘画原理与基础界面;第二节课 20 分钟搞懂 Prompt 与参数设置;第三节课 打破次元壁,用 AI“重绘”照片和 CG;第四节课 AI 绘画模型,“画风”自由切换;第五节课 提高 AI 绘画分辨率的方式;第六节课 LoRa | Hypernetwork 概念简析;第七节课 定向修手修脸,手把手教你玩转局部重绘;第八节课 提示词补全翻译反推,“终极”放大脚本与细节优化插件;第九节课 LoRA 从原理到实践;第十节课 零基础掌握 ControlNet。 2. 教程:SD 做中文文字 持续更新中: 视频教程: 制作思路:将中文字做成白底黑字,存成图片样式;使用文生图的方式,使用大模型真实系,输入关键词和反关键词,反复刷机得到满意效果;可输出 C4D 模型,可自由贴图材质效果;若希望有景深效果,可打开 depth;打开高清修复,分辨率联系 1024 以上,步数 29 60。 3. SD 从入门到大佬: 推荐跟着 Nenly 同学的【B站 第一套 Stable Diffusion 系统课程】合集走一遍,安装完 SD 后可参考。 可选的一些图片版教程:
2024-10-08
sd提示词网站
以下是一些与 SD 提示词相关的网站和资源: MajinAI: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru: 在写 SD 提示词时,通常的描述逻辑包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制 Stable Diffusion 的绘图。 对于新手,还有以下功能型辅助网站帮助书写提示词: http://www.atoolbox.net/ ,它可以通过选项卡的方式快速填写关键词信息。 https://ai.dawnmark.cn/ ,每种参数都有缩略图可参考,方便更直观地选择提示词。 还可以去 C 站(https://civitai.com/)里面抄作业,每一张图都有详细的参数,可点击下面的复制数据按钮。 此外,还有“Easy Prompt Selector”插件,安装方式是在扩展面板中点击“从网址安装”,然后输入以下地址 https://github.com/bluepen5805/sdwebeasypromptselector ,然后将汉化包复制进“……\\sdwebuiakiv4\\extensions”路径文件夹下直接覆盖。安装完成后,重启 webUI,就可以在生成按钮下面看到多出来一个“提示词”按钮,点击它会出现下拉列表,里面有很多不同的分类,可根据需要选择提示词。
2024-09-30
野菩萨的 AIGC 资深课在哪里获取
野菩萨的 AIGC 资深课由工信部下属单位【人民邮电出版社】开设,是市面上值得推荐的 AI 课程之一,也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识,无论您是 AI 初学者还是进阶者,都能满足学习需求。您可以扫码添加菩萨老师助理,了解更多信息。
2024-11-04
目前国产AI对比国外AI,存在哪些不足和差距,我要实事求是的回答
目前国产 AI 对比国外 AI 存在以下不足和差距: 1. 在通用语言模型方面,如 ChatGPT 和 GPT4 出现后,国内与国外拉开了约 2 年的技术差距。国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距,甚至还不如临时拼凑的 Mistral 团队的水平。 2. 国内部分企业可能存在骄傲自大的情况,也可能被之前 Google 主推的 T5 技术路线带偏,同时 AGI 影响巨大,可能存在国外相关机构与 OpenAI 有特殊沟通而国内未有的情况。 3. 2023 年上半年国内笃信靠资金和卡能实现突破,但下半年纷纷转向“垂直应用”“商业化”,不提 AGI,这种转向可能是短视和致命的。 4. 大厂虽具备冲击 AGI 的资源,但受内部短期考核压力影响,多数力量用于卷新产品圈地盘和向上汇报工作,实际效果未达预期,且背负较多其他业务和政治考量。 不过,在图像类 AI 产品方面,国内产品发展迅速,部分产品如通义万相在中文理解和处理方面表现出色,具有独特优势。在 AI 生成视频工具领域,国内涌现出一系列工具,其生成结果在某些方面甚至远超国外。
2024-11-03
提示词可以在哪里下载
以下是一些可以获取提示词的途径: Dynamic Prompts 插件:勾选魔法提示词,一般选中后会后台下载提示词模型,每个大概 800m。您可以通过上面的 url 去详细了解其他的 prompt 模型。 相关网站: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru: 老六提示词插件:其 GITHUB 下载链接是:https://github.com/thisjam/sdwebuioldsixprompt ,也可在作者的网盘链接中下载。
2024-11-01
我要创建一个工作流,需要怎么创建,用到什么工具,这些工具在哪可以找到
以下是在 Coze 上创建工作流的步骤和所需工具: 1. 进入 Coze 平台,点击「个人空间工作流创建工作流」,打开创建工作流的弹窗。 2. 根据弹窗要求,自定义工作流信息,点击确认完成工作流的新建。 3. 新建完成后,整个编辑视图与功能如下: 左侧「选择节点」模块中,根据子任务需要,实际用到的有: 插件:提供一系列能力工具,拓展 Agent 的能力边界。例如涉及思维导图、英文音频等无法通过 LLM 生成的内容,就需要依赖插件来实现。 大模型:调用 LLM,实现各项文本内容的生成。例如中文翻译、英文大纲、单词注释等都依赖大模型节点。 代码:支持编写简单的 Python、JS 脚本,对数据进行处理。 编辑面板中的开始节点、结束节点,分别对应分解子任务流程图中的原文输入和结果输出环节。 4. 接下来,按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,即可完成工作流框架的搭建。 此外,在扣子平台上,插件就像一个工具箱,里面可以放一个或者多个工具,称为 API。目前扣子平台已有很多不同类型的插件,如看新闻、规划旅行、提高办公效率、理解图片内容的 API 等,还有一些能处理多种任务的模型。若现有的插件不符合需求,还可自己制作插件并加入所需的 API。工作流就像可视化的拼图游戏,可将插件、大语言模型、代码块等功能组合,由多个小块块(节点)组成,如大语言模型 LLM、自己写的代码、做判断的逻辑等,开始和结束都有特定的小块块,不同小块块可能需要不同信息才能工作,信息包括引用前面小块块给出的和自己设定的。
2024-10-29
AI能应用在哪些场景
AI 已经广泛应用于众多场景,包括但不限于以下方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 药物研发,加速研发过程。 个性化医疗,提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,降低金融机构风险。 信用评估,帮助做出贷款决策。 投资分析,辅助投资者决策。 客户服务,提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐,分析客户数据推荐感兴趣产品。 搜索和个性化,改善搜索结果和购物体验。 动态定价,根据市场需求调整产品价格。 聊天机器人,回答客户问题和解决问题。 4. 制造业: 预测性维护,预测机器故障避免停机。 质量控制,检测产品缺陷提高质量。 供应链管理,优化供应链提高效率和降低成本。 机器人自动化,控制工业机器人提高生产效率。 5. 交通运输: 自动驾驶,提高交通安全性和效率。 交通管理,优化信号灯和交通流量缓解拥堵。 物流和配送,优化路线和配送计划降低成本。 无人机送货,将货物送达偏远地区。 6. 其他应用场景: 教育,提供个性化学习体验。 农业,分析农田数据提高农作物产量和质量。 娱乐,开发虚拟现实和增强现实体验。 能源,优化能源使用提高效率。 此外,市面上还有众多具体的 AI 应用产品,如: 1. 辅助创作与学习:AI 智能写作助手、AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 2. 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 3. 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 4. 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 5. 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。 总之,AI 的应用场景还在不断扩展,未来将对我们的生活产生更加深远的影响。
2024-10-28
本站的stable diffusion在哪个分类
Stable Diffusion(简称 SD)属于图片美术类的 AIGC 项目。它是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。其代码模型权重已公开发布,可在多数配备适度 GPU 的电脑硬件上运行,当前版本为 2.1 稳定版(2022.12.7)。源代码库为 github.com/StabilityAI/stablediffusion 。 在分类上,它可以归为 AIGC 常见名词解释中的图片美术类。同时,关于 Stable Diffusion 有很多详细的教程,比如在知乎上有深入浅出完整解析其核心基础知识的内容,包括系列资源、核心基础原理、核心网络结构解析、搭建使用模型进行 AI 绘画、经典应用场景、训练自己的 AI 绘画模型等方面。
2024-10-26
主要AI工具的应用方向及优缺点
以下是一些主要 AI 工具的应用方向及优缺点: 与销售工作有关的 AI 工具: Salesforce 爱因斯坦: 优点:能通过分析大量数据集识别潜在客户,生成预测性潜在客户评分,具有自动化功能,可让销售团队专注于关键方面。 缺点:暂未提及。 Clari: 优点:专门从事智能收入运营,能创建高度准确的收入预测,统一数据并以易理解方式呈现,简化财务预测过程。 缺点:暂未提及。 Hightime: 优点:作为销售团队的 AI 助手,能处理重复性任务和耗时研究。 缺点:暂未提及。 适合软件项目经理的 AI 工具: 项目管理和任务跟踪工具:如 Jira、Trello 等,集成 AI 功能可辅助制定计划、分配任务、跟踪进度。 优点:提高管理效率。 缺点:暂未提及。 文档和协作工具:如微软 Copilot 集成到 Office 套件,云存储服务如 Google Drive 提供 AI 驱动的文档管理和协作功能。 优点:为文档撰写、编辑等提供辅助,优化协作。 缺点:暂未提及。 风险管理和决策支持工具:可帮助识别和分析项目风险,并提供决策建议。 优点:提升决策科学性。 缺点:暂未提及。 沟通和协作工具:AI 助手辅助进行团队沟通协调、客户关系维护等。 优点:优化沟通与协作。 缺点:暂未提及。 创意生成工具:如文心一格、Vega AI 等,帮助快速生成创意图像素材。 优点:提供创意支持。 缺点:暂未提及。 大淘宝设计部 2023 年度 AI 设计实践中的工具: 主要工具为 Midjourney 和 Stable Diffusion,辅助工具有 RUNWAY 和 PS beta 等。但未提及具体的优缺点。
2024-09-03
通往agi之路,比起其他agi产品有哪些优缺点?
以下是关于通往 AGI 之路与其他相关产品的一些信息: 通往 AGI 之路: 优点:由更多业余时间兼职的人组成,凭借热情和自驱迸发出能量。初心良好,选择内容开源,体现出“坦诚、无私、热情、互助”的精神。 缺点:文中未提及。 SmartGPT: 优点:具有更好的推理表现,更易配置,模块化。 缺点:尚未集成内存管理(Memory)模块。 需要注意的是,文中将通往 AGI 之路与李一舟进行了对比,李一舟选择的是内容商业化,而通往 AGI 之路选择内容开源,两者面向的群体虽有相似,但没有直接的可比性。
2024-08-26
目前国内使用率较高的AI软件有哪些?他们的优缺点总结一下
以下是目前国内使用率较高的一些 AI 软件及其优缺点总结: 图像类产品: 通义万相: 优点:在中文理解和处理方面表现出色;用户可选择多种艺术和图像风格,满足不同创作需求;生成图像质量高、细节丰富;操作界面简洁直观,用户友好度高;可与阿里其他产品和服务无缝整合;现在免费,每天签到获取灵感值。 缺点:为符合国内监管要求,某些类型图像无法生成,限制创作自由度;处理非中文语言或国际化内容方面可能不如国际工具出色;处理多元文化内容时可能存在偏差。 可灵: 优点:生成的图像质量非常高,已向所有用户开放使用。 缺点:价格相对较高,重度用户年费可能达几千元,平均每月使用成本在 400 到 600 元,轻度用户有免费点数和较便宜的包月选项。 聊天对话类产品: Kimi: 优点:具有超长上下文能力,最初支持 20 万字,现提升到 200 万字,对于处理长文本或大量信息的任务有优势,对需要长期记忆或参考大量背景信息的任务有用。 缺点:文字生成和语义理解、文字生成质量方面可能不如国内其他产品好,不支持用户自定义智能体。
2024-08-19
目前类似dify,fastgpt 自行部署的优缺点是什么
自行部署类似 Dify、FastGPT 这样的大语言模型知识库系统,其主要优缺点如下: 优点: 1. 可定制性强:自行部署可以根据自身需求对系统进行定制和扩展,满足特定场景的需求。 2. 数据隐私性好:数据存储在自己的服务器上,可以更好地控制数据的隐私和安全。 3. 部署灵活:可以根据需求在不同的环境中部署,如云服务器、本地服务器等。 4. 成本可控:相比使用公有云服务,自行部署可以更好地控制成本。 缺点: 1. 部署和维护成本高:需要投入人力和资金来完成系统的部署、配置和运维。 2. 技术门槛较高:需要有一定的机器学习和系统开发经验,对于非技术人员来说可能较为复杂。 3. 功能相对有限:公有云服务通常提供更丰富的功能和插件,自行部署可能无法完全复制。 4. 扩展性较弱:随着业务需求的增长,自行部署的系统可能难以快速扩展。 5. 更新维护成本高:需要持续关注模型和框架的更新,并进行相应的升级和维护。 总的来说,自行部署这类系统适合有一定技术实力和特定需求的用户,但对于一般用户来说,使用公有云服务可能更加便捷和经济。用户需要根据自身情况权衡利弊,选择合适的部署方式。
2024-04-24