直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

电商用图的图生图 工具怎么部署工作流

回答

以下是关于电商用图的图生图工具在 ComfyUI 中的工作流部署方法:

首先,我们可以从零开始建立工作流。清空所有节点,先加载一个模型选择器的节点,右键点击空白处,选择【add node】——【loaders】——【load checkpoint】,在这个节点里填写想要输出的尺寸和一次性生成的数量。

接下来使用 VAE 对噪声进行解码,从【LATENT】中拉出一个节点,选择【VAEDecode】,并将最开始的 VAE 节点与之相连。

然后,要输出图片,从 VAE 解码的节点中的【IMAGE】中拉出一根线,选择【SaveImage】,这样生成的图片会存放在 output 文件夹,若不想每次保存,可选择【PreviewImage】。

完成上述步骤后,就建立好了一个简单的图生图工作流。可以在右侧点击【Save】保存,下次使用时直接载入即可。

此外,打开节点树的列表,可以看到文生图、图生图以及 controlnet 等常见工作流。选择文生图,会有更细化的预设工作流选项。比如选择“文生图”中的“基础+自定 VAE”,选好后点击“替换节点树”,就会出现已连接好的工作流节点,包括大模型、clip、vae、正反提示词、尺寸、采样器等参数,且是中文面板。

基于上述基础创建工作流时,以采样器为起点,分别拉出模型、正面条件(正向提示词)、负面条件(负向提示词)、Latent(潜在空间)。注意正面条件(正向提示词)、负面条件(负向提示词)对应的 CLIP 文本提示词,要回流到模型(CheckPoint 加载器上)。在潜在空间中编码,然后 VAE 解码,输出图像。

创建图生图的工作流时,把空 Latent 换成载入图片的,图片需要编码后给到采样器,同时注意降噪,ComfyUI 中的降噪相当于 webui 中的重绘幅度。

另外,为您提供一些相关的资源:

  • 题词汉化插件:https://github.com/AlekPet/ComfyUI_Custom_Nodes_AlekPet ,集合了许多实用的功能。
  • 自定义脚本:https://github.com/pythongosssss/ComfyUI-Custom-Scripts ,用于界面的一些调整,舒适用户界面自定义脚本。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【ComfyUI】本地部署ComfyUI上手指南,我就喜欢连连看

我们就可以在这个节点里面填写想要输出的尺寸,和一次性生成的数量。接下来,我们要使用VAE来对之前的噪声进行解码,从【LATENT】中拉出一个节点,选择【VAEDecode】。建立好之后,将最开始的VAE节点与之相连。最后,我们要输出图片,从VAE解码的节点中的【IMAGE】中拉出一根线。选择【SaveImage】,这样我们每次生成的图片都会存放在output文件夹里面。如果不想每次都保存,可以选择下面的【PreviewImage】。到此为止,我们就建立好了一个简单的文生图工作流。可以在右侧点击【Save】,保存这个工作流,那么下一次我们要进行文生图操作的时候,只需要载入这个工作流就可以了,不用再重复搭建。我们填入一套提示词,来测试一下这套工作流的使用情况,点击【Queue Promot】开始渲染。出图完成,说明我们的工作流可以正常运行了,撒个花吧,庆祝我们的第一次搭建成功。放大一下看看,和webUI的成图效果没有什么区别。

【ComfyUI】Blender+Stable Diffusion!少年啊,这盛世如你所愿!(附中文汉化插件)

打开节点树的列表,可以看到我们熟悉的文生图、图生图以及controlnet等常见工作流。我们选择文生图,打开发现还有一些更细化的预设工作流选项。再看看controlnet中的工作流预设。还有一些根据插件整理的工作流,可谓是相当丰富了。我们就先随便选择一个“文生图”中的“基础+自定VAE”吧。选好之后,点击“替换节点树”。界面中就出现了已经连接好的工作流节点(如果没看到,就按一下home键),包括大模型、clip、vae、正反提示词、尺寸,采样器等所有我们在webUI中都已经熟悉的参数,而且全都是中文面板。打开模型节点,可以看到我们webUI中的模型全部都在。这个地方不知道怎么操作的朋友,可以看我的上一篇[【ComfyUI】本地部署ComfyUI上手指南,我就喜欢连连看](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487895&idx=1&sn=aa21eede16dfe4bde7e0e93e353f7357&chksm=c2514753f526ce451175f654a93f48b526fc6de3e3b1564b218db41f7e3f99df5a84bb887043&scene=21#wechat_redirect)。

WebUI到 Comyfui的过渡需要了解的

基于上面的一些基础,我们在comfyui里面创建一个简单的工作流。以为采样器为起点,分别拉出来模型、正面条件(正向提示词)、负面条件(负向提示词)、Latent(潜在空间)这里我们注意一下,正面条件(正向提示词)、负面条件(负向提示词)对应的CLIP文本提示词,要回流到模型(CheckPoint加载器上)在潜在空间中编码,然后VAE解码,输出图像。另外,我们输入给潜在空间的信息,都应该是编码过后的,不然是链接不起来的基于上面的,我们可以创建图生图的工作流,在里面,就需要把上面的空Latent换成载入图片的,之后,图片也需要编码后给到采样器。然后注意下降噪,在图生图里面,comfyui的降噪就是webui中的重绘幅度。然后,我们放慢点,看下工作流的顺序,希望对大家的理解有帮助另外:题词汉化插件:https://github.com/AlekPet/ComfyUI_Custom_Nodes_AlekPet集合了许多实用的功能自定义脚本:https://github.com/pythongosssss/ComfyUI-Custom-Scripts用于界面的一些调整,舒适用户界面自定义脚本。

其他人在问
在国内可以免费用的图生视频的ai工具
以下是在国内可以免费用的图生视频的 AI 工具: 1. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps,文生视频,支持中文,时空理解。 3. Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以,文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸,图生视频、视频生视频除了尺寸不可选以外,其他跟文生视频基本相同,默认生成 3s 的视频。 4. 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文,文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸,图生视频除了不可运镜控制以外,其他跟文生视频基本相同,默认生成 5s 的视频。 此外,还有一些国内外提供文生视频功能的产品推荐: 1. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-20
图生视频的ai工具
以下是一些图生视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:若熟悉 Stable Diffusion,可安装此最新插件,能在图片基础上直接生成视频,由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 根据视频脚本生成短视频的 AI 工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频所需要素并生成对应素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化的视频内容。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 关于清影的图生视频: 输入一张图片加相应提示词,清影大模型会根据提示将图片转变为视频画面。也可以只输入一张图片,清影大模型将自行发挥想象力把图片扩展为有故事的视频。有两个小技巧: 1. 选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),支持上传 png 和 jpeg 图像。若原图不够清晰,可采用分辨率提升工具。 2. 提示词要简单清晰。可以选择不写 prompt,直接让模型操控图片动起来;或者明确想动起来的主体,并以“主体+主题运动+背景+背景运动”的方式撰写提示词(一定要有主体,不然可能会出现 AI 狂乱景象)。若不明确大模型如何理解图片,推荐将照片发送到清言对话框进行识图,明确主体的描述。
2024-12-20
目前我已经有了一个可以文生视频或者图生视频的模型但是只能6秒,我要如何利用agent自动流实现这个模型可以生成更长,更可靠质量的视频呢
要利用 agent 自动流实现生成更长、更可靠质量的视频,您可以参考以下几种模型和方法: 1. PixVerse V2 模型: 8 秒的视频生成需要花费 30 Credits,5 秒的视频生成需要花费 15 Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。 目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 2. Meta Movie Gen 模型: Movie Gen 由视频生成和音频生成两个模型组成。 Movie Gen Video:30B 参数 Transformer 模型,可以从单个文本提示生成 16 秒、16 帧每秒的高清视频,相当于 73K 个视频 tokens。对于精确视频编辑,它可以执行添加、删除或替换元素,或背景替换、样式更改等全局修改。对于个性化视频,它在保持角色身份一致性和运动自然性方面取得 SOTA 性能。 Movie Gen Audio:13B 参数 Transformer 模型,可以接受视频输入以及可选的文本提示,生成与视频同步的高保真音频。 Movie Gen Video 通过预训练微调范式完成,在骨干网络架构上,它沿用了 Transformer,特别是 Llama3 的许多设计。预训练阶段在海量的视频文本和图像文本数据集上进行联合训练,学习对视觉世界的理解。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调,以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果,模型还引入了流匹配(Flow Matching)作为训练目标,这使得视频生成的效果在精度和细节表现上优于扩散模型。 3. Sora 模型: 文生视频,图生视频,视频生视频,支持多种视频定制选项,如分辨率(从 480p 到 1080p)、视频长度(从 5 秒到更长时间)和视频风格。用户可以浏览社区共享的视频,获取灵感和学习技巧(直接抄别人 prompt)。 故事板:允许用户通过时间线指导视频中的多个动作,创建更加复杂的视频序列。 混音和编辑:提供视频混音功能,允许用户将视频转换成新的风格。支持视频的延伸和剪辑,以及创建循环视频。 高级功能:包括混合功能,可以将两个视频场景合并成一个新的场景。 对于已经拥有 OpenAI Plus 或 Pro 账户的用户,Sora 的使用是包含在现有订阅中的,无需额外支付费用。OpenAI Plus 订阅每月 50 次视频生成次数;OpenAI Pro 订阅无限次慢速队列生成,500 次正常速度的视频生成次数。用户可以根据需要选择更高分辨率的视频生成,但这可能会减少每月的使用次数。Sora 的发布初期,对于某些地区(如欧洲和英国)可能会有延迟。
2024-12-19
nova有个图生视频的功能,但是只能生成6秒钟,我要如何组合服务去实现可以文生长视频并且也可以图生长视频呢
以下是一些实现文生长视频和图生长视频的方法: 1. 使用 PixVerse V2 模型: 单个视频生成(8s):8s 的视频生成需要花费 30 Credits,5s 的视频生成需要花费 15 Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 2. 利用 runway: 视频的大部分片段用 runway(https://app.runwayml.com/)制作,少数的片段用的是即梦(https://jimeng.jianying.com/aitool/home)的动效画板和首尾帧。 以汽车内饰这一片段为例,登录 runway 账户后,在首页的左侧点击“Text/Imagine to Video”,中文即是“文生视频/图生视频”。点击 2 处将汽车内饰的图片上传到 runway 中。其中 1 处可以更改生成图片所用到的大模型版本,数字越大代表模型越强。目前只有 Gen2 每天有免费额度。3 处用于输入提示词。4 处可以修改生成的视频时长为 5s 或 10s,时长越长,生成的效果可能越不稳定。5 处可以看到生成的结果。提示词方框中输入的运镜方式“Roll Clockwise Shot slowly”是,即摄像机围绕垂直轴顺时针旋转,常用于创造动态的、有时令人眩晕的视觉效果。不想动脑的话,每个片段的运镜方式根据分镜表的建议来即可。运镜提示词该如何填写呢?可以参照:。runway 对于这些专有的运镜方式理解的很好。其他的提示词可以不填,先看看效果,如果效果不好,再补充简短的提示词重新生成视频。很多时候提示词过多,生成的视频就很怪异,像吃了毒蘑菇后看到的幻觉一样。改变提示词,改变生成时长,多抽卡几次,毕竟 runway 会员可以无限抽卡。 3. 海外产品 viva: viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。支持文本生成视频、图片生成视频以及 4K 分辨率放大功能,另外也支持提示词的自动优化。文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频。
2024-12-19
多图生成视频方案
以下是关于多图生成视频的几种方案: 1. 方法一: 利用 MJ 画图,先画出来一张想要的底图。 使用 InsightFaceSwap 这个插件来换脸或者让脸部更像,但因该插件对多人脸部同时处理效果不好,所以先需要进行图片的分割裁剪,分别利用插件处理后,再把图片重新缝合。 最后利用可灵或者其他软件来让图片动起来。 2. 方法二: 直接在网上寻找能够融合两张照片的软件或者项目,直接对图片进行融合。如果没有,就纯 P 图,然后利用图生视频的项目完成内容。 3. 利用现有的知识和工具,如具备 DiT(能够进行图片生成),把视频生成看作独立的图片生成,使用 DiT 生成多帧图片然后串起来就是视频,但这样可能会导致生成的多帧图像不连贯。 4. 使用视频工具 VIGGLE: Mix 模式:先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成一段新视频,能模拟出角色的 3D 状态,准确还原复杂动作。 Multi 模式:通过视频的动作,将上传的多个角色进行识别并赋予动作,形成一段新视频。 Move 模式:将视频的动作直接映射在图片人物身上,实现“让静态图动起来”。 您可以根据实际需求和操作难度选择适合您的方案。
2024-12-19
免费的图生视频软件有推荐吗
以下是为您推荐的免费图生视频软件: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果您熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Kaiber:这是一款视频转视频 AI,能够将原视频转换成各种风格的视频。 此外,您还可以通过以下途径获取更多相关信息: 1. 更多的文生视频的网站可以查看: 2. Vidu 全球上线,Web 端访问:https://www.vidu.studio/ ,具有极速生成、动漫风格、角色可控、精准理解、大片质感等特点。 关于 SVD 图生视频模型的下载和使用: 1. 下载模型:最新模型在前面,建议除开第一个模型都下载。 https://huggingface.co/stabilityai/sv3d/ 【Stable Video 3D模型,最新模型,生成图片 3D 旋转视频,暂时没测试是否能支持】 https://huggingface.co/stabilityai/stablevideodiffusionimg2vidxt11/ 【SVD 1.1 XT 版,支持生成 1024x576 分辨率每秒 14 帧视频,优化了文件大小,提高生成效率】 https://huggingface.co/stabilityai/stablevideodiffusionimg2vidxt 【SVD 1.0 XT 版,支持生成 1024x576 分辨率生成每秒 25 帧视频】 https://huggingface.co/stabilityai/stablevideodiffusionimg2vid 【SVD1.0 版,支持生成生成 1024x576 分辨率每秒 14 帧视频】 2. 放置模型:下载好的 SVD 图生视频模型放置在指定文件夹下。 3. 使用方法:Controlnet 中上传原图选择深度,预处理器可选择不同算法,右侧深度模型记得选择深度模型,获得需要的深度图。结合大模型和提示词,利用文生图就可以生成图片。然后上传制作好的图片,选择 SVD 图生视频大模型,设置参数,生成视频。 内容由 AI 大模型生成,请仔细甄别。
2024-12-19
AI作品是否能够商用
AI 作品能否商用取决于多种因素。 一些 AIGC 艺术家认为,好的 AIGC 作品应具备美感、创意和值得思考的故事内核。在商业应用方面,比如在广告行业等细分领域已经有一定的应用。 生成式 AI 在艺术创作领域,如 Midjourney 和 Stable Diffusion 等产品允许用户输入提示和风格,并接收独特的艺术作品。从消费者“仅为了娱乐”地创造内容,到创作者或个体创业者通过内容实现盈利都有可能性。 智谱 AI 的部分开源模型(如 ChatGLM 系列)在填写问卷进行登记后允许免费商业使用,但模型可能犯错,由于模型回答造成的后果,智谱 AI 不承担相应责任。
2024-09-18
陪护机器人最快多久能正式商用?
目前,在幼教场景中正在开发的陪伴机器人,预计半年内视频生成技术成熟,届时可实现一些创新功能。但对于陪护机器人整体的正式商用时间,由于不同应用场景和技术发展的差异,还难以给出确切的时间。在医疗领域,由 AI 驱动的护理机器人会早于手术机器人应用,但具体商用时间也不确定。总体而言,陪护机器人的正式商用时间受多种因素影响,仍需进一步观察和等待技术的发展与完善。
2024-09-04
电商用什么ai工具
以下是一些适用于电商的 AI 工具及使用 AI 完成阿里巴巴营销技巧和产品页面优化的方法: 电商 AI 工具: 1. 清酒整理的电商 AI 工具:收集了十几款电商领域能用得上的 AI 工具,结合场景特别直观;按照电商的角色进行了区分,无论您是买家、卖家、渠道还是生产者,都能找到合适的 AI 工具;不仅有产品形态,还有非常具体的使用描述。 2. 常用于营销领域的 AI 工具: Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频。提供多种定价计划,从免费到商业级不等,可用于制作营销视频、产品演示等。 HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频。适合制作营销视频和虚拟主持人等。 Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等。提供多种语气和风格选择,写作质量较高。 Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容。有免费和付费两种计划。 Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等。提供多种语气和行业定制选项。 更多的营销产品可以查看 WaytoAGI 网站:https://www.waytoagi.com/sites?tag=8 。总的来说,这些 AI 工具能够帮助营销人员高效创作各种营销内容,提高工作效率。用户可根据实际需求选择合适的工具。 使用 AI 完成阿里巴巴营销技巧和产品页面优化的方法: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况。AI 可以处理大量数据,快速识别出哪些产品受欢迎、价格区间、销量等关键信息。 2. 关键词优化:AI 可以分析和推荐高流量、高转化的关键词,帮助卖家优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:AI 设计工具可以根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:AI 文案工具可以撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:AI 图像识别技术可以帮助选择或生成高质量的产品图片,这些图片能够更好地吸引顾客并展示产品特点。 6. 价格策略:AI 可以分析不同价格点对销量的影响,帮助卖家制定有竞争力的价格策略。 7. 客户反馈分析:AI 可以分析客户评价和反馈,帮助卖家了解客户需求,优化产品和服务。 8. 个性化推荐:AI 可以根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。
2024-08-28
AI音乐用于商用作品中,是否侵权
AI 音乐用于商用作品中是否侵权,情况较为复杂。 一方面,索尼音乐集团近日指控 AI 开发者在未经授权的情况下,使用索尼的知识产权来训练 AI 模型,并收集索尼拥有的媒体数据,可能侵犯了其版权。索尼音乐集团在其官方网站上发布声明,并通过信件形式向超过 700 名 AI 开发者和流媒体服务发出警告,明确禁止使用索尼的音乐、歌词、音乐视频和专辑封面等媒体内容用于 AI 系统的“训练、开发或商业化”。 另一方面,Rightsify 公司发布的 Hydra II 是基于完全授权音乐训练的音乐生成人工智能,其生成的音乐可以在全球范围内的任何商业项目中永久使用,没有任何限制。 目前,对于在未经许可的情况下使用音乐录音训练 AI 系统是否构成版权侵犯,尚不清楚。但随着生成音频质量的不断提升,AI 技术在音乐领域的应用越来越受到主流听众的关注。索尼音乐集团的这一警告可能会对 AI 技术在音乐产业的进一步发展造成影响。有人认为,AI 开发者应该被允许从互联网上免费获取的数据中学习,但版权保护的不确定性对任何人都不利,现在是更新知识产权法律以适应生成性 AI 时代的关键时刻。
2024-08-23
用别人的模型出图商用 会侵权吗
使用别人的模型出图商用是否侵权,需要根据具体情况来判断。 以腾讯混元大模型为例,其适用场景包括给自己或身边人做头像、公众号和媒体版面排版时的文字配图、制作海报、PPT 的素材以及广告配图等。但需要注意的是,腾讯混元大模型并不主张生成图片的版权,且原素材涉及到的版权风险可能存在争议。比如,如果用混元生成了某个 IP 如皮卡丘、米奇老鼠等,或者某个名人的真人脸,都可能存在侵权风险。建议在使用配图过程中尽量避免此类情况。如果最终使用了腾讯混元大模型生成的图片,应注明“由腾讯混元大模型生成”。 从全国首例 AI 生成图片著作权案例解读来看,软件设计者通过设计算法训练出智能模型,对模型设计投入了智力成果。但图片是由创作者根据个人意愿,选取提示词、修改参数等步骤得出的最终成品,著作权属于人类创作者。尽管 AI 是工具,但法院强调著作权仍然属于人类创作者,保护了人类在知识产权领域的权益。 根据《中华人民共和国著作权法》第十一条规定,著作权属于作者,创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。在未显示作者身份信息的情况下使用图片可能构成侵权。
2024-07-22
知识库中的提示词可以商用吗?
不可以。 WaytoAGI 提示词的阅读、复制都无限制,欢迎大家分享(请勿搬运)。但是,开放不代表可以随意搬运,未经授权禁止搬运内容,也不允许商用。
2024-05-10
怎么部署dify到ecs
部署 Dify 到 ECS 有以下几种方法: 方法一:通过云服务器、Dify 和智能微秘书免费搭建微信机器人 参考链接:https://docs.dify.ai/v/zhhans/gettingstarted/installselfhosted/dockercompose 这些命令在宝塔面板的终端安装。dockercompose 文件在 /root/dify/docker 目录下,可修改和学习其中文件的含义。 检查运行情况,使用 docker compose ps 命令,如果 nginx 容器无法运行,可能是 80 端口被占用,可将终端输出的代码粘贴给 AI 来解决。 在浏览器地址栏输入公网 IP(可在腾讯云服务器或宝塔面板地址栏查看,去掉后面的:8888),随便填邮箱密码建立知识库,选择模型(如智谱 AI,获取钥匙并复制保存),创建应用进行测试和发布。 方法二:腾讯云一键部署 打开腾讯云官网,在左上角【最新活动】进入,新老用户均可享受优惠。 Dify 社区版官方要求 2 核 4G,可根据需求选择境内或境外服务器。境内服务器 159 一年。 选好后创建服务器,选择【使用应用模板创建】【AI】,初始化完成后,在控制台服务器中复制公网 IP 到浏览器(加上 /apps),进入 Dify 安装页面,设置管理员账号密码,正常情况下即可进入 Dify 网站配置模型服务。 方法三:云服务器 Docker 部署 左侧菜单栏文件打开终端,根据 Dify 官方的部署文档操作。 敲入 git 命令(把 Dify 的代码复制到服务器),显示 100%即复制完成。 依次敲下面三个命令,出现相应结果即为成功。 使用方法与方案一相同。 更新时根据官方文档,在 BT 页面的文件中打开终端,按顺序执行命令。同时注意同步环境变量配置,如果.env.example 文件有更新,务必同步修改本地的.env 文件,检查并确保配置项与实际运行环境相匹配。
2024-12-18
如何部署本地的智能数据库
以下是关于如何部署本地智能数据库的详细步骤: 1. 引言: 作者是致力于使用 AI 工具将自己打造为超级个体的程序员,目前沉浸于 AI Agent 研究。 本文将分享如何部署本地大模型以及搭建个人知识库,让您了解相关流程和技术。 2. 本地知识库进阶: 若要更灵活掌控知识库,可使用额外软件 AnythingLLM,它包含所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 AnythingLLM 中有 Workspace 的概念,可创建独有 Workspace 与其他项目数据隔离。 构建本地知识库的步骤: 首先创建一个工作空间。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,包括 Chat 模式(大模型根据训练数据和上传文档综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 完成配置后即可进行测试对话。 3. 写在最后: 作者推崇“看十遍不如实操一遍,实操十遍不如分享一遍”。 若对 AI Agent 技术感兴趣,可联系作者或加入其免费知识星球(备注 AGI 知识库)。
2024-12-02
你的知识库是怎么部署的
部署个人知识库需要考虑硬件配置和相关技术原理。 硬件方面: 生成文字大模型,最低配置为 8G RAM + 4G VRAM,建议配置为 16G RAM + 8G VRAM,理想配置为 32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型)。 生成图片大模型(比如跑 SD),最低配置为 16G RAM + 4G VRAM,建议配置为 32G RAM + 12G VRAM。 生成音频大模型,最低配置为 8G VRAM,建议配置为 24G VRAM。 技术原理方面: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在这个过程中,首先检索外部数据,然后在生成步骤中将这些数据传递给 LLM。 RAG 应用包括文档加载、文本分割、存储、检索和输出这 5 个过程。 文档加载:从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器。 文本分割:把 Documents 切分为指定大小的块。 存储:涉及将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 检索:通过某种检索算法找到与输入问题相似的嵌入片。 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 此外,搭建基于 GPT API 的定制化知识库,涉及给 GPT 输入(投喂)定制化的知识。GPT3.5 一次交互(输入和输出)只支持最高 4096 个 Token。为了处理大量领域知识,OpenAI 提供了 embedding API 解决方案。embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度。
2024-11-11
本地部署的AI工具
以下是关于本地部署的 AI 工具的相关信息: 目前市面上的 AI 工具分为线上和线下本地部署两种: 线上的优势:出图速度快,不依赖本地显卡配置,无需下载大型模型,能查看其他创作者的作品,但出图分辨率受限,一般最高支持 1024×1024 左右,制作横板、高清图片会受影响。 线下部署的优势:可以添加插件,不卡算力,出图质量高。但使用时电脑基本处于宕机状态,配置不高可能会出现爆显存导致出图失败的情况。 具体的部署步骤(以 windows10 系统为例,mac 系统步骤类似,命令有所不同): 1. 安装环境: 点击电脑“系统”,输入“cmd”,回车打开命令窗口。 在命令窗口中,粘贴代码确认是否有 python 和 pip。 若没有,需安装:先安装 python,安装包可通过下载,按照步骤安装,关闭窗口再次运行命令确认。 2. 部署项目: 下载 COW 机器人项目并解压缩。 回到 chatgptonwechat/文件路径下,空白处右键,打开 Powershell 复制粘贴“python app.py”,弹出二维码扫码登录。 注意事项: 1. 程序在本地运行,关闭窗口进程结束,若要持续使用需保持窗口打开和运行。 2. 若突然不管用,可点击窗口并按空格。 3. 配置时,在 config.json 中的 OpneAi_Api 填“http://localhost:3000/api/v1/chat/completions”。 对于游戏截图升级到 KV 品质的应用,可充分发挥线上和线下平台的优势:线上找参考、测试模型,线下作为主要出图工具。先在线上绘图网站的绘图广场发现想要的画风,点击创作获取模型 lora 和 tag,截取游戏人物底图将线上算力集中在人物身上,多批次尝试不同画风得出合适模型+lora 组合,最后在 C 站()下载对应模型到本地加载部署后正式生图。
2024-11-10
Mac部署stable diffusion
在 Mac 上部署 Stable Diffusion 存在一定限制,功能可能不全且出错率偏高,严重影响使用体验。个人建议升级设备或者采用云服务器玩耍。 如果您仍想在 Mac 上部署,可以参考以下步骤: 1. 电脑硬件要求: 系统:无明确针对 Mac 的特定系统要求。 显卡:未明确针对 Mac 的显卡要求。 硬盘:留有足够的空间,最低 100G 起步(包括模型)。 2. 环境安装: 未提供 Mac 系统下的具体环境安装步骤。 由于 Mac 系统的特殊性,更推荐您采用云端部署的方式,相关教程可参考:https://qa3dhma45mc.feishu.cn/wiki/A6WYw1Nm0ikGplkuO9Ecwomqnnd
2024-11-06
联想异能者配置i5-12450八核,32GB内存,1TB固态硬盘,用于本地部署开源大模型可以部署哪些开源大模型
以下是一些您的联想异能者配置(i512450 八核,32GB 内存,1TB 固态硬盘)可部署的开源大模型及相关信息: ComfyUI 相比 WebUI 配置更低,系统资源占用更少,出图速度更快。ComfyUI 最低可在小于 3G 的 GPU 上运行,甚至没有 GPU 光用 CPU 也可以运行,但速度极慢。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。玩 SDwebui 和 ComfyUI 建议使用 6GB 以上的显存的 NVIDIA 显卡(N 卡),内存在 16G 以上。硬盘会影响加载模型的速度,所以最好把软件和模型部署在 SSD(固态硬盘)上。 截止 2024 年 5 月,主流的 AI 笔记本电脑主要是一些专门为人工智能和深度学习设计的高性能移动工作站。一些知名品牌包括微软第 11 代 Surface Pro、微星 Creator/Workstation 系列、技嘉 Aero/Aorus 系列、戴尔 Precision 移动工作站、惠普 ZBook 移动工作站、联想 ThinkPad P 系列。这些笔记本通常配备强大的 GPU(如 NVIDIA RTX 系列)、大容量内存(32GB 以上)和高速固态硬盘,还通常预装了 NVIDIA CUDA、cuDNN 等深度学习框架,以及各种 AI 开发工具。但这类高端 AI 笔记本价格相对较高,通常在 2000 美元以上。用户可根据自身需求和预算选择合适型号,并关注散热、续航等实际使用体验。 请注意,配置上不封顶,您可根据自己的需求和预算来选择。
2024-11-04
制作ppt 的 ai 工具
以下是一些制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,增强演示文稿吸引力,网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,包含互动元素和动画效果,网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 此外,在教学中帮助学生做好组会准备时,Claude 和 Gamma.app 这两个工具组合使用效果较好。Claude 可帮助快速寻找符合条件的论文、提取精炼论文中某部分信息等。
2024-12-21
请给我推荐介绍 适合写网络小说的AI工具?
以下是一些适合写网络小说的 AI 工具及相关信息: 工具与网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址: 将小说制作成视频的一般流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-21
推荐一个AI工具,帮助我每天自动执行以下步骤:从本地上传文件给大模型,该文件内含有新闻网页链接,大模型读取链接并汇总内容
以下为您推荐的 AI 工具可能有助于您实现每天自动执行从本地上传文件给大模型,并让大模型读取文件内新闻网页链接并汇总内容的需求: 1. AI 拍立得(Pailido): 特点:即拍即得,简化流程,操作直观高效。 体验方式:微信小程序搜索“Pailido”。 交互逻辑:用户选择拍摄场景类型并拍照,AI 自动识别和分析照片内容信息,依据预设场景规则迅速生成符合情境的反馈。 实现场景: 图片转成文本:用户上传图片后,大模型根据选择的场景生成相关文字描述或解说文本,可用于生成美食点评、朋友圈发布文案、闲鱼上架示例模版等。 图片转绘图片:用户上传图片后,大模型按照指定风格快速生成图像的转绘版本,适应不同风格和场景需求,如图片粘土风、图片积木风、图片像素风等。 2. 内容仿写 AI 工具: 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ ,是智能写作助手,支持多种文体写作,如心得体会、公文写作、演讲稿、小说、论文等,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发的智能创作助手,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-21
当前有哪些热门AI工具
以下是一些当前热门的 AI 工具: 儿童练习英语口语的 AI 工具: LingoDeer:使用游戏和互动活动教孩子英语,提供各种课程,有家长仪表板。 Busuu:提供英语等多种语言课程,有多种教学方法和社区功能。 Memrise:使用抽认卡和游戏教学,有社交功能。 Rosetta Stone:使用沉浸式方法,有语音识别功能。 Duolingo:免费,使用游戏化方法,课程多样。 制作 PPT 的 AI 工具: Gamma:在线制作网站,可通过输入提示生成幻灯片,支持嵌入多媒体。 美图 AI PPT:输入文本描述生成专业设计,有丰富模板库。 Mindshow:提供智能设计功能,简化设计流程。 讯飞智文:利用语音识别和自然语言处理技术,提供多种编辑功能。 辅助写邮件的 AI 工具: Grammarly:提供语法检查、拼写纠正等功能,支持多平台和多种语言。 Hemingway Editor:简化句子结构,提高可读性。 ProWritingAid:全面的语法和风格检查,提供详细写作报告。 Writesonic:基于 AI 生成各种文本,生成速度快。 Lavender:专注邮件写作优化,提供个性化建议和模板。 在选择工具时,需考虑使用者的年龄、兴趣、学习风格、功能和成本等因素。
2024-12-21
有没有免费是数字人工具
以下是一些免费的数字人工具: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。 上传后效果如图所示,My Avatar处显示上传的照片。 点开大图后,点击Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击上面的网址,点击右上角的Create vedio。 选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击Generate vedio就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法: 点击上面的网址,注册后获得120免费k币,选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。 此外,还有一些常用于营销领域且可制作数字人的工具,如Synthesia、HeyGen等。更多数字人工具请访问相关网站查看。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-12-21
🚀接着上期SOP+AI:打造职场高效能人士的秘密武器的分享,今天继续聊聊SOP+AI的应用,🎯今天的主题是“怎样利用AI节约10倍内容创作时间?”📚最近跟团队有开始运营小红书账号,就想着先给自己打造点顺手的工具,于是乎「小红书文案专家」就出生啦~🎉[heading1]一、先介绍下我们小Bot[content]🛺BOT名称:小红书文案专家功能价值:见过多个爆款文案长啥样,只需输入一个网页链接或视频链接,就能生成对应的小红书文案,可以辅助创作者生成可以一键复制发布的初稿,提供创意和内容,1
以下是关于“SOP+AI”的相关内容: 怎样利用 AI 节约 10 倍内容创作时间? 最近团队开始运营小红书账号,于是打造了“小红书文案专家”。 BOT 名称:小红书文案专家 功能价值:见过多个爆款文案,输入网页或视频链接就能生成对应的小红书文案,辅助创作者生成可一键复制发布的初稿,提供创意和内容,节约 10 倍文字内容创作时间。 应用链接:https://www.coze.cn/s/ij5C6LWd/ 设计思路: 痛点:个人时间有限,希望有人写初稿并生成配图。 实现思路:为自己和团队设计工作流,让 AI 按运营思路和流程工作。 一期产品功能: 1. 提取任何链接中的标题和内容。 2. 按小红书平台文案风格重新整理内容。 3. 加入 emoji 表情包,使文案更有活力。 4. 为文案配图片。 二期计划功能:持续优化升级,增加全网搜索热点功能,提炼热点新闻或事件关键信息,结合用户想要生成的内容方向输出文案和配图。 SOP+AI:打造职场高效能人士的秘密武器 案例分享:X 公司客服团队引入 SOP 和 AI 助手后,工作效率显著提升。引入 SOP 前,客服工作流程混乱,效率低下,客户满意度不高。引入 SOP 标准化操作后,效率提高。进一步引入 AI 助手,自动回复常见问题、处理简单请求,减少客服工作量,还能及时发现问题帮助优化。结果客服团队工作效率提升 30%以上,客户满意度显著提高。SOP 能提升效率、减少失误、促进协作,借助 AI 助手,SOP 制定和优化更高效智能。
2024-12-20