直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

mj如何指定生成16:9的图

回答

要在 Midjourney(MJ)中指定生成 16:9 的图,可以按照以下步骤操作:

  1. 首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt[图像网址]”。
  2. 回到官网,复制图像的提示词,再回到 discord 粘贴到刚才拷贝的网址后面,注意空一格。
  3. 生成图像后,放大觉得还不错的一张,点击“Custom Zoom”。
  4. 此时可以改变拉伸镜头后的画面比例,将“--ar”这个参数后面的数值改成 16:9(默认的方形构图这里是 1:1),“--zoom”参数设置为 1.5。“--zoom”参数是镜头拉伸的倍数,1.5 - 1.7 比较靠谱,太大(比如 2)会有更大几率生成一些莫名其妙的东西。
  5. 选一张比较好的放大一下,就可以放进 PPT 调整构图。如果构图还是不太好,可以在当前这张图的基础上再用一次“Zoom Out 1.5x”。

另外,在 Pika 中使用 MJ 生成图片时,默认的照片幅度是 16:9。在使用 MJ 进行图生图功能时,要注意截图的对标比例未必是标准的 9:16,可以手动修改一下比例,以省去一些返工的情况。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

MJ应用篇 快速给PPT配图

[heading2]稍微高级一点的薅[heading3]复制图像链接[content]这时候我们需要首先复制一下图片的网址:然后打开discord,在聊天栏输入/imagine prompt[图像网址][heading3]复制提示词[content]之后再回到官网,把图像的提示词也复制下来再回discord黏贴到刚才拷贝的网址后面,注意空个格[heading3]生成图像[content]都搞好以后输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图,注意:非自己做的图无法获得random seed所以不能弄得完全一样,如果效果不理想多反复生成几次吧。之后放大觉得还不错的一张,在放大的图里做如下步骤:[heading3]改变比例和镜头拉远[content]首先,点这个Custom Zoom此时可以改变拉伸镜头后的画面比例,如果是屏显PPT一般用16:9,如下图,把--ar这个参数后面的数值改成16:9(默认的方形构图这里是1:1)--zoom参数设置为1.5--zoom参数是镜头拉伸的倍数,1.5~1.7比较靠谱,太大(比如2)会有更大几率生成一些莫名其妙的东西[heading3]检查构图[content]选一张比较好的放大一下,就可以放进PPT调整构图了。构图如果没问题可以直接跳到:[6.提升分辨率](https://waytoagi.feishu.cn/docx/PF9Kdj7gXo0XeVxziCicWYytnVh#doxcn0yGP81zcgAUhSoeXsAsDrc)如果构图还是不太好的话可以在当前这张图的基础上再用一次Zoom Out 1.5x,这样做和直接2x不同,不会有太多奇怪的东西进来。这时候的构图可能就差不多了,选一张比较好的放大出来试试

Pika介绍及使用指南

首先,完整输出<Initialization>中的内容进行自我介绍(例如,大师:您好,我是MidJourney图片生成大师……)。然后,接收用户发送的故事内容,并询问该段内容需要分几个镜头(例如,大师:请问需要分几个镜头呢?没有特别说明我可以自动帮您分镜)。然后,询问分镜中的人物外貌长什么样子。然后,询问照片幅度是什么样子的,默认是16:9。然后,询问用户想要的画面风格,这个画面风格将会是贯穿整个分镜图片的画面风格。然后,使用英文输出分镜内容,如果某个分镜内容缺失了,要根据分镜上下文来进行补充。每个分镜的输出格式为:分镜描述,人物描述,环境描述,氛围描述,灯光描述,色彩描述,构图描述,风格描述在每个描述后面都加入--ar 16:9(最后的结尾没有句号)解释如下:分镜描述:描述这个镜头下的艺术表现手法,用华丽的辞藻来叙述。人物描述:描述故事主人公的性别、年龄、身高、体重、穿着衣服的外貌。环境描述:在这个分镜下,周遭环境是什么样子的。如果用户给出的内容没有提起环境内容,就需要大师自行补充环境内容。氛围描述:根据当前分镜词和用户提供的内容推理出氛围描述。灯光描述:例如,顶光的、雾气光、漫反射的、强对比的。色彩描述:例如,(色彩三要素)低饱和度的、颜色鲜艳的、花里胡哨的、强反射的、主色调、某种颜色是accent color。

WTF:1w粉 - 10w粉仅仅用时 13 天,像素级拆解《动物时装秀》

接下来讲一下MJ的使用,有一些要注意的地方。MJ也有图生图的功能。命令:/describe选择image上传本地图片即可,会获取到上传图片的四条提示词。点击下方的标签可以直接生成对应提示词的四张图。此时要注意:咱们截图的对标比例未必是标准的9:16咱们可以在点,手动修改一下比例,这样可以省去一些返工的情况。(别学我,--ar我当时就是忘改了)大家自行对比反推的词和对标的相似程度,自己再微调一下。可以看到describe,根据对标图反推出来的效果不算特别好。但是可以给大家一点方向,大家根据推出的词自行修改即可,也可以直接用我下面分享的这个提示词。(我用括号括起来的地方大家可以自行替换)提示词分享:Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,high-end design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera--ar 9:16--style raw中文:拟人(老鼠),时尚t台,全身,(穿着红色东北大花夹克),拟人,高端设计风格,酷炫,修长身材,米兰时装秀,全身,动态捕捉t台秀,正面视角,面向镜头这时候我就遇到了最难受的点,就是死活画不出来一个拟人形态的龙。这里其实就是MJ理解的一个问题,咱们确实描述了,但是它理解的和我们描述的并不一致,并不是它画不出来,而是我们的描述不够准确。对于龙,MJ的理解其实是dragon=中国人,这个时候我们就需要加强描述词,首先可以把断开的提示词连成一句话,一条亚洲龙站在时尚秀场上。此时MJ就可以正确理解咱们的意思了。

其他人在问
如何利用自动对齐技术,确保16位不同地点的人员录制的同一句口号音频同步且整齐,请推荐具有此功能的音频编辑工具、网站或AI工具,以便将这16段音频精确叠加并融合成一个协调一致的整体
以下是关于利用自动对齐技术确保 16 位不同地点人员录制的同一句口号音频同步且整齐的相关信息及工具推荐: 在音频编辑中,常见的步骤如下: 1. 选择合适的数字音频工作站(DAW),如 Studio One。上传 FLAC 无损格式的音频,只对融合部分进行 Inpaint 处理,保持其他音频信息不变,以避免音质问题。 2. 在 DAW 中对接音轨后,播放试听,并缩放波形图,检查波形是否正确对齐。若出现波形未对齐或播放时有咔哒声等问题,可能是在导出和处理过程中对音频施加了额外的效果器处理,如混响、限制器、压缩等,导致音频前后不一致,影响对接效果。因此,需要确保在不同的导出和处理步骤中,音频不受到额外的处理,或者在每次处理时保持相同的效果设置。 具有此功能的音频编辑工具和网站包括: 1. Studio One:可用于对齐拼接音轨,并进行后续的叠加额外音轨、调整音量和平衡等操作,以丰富音频的层次,注意叠加后各音轨的电平,避免过载或失衡。 2. Udio:具有混音功能,可对现有剪辑进行微妙或明显的变化。在提示框中有新的区域,通过滑块控制混音效果的强度。 此外,阿里的相关研究全面概述了大语言模型自动对齐的主要技术路径,将现有的自动对齐方法分为四大类:利用模型固有偏好实现对齐、通过模仿其他模型行为实现对齐、利用其他模型反馈实现对齐、通过环境交互获得对齐信号,并探讨了自动对齐背后的机理以及实现有效自动对齐的关键因素。但此研究主要针对大语言模型,对于音频对齐的直接应用可能有限。
2024-10-17
写一个将16进制转换为字符串的代码
很抱歉,暂时没有关于将 16 进制转换为字符串的代码内容。但通常来说,在大多数编程语言中,您可以使用相应的函数或方法来实现这个功能。以下是一个使用 Python 语言实现的示例代码: ```python def hex_to_str: return bytes.fromhex hex_value = "48656c6c6f" 这是 "Hello" 的 16 进制表示 print ``` 您可以根据您使用的具体编程语言,查找相关的文档和函数来完成这个转换。
2024-09-16
蛟龙16pro配置(处理器R7-7745HX,显卡RTX4060 8G,硬盘512GPCIE4.0SSD)可以用于审计人员本地化部署大模型用于数据分析工作吗
蛟龙 16pro 的配置(处理器 R77745HX,显卡 RTX4060 8G,硬盘 512G PCIE4.0 SSD)对于审计人员本地化部署大模型用于数据分析工作来说,可能存在一定的局限性。 处理器 R77745HX 具有一定的计算能力,但在处理大规模数据和复杂的模型运算时,其性能可能不够强劲。 显卡 RTX4060 8G 对于一些较为复杂的图形处理和计算任务能够提供一定的支持,但对于大规模的深度学习模型训练和数据分析,可能会显得不足。 512G 的 PCIE4.0 SSD 硬盘容量相对较小,在存储大量数据时可能会很快耗尽空间。 综上所述,该配置在一定程度上可以用于简单的数据分析任务,但对于较为复杂和大规模的大模型本地化部署及数据分析工作,可能需要更强大的硬件配置,例如更高性能的处理器、更大容量和更高性能的显卡,以及更大的存储空间。
2024-09-14
蛟龙16pro配置可以用于审计人员本地化部署大模型用于数据分析工作吗
蛟龙 16pro 的配置信息对于能否用于审计人员本地化部署大模型进行数据分析工作,需要更多关于该设备具体配置的详细信息才能准确判断。一般来说,本地化部署大模型进行数据分析工作对计算机的硬件配置有较高要求,包括但不限于强大的 CPU 性能、充足的内存容量、高速的存储设备以及优秀的显卡性能等。如果您能提供蛟龙 16pro 更详细的配置参数,我可以为您做出更准确的评估和建议。
2024-09-14
请问我该在知识库的 哪里找到MJ的提示词库
以下是关于 MJ 提示词库的相关信息: MidJourney 200 条风格词汇: 《》 @TheMouseCrypto 发表了一份 200 条风格词汇整理,页数是 77 页,很全的宝典。 Prompt 网站精选(图像类 Prompt 网站): MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择, MJ 的随机种子库收集: 使用方法: 输入提示词 + sref random ar 1:1,可获得随机风格种子和图片。 测试风格种子的泛用性:{a girl,a boy,animals,plants,environment}sref 同一个风格种子
2024-12-08
照片使用mj做风格转化
以下是利用 Midjourney 进行照片风格转化的详细教程: 一、角色一致性 1. 得益于 cref,Midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。 2. 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,因为 cref 会帮完成这件事情。 3. 风格复制和服装的替换,应当用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 二、解决“形似而神不似”问题 1. 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好。如果用醒图,建议关注【人像>面部重塑>面部>比例】,调整上庭、中庭、下庭。 2. 对于照片转绘为 Minecraft 这种风格幅度变化很大的情况,如果发现 sw 风格权重拉满仍复制不了像素小人风格,可能是 cw 太高,调低 cw 可能成功复制。 三、其他补充 1. cref 和 sref 还可以同时参考多张 url,但上传同一个人不同角度的照片,容易导致形状畸形。 2. 如果 MJ 直出的皮肤缺乏质感(过于光滑),可以打开醒图【人像>手动美颜>皮肤肌理】。 3. 如果想快速调整光源但又不想学 PS,可以试试 Luminar。 四、sref 相关 1. Midjourney v6 版本提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作。 2. 使用指令:垫图链接+关键词+ “sref” +图片链接+风格化参数+ “v 6.0”。指令:url +关键词+ “sref” + url + “sw” + “v 6.0”。sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。 3. sref 模仿图片风格,垫图模仿图片结构、元素。 生成 url 时,准备一张照片(可以使用 AI 生成一张人物图像代替真人)和想要的写真风格参考图片。Prompt:垫图 url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism niji 6 ar 3:4 sw 200 sref url
2024-12-05
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
我想使用MJ设计班牌 应该注意什么问题
使用 MJ 设计班牌时,需要注意以下问题: 1. 选择最新的 6.0 model。 2. 利用图生图功能时,命令为 /describe,选择 image 上传本地图片可获取四条提示词,点击下方标签可生成对应提示词的四张图。但要注意截图的对标比例未必是标准的 9:16,可手动修改比例以省去返工。 3. 自行对比反推的词和对标的相似程度并微调,describe 根据对标图反推的效果可能不太好,可根据推出的词自行修改,也可直接用给定的提示词,如“Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,highend design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera ar 9:16 style raw”。 4. 对于某些难以画出的形象,如拟人形态的龙,可能是描述不够准确,需要加强描述词,如将“一条亚洲龙站在时尚秀场上”这样连成一句话,以便 MJ 正确理解。 5. 确定主体形象时,包括画风、是否 Q 版、配色风格、构图比例、细节量设定等,可以找参考案例。 6. 通用的肖像生产咒语如“Cartoon style character,original character,character design. Mysterious painter and artist,an intellectually mature girl(人物基本形象(必要内容比如性别和身份) Gold and dark red.(配色部分(一个系列里尽量不要改改了容易画风对不上) 2d,solid and clean background,white background. The figure is in the middle of the frame,sideways.(侧身) Art Nouveau,in the style of Alphonse Mucha. no decorative background elements,no flower.Clean background. niji 5 ar 9:14 s 400 style expressive / style cute(二者任选尝试)”,注意咒语中的内容可随意换,多尝试。 7. 利用一致性时,得益于cref,默认值 100,越高越接近参考图像的风格。在回车之前,检查提示词,不要出现和 sref 风格差异过大的 prompt,也可增加一些有用的 prompt。解决“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有细微差距的问题。
2024-10-09
如何用 指定主角制作出想要的ai视频
以下是制作想要的 AI 视频的方法: 生成数字人: 1. 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 2. 软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。 3. 左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 增加背景图片: 1. 直接删除先前导入的文本内容。 2. 点击左上角“媒体”菜单并点击“导入”按钮,选择本地图片上传。 3. 点击图片右下角的加号将图片添加到视频轨道上(会覆盖数字人)。 4. 点击轨道最右侧的竖线向右拖拽,使其与视频对齐。 5. 选中背景图片所在轨道,拖动图片角放大到适合尺寸,并将数字人拖动到合适位置。 AI 换脸: 1. 点击快捷工具中顶部的 JupyterLab 打开工具,通过终端启动 facefusion。 点击顶部的+号选项卡,新打开一个终端窗口。 点击终端区域,启动终端选项卡。 在终端窗口中输入命令: 输入“ls”并按回车查看文件列表。 输入“cd facefusion”并按回车进入程序目录。 输入“python./run.py executionproviders cuda cpu”启动程序(注意参数executionproviders cuda cpu 非常重要,不加 cuda 则默认不使用 GPU 能力,推理将非常慢)。 2. 当出现提示信息时说明启动成功。 3. 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,通过新的浏览器窗口访问 facefusion 提供的 UI 界面。 4. 在 facefusion 软件界面上传准备好的图片、视频,在右侧查看预览效果,点击开始按钮执行换脸处理。 5. 处理完成后,在输出位置出现处理后的视频,输出窗口右上角有下载按钮,可导出视频到本地。 使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具制作 AI 短片: 1. 写剧本并制作分镜,可参考相关编剧书籍。 2. 生图: 确定影片风格,如皮克斯动画风格。 确定人物形象,如扎马尾、穿白色 T 恤、牛仔裤的 14 岁女孩和戴眼镜、灰色头发、穿灰色短衬衫的 50 岁男人。
2024-12-18
我要学习prompt,给我指定一个学习计划
以下是为您制定的学习 prompt 的计划: 一、准备阶段 首先,您需要拥有一个大模型账号,并熟悉与它们对话的方式。推荐使用性能较强的 ChatGPT4 ,国产平替有 。 二、基础学习 1. 阅读 OpenAI 的官方文档,包括: 同时,也可以参考我和熊猫 Jay 在 AGI 分享的中文精读版官方 Cookbook: 三、深入学习与实践 1. 学习 Claude 官方提示词,中文版(含 API Prompt),包括为给定主题创建全面的课程计划,如: 明确课程目标,使其清晰、可衡量,并与教育标准一致。 提供详细大纲,分为介绍、主要活动和总结,描述教学方法、学习活动和资源。 采用差异化策略适应不同学习需求和风格。 确定评估方法以评估学生的理解和掌握程度。 2. 进行苏格拉底式对话,就给定话题通过反复询问激发更深层次的思考和反思。 3. 针对给定主题生成同音连绵的词语和句子。 4. 掌握 Prompt 句式,例如: 对于“我想了解xxxx,我应该向你问哪些问题?”等句式,明确哪些是您不知道而 GPT 知道的。 对于“我理解的 xxx 是这样的,你觉得我的理解对吗?”等句式,进行认知的检验。 对于“我在 xxx 问题上遇到困难,你能提供一些可能的解决方案或建议吗?”等句式,实现认知的扩充。 希望这个学习计划对您有所帮助,祝您学习顺利!
2024-11-07
怎么用AI绘制一个我指定的动漫人物原型的各类图片,例如日漫《好想告诉你》中的黒沼爽子
要使用 AI 绘制指定的动漫人物原型,如日漫《好想告诉你》中的黑沼爽子,您可以按照以下步骤进行: 1. 选择合适的 AI 绘画工具:目前有许多在线的 AI 绘画平台和软件可供选择,例如 DALL·E2、StableDiffusion 等。 2. 明确描述特征:在输入描述时,尽可能详细地描述黑沼爽子的外貌特征,包括发型(如黑色的长直发)、眼睛(如大而明亮的眼睛)、服装(如校服的款式和颜色)、表情(如羞涩的微笑)等。 3. 参考相关图片:如果可能,找到黑沼爽子的官方图片或其他粉丝绘制的作品,作为参考提供给 AI 绘画工具,以帮助其更好地理解您的需求。 4. 不断调整和优化:根据生成的初步结果,对描述进行调整和优化,例如修改某些特征的描述、增加更多细节等,以获得更符合您期望的图片。 需要注意的是,AI 绘画的结果可能会受到多种因素的影响,不一定能完全符合您的预期,但通过不断尝试和优化,您有机会获得较为满意的作品。
2024-10-17
生成海报推荐的工具,能将指定的文案集成到海报中
以下是为您推荐的能将指定文案集成到海报中的工具及大致流程: 工具: 1. Canva(可画):https://www.canva.cn/ 是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析生成设计方案,稍作调整即可完成设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,可使用 AI 工具创建个性化海报,智能建议功能可帮助找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面可快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 大致流程: 1. 确定海报主题,借助 ChatGPT 等文本类 AI 工具完成文案。 2. 选择想要的风格意向,根据文案和风格灵活调整画面布局,背景不一定空白。 3. 使用无界 AI,输入关键词,生成并挑选满意的海报底图。 4. 将上述素材进行合理排版,得到成品。排版可参考 AIGC 海报成果。
2024-09-13
如何在suno 中指定演唱者的性别
在Suno AI音乐创作平台上,通过精准的提示词输入,您可以引导模型更接近地捕捉和实现您心中所想象的音乐效果。以下是一些关键提示词的类别和示例,它们将成为您创作旅程中的得力助手。 声音类提示词 ``` Male Vocal(男声) Female Vocal(女声) Male Singer(男歌唱家) Female Singer(女歌唱家 Female Diva Solo(女独唱) ```
2024-04-22
哪些工具可以指定时间收集指定网站指定字段资讯
可以使用 Tavily API 接口进行搜索和爬虫,然后利用 Kimi 这个 AI 会话助手来读取并整理搜索结果。
2024-03-20
视频生成哪一个ai最强
目前在视频生成领域,以下几个 AI 表现较为突出: Luma AI: Dream Machine 功能包括 txt2vid 文生视频和 img2vid 图生视频,还支持 Extend 延长 4s、循环动画、首尾帧动画能力。 8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力,对视频内文字的表现很强。 在 img2vid 图生视频方面,生成效果在多方面远超其他产品,如生成时长较长(5s)、24 帧/s 非常丝滑、运动幅度大且能产生相机的多角度位移、提示词中可增加无人机控制的视角变化、运动过程中一致性保持较好、分辨率高且有效改善了运动幅度大带来的模糊感。 Runway:推出了实力强劲的 Gen3 模型。 此外,以下是其他视频生成的 Top10 产品及相关数据: |排行|产品名|分类|4 月访问量(万 Visit)|相对 3 月变化| |||||| |1|InVideo|其他视频生成|736|0.118| |2|Fliki|其他视频生成|237|0.165| |3|Animaker ai|其他视频生成|207|0.076| |4|Pictory|其他视频生成|122|0.17| |5|Steve AI|其他视频生成|76|0.119| |6|decohere|其他视频生成|57.5|0.017| |7|MagicHour|其他视频生成|53.7|0.071| |8|Lumen5|其他视频生成|51|0.149| |9|democreator|其他视频生成|41.9|0.136| |10|腾讯智影|其他视频生成|35.4|0.131|
2024-12-20
免费生成思维导图的AI网址
以下是一些免费生成思维导图的 AI 网址: 1. GitMind:一款免费的跨平台 AI 思维导图软件,支持提问、回答、自动生成等多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图+AIGC 的工具,能够利用 AI 生成思维导图。 3. AmyMind:轻量级的在线 AI 思维导图工具,无需注册登录即可使用,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求后由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 总的来说,这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图,提高制作效率,为知识工作者带来便利。 此外,以下是一些可以使用 AI 绘制示意图的工具和平台: 1. Lucidchart:强大的在线图表制作工具,集成 AI 功能,可自动化绘制流程图、思维导图、网络拓扑图等多种示意图。具有拖放界面,易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ 2. Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计。集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/
2024-12-20
为什么ai生成视频被寄予厚望
AI 生成视频被寄予厚望的原因主要有以下几点: 1. 技术突破:2023 年是人工智能视频领域的飞跃之年,在这一年中见证了数十种视频生成工具的问世,文本生成视频的模型持续进步,并且像图像转视频、视频转视频这样的衍生技术也开始流行起来。 2. 应用潜力:虽然目前工具存在局限性,但仍预示着正处于一场巨大变革的初期阶段,未来有望仅凭一个文本提示(或者几个提示)就制作出高质量的短片。 3. 产品优势:例如国内的可灵,在视频生成质量、生成速度和可访问性方面表现出色,达到了与国际顶级模型相当的水准,处理效率更高,为国内用户提供了便捷、稳定的使用体验。 4. 生成方式多样:从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式,且存在多种生成技术,如先生成静态关键帧图像再构建为视频序列,或直接端到端生成视频的技术。
2024-12-19
你可以根据问题说生成PPT或者图片吗
以下是关于生成 PPT 或图片的相关内容: 增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成,包括图片、PPT、PDF 等。例如,在对话框输入诉求“生成常见的系统架构风格架构设计图”即可生成相应图片,输入“帮我生成一篇包含以上架构风格的完整 PPT”可生成 PPT 幻灯片内容及相关模板选择,输入“根据上面的架构风格,制作一篇常见系统架构风格的 PDF 文件”可生成相应的可选模板。 在 MJ 应用中,为 PPT 配图可通过复制图像链接和提示词,在 discord 中输入相应命令生成图像。生成后可改变比例和镜头拉远,检查构图,选择合适的图放入 PPT 调整构图。 在制作课程时,可通过一系列提问模板让 ChatGPT 协助创作章节内容,并将其转换成 PPT 格式,还可加入学员案例、参考范例让其进行改写或续写。
2024-12-19
有生成提示词的提示词嘛
以下是为您提供的关于生成提示词的相关信息: Apple Intelligence 中各种智能应用的提示词已曝光,包括用于生成 Apple Photos 中“回忆”视频的提示词。生成的内容需以 JSON 格式响应,遵循特定的故事和照片说明指南,且不能包含宗教、政治、有害、暴力、色情、肮脏或任何负面、悲伤或挑衅的内容。 一泽 Eze 提出通过输入一句提示词和一个品牌 Logo,利用大模型 LLM 可一键生成超级符合品牌调性的创意名片。提示词已开源,同时还介绍了获取提示词的流程、注意事项,如提示词的目的是设计符合品牌调性的创意名片,Logo 建议使用清晰、底图透明的 PNG 格式,若生成结果不符合预期可尝试让模型重新生成或提出修改意见。 【SD】自动写提示词脚本 One Button Prompt 可通过设定主题、正向提示词等生成随机的提示词,还能通过图生图控制,生成的提示词风格各异,可进行修改调整,也可使用“Latent Couple”插件给画面做定义。
2024-12-19
我想用AI把图片生成营销视频
以下是关于用 AI 把图片生成营销视频的相关信息: 生成式人工智能在营销中的应用:DALLE 2 和其他图像生成工具已被用于广告,如亨氏使用番茄酱瓶的图像和类似标签论证“这就是人工智能眼中‘番茄酱’的样子”;雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌;Stitch Fix 服装公司使用 DALLE 2 根据客户偏好创建服装可视化;美泰使用该技术生成玩具设计和营销的图像。 判断图片是否为 AI 生成:AI 作画的画质画风偶尔会波动,不像人类画师作品质量大多稳定向上发展,AI 就像皮下雇佣无数画技参差不齐画手的批皮营销号,画质质量胡乱。 制作商业级 AI 视频广告的出图方法:MJ 出图质量稳定,使用门槛低,暂时无其他替代工具。常规操作是登录 Discord 网站,打开 MJ 服务器出图,通过/imagine 命令输入提示词生成图片。若想提高效率,可使用 Autojourney 插件,它是电脑浏览器的一个插件,能批量发送提示词、自动下载图片、自动放大图片、生成提示词等,在浏览器拓展程序中下载安装,激活后将 MJ 出图提示词复制到插件中即可自动批量出图,一次可输入 10 组提示词。
2024-12-19