Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

怎么生成图?

Answer

生成图的方法有多种,以下为您介绍几种常见的方式:

  1. ComfyUI Flux 与 runway 制作绘画视频:
    • 生成图片:提示词告诉 flux 去生成一张技术草图,如 CAD 等。
    • 绘制视频:在 runway 里面,使用提示词,从空白页面开始逐行创建,并把生成的图片作为尾帧。
    • 草图上色:使用 flux 的 controlNet,depth 固定,注意控制版本和权重。
    • 生成上色后的视频。
  2. MJ 应用篇快速给 PPT 配图:
    • 复制图像链接:首先复制图片网址,然后打开 discord,在聊天栏输入/imagine prompt[图像网址]。
    • 复制提示词:回到官网复制图像的提示词,再回 discord 粘贴到刚才拷贝的网址后面并空一格。
    • 生成图像:输入命令等待生成,效果不理想可多反复生成几次。之后可改变比例和镜头拉远,检查构图。
  3. 景淮:制作个人日历 - GPTs Action 实战:
    • Dalle-3 做图:设定喜欢的图片风格,如极简风格插画,根据示例提示词修改后生成图片。
    • 基本日历制作:使用 GPT 生成图片,方便定位对应数字的坐标和位置,包括创建表格、增加星期文字、增加标题以及计算日历中每天位置的坐标等步骤。
Content generated by AI large model, please carefully verify (powered by aily)

References

ComfyUI Flux与runway制作绘画视频

这个是外国大佬@Ror_Fly的创意思路,很好的利用了runway的尾帧来制作动画,我也进行了实测,记录下来,关键的点,大家也可以发掘更多的玩法。[heading3]生成图片[content]提示词告诉flux,去生成一张技术草图,CAD提示词:eg:Flux短提示词,可以在上面提示词的里面提取[heading3]绘制的视频[content]在runway里面,使用提示词,告诉是从空白页面开始,逐行创建在runway里面,把生成的图片作为尾帧。[Gen-3 Alpha 1963070634,sketch drawing of a,ComfyUI_temp_lnmie_0,M 5.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/IsBRbeFi3oPoUGxYao9cwBcQn2d?allow_redirect=1)[heading3]草图上色[content]使用flux的controlNet,depth固定controlNet使用的是Union的版本,目前这个版本,不建议权重调的太高,结束时间也是。[heading3]生成上色后的视频[content][Gen-3 Alpha Turbo 766422618,A robot cat running,ComfyUI_temp_lnmie_0,M 5.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RQBfbBGipoz4yNxpuZOcjc0Kn6c?allow_redirect=1)[heading3]how2draw Flux lora[content]再分享一个好玩的flux lora,用来展示绘画的过程。触发词:how2draw

MJ应用篇 快速给PPT配图

[heading2]稍微高级一点的薅[heading3]复制图像链接[content]这时候我们需要首先复制一下图片的网址:然后打开discord,在聊天栏输入/imagine prompt[图像网址][heading3]复制提示词[content]之后再回到官网,把图像的提示词也复制下来再回discord黏贴到刚才拷贝的网址后面,注意空个格[heading3]生成图像[content]都搞好以后输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图,注意:非自己做的图无法获得random seed所以不能弄得完全一样,如果效果不理想多反复生成几次吧。之后放大觉得还不错的一张,在放大的图里做如下步骤:[heading3]改变比例和镜头拉远[content]首先,点这个Custom Zoom此时可以改变拉伸镜头后的画面比例,如果是屏显PPT一般用16:9,如下图,把--ar这个参数后面的数值改成16:9(默认的方形构图这里是1:1)--zoom参数设置为1.5--zoom参数是镜头拉伸的倍数,1.5~1.7比较靠谱,太大(比如2)会有更大几率生成一些莫名其妙的东西[heading3]检查构图[content]选一张比较好的放大一下,就可以放进PPT调整构图了。构图如果没问题可以直接跳到:[6.提升分辨率](https://waytoagi.feishu.cn/docx/PF9Kdj7gXo0XeVxziCicWYytnVh#doxcn0yGP81zcgAUhSoeXsAsDrc)如果构图还是不太好的话可以在当前这张图的基础上再用一次Zoom Out 1.5x,这样做和直接2x不同,不会有太多奇怪的东西进来。这时候的构图可能就差不多了,选一张比较好的放大出来试试

景淮:制作个人日历-GPTs Action 实战

其实根据上面的内容可知,不管是哪种方式,我们都需要先完成两部分内容。1.生成一张适合的图片2.制作一个基本的日历然后我们再根据不同的要求把图片拼接在一起。[heading3]一)Dalle-3做图[content]关于这个图片的风格,其实大家选择自己喜欢的风格就好。我这边设定的画风是极简风格插画画风。提示词请你以示例中的绘画提示词,进行简单的修改,做为用户输入主题的绘画提示词,然后再进行绘画。···示例:“A children's illustration featuring a cute and simple style.The image should evoke a sense of joy and wonder,suitable for a young audience.The artwork should be colorful,with playful elements that engage the imagination.The scene can include friendly animals,whimsical trees,or magical objects,all designed with soft,rounded shapes for a gentle and inviting appearance.The overall composition should be easy for children to understand and appreciate,making them feel happy and curious to explore more.”···现在我的主题是:礼品盒生成图片[heading3]二)基本日历制作[content]我这边使用GPT来生成图片,是因为通过这种方式方便我后面来定位对应数字的坐标和位置。[heading4]1、创建表格[heading4]2、增加星期的文字[content]记得同时上传一个字体[heading4]3、增加标题&&4、计算日历中每天位置的坐标,单位为px[content]这边图片坐标用画图工具重新取了一下,发现保存之后和画出来的大小不太一样。效果展示

Others are asking
我想生成一个小学生给小学生讲人工智能的ppt
以下是为您生成的关于小学生给小学生讲人工智能的 PPT 内容建议: 幻灯片 1:标题页 标题:走进神奇的人工智能世界 幻灯片 2:什么是人工智能 科学家们给人工智能一个像大脑一样的东西,让它能像人一样思考和学习,这叫“机器学习”。 就像我们上学时通过练习变得越来越好,人工智能通过观察很多东西来学习。 幻灯片 3:Genie 模型 Genie 模型有一个很大的数字网络,像有很多琴键的钢琴,每个琴键代表一种知识。 它能通过学习理解视频中的事情,还能创造新东西,比如想象出草原的样子。 幻灯片 4:生成式 AI 的应用 学校里用生成式 AI 设计桌游,大学生和小学生同上一节课。 第一学期有了粗糙版学校地图桌游 1.0 版本,本学期进行测试和迭代。 使用多种工具增强桌游的设计,还想让学生尝试制作有关学校的歌曲加入桌游 2.0 版本。 幻灯片 5:总结 人工智能很神奇,能帮助我们做很多有趣的事情。 您可以根据以上内容框架,结合小学生的认知特点,添加更多图片、动画等元素,让 PPT 更加生动有趣。
2024-12-28
免费生成文生图的模型有哪些
以下是一些免费生成文生图的模型: 1. Kolors:这是最近开源的文生图模型中表现出色的一个。从技术报告来看,它具有更强的中文文本编码器、高质量的文本描述生成能力、强大的中文渲染能力以及巧妙的 noise schedule 来解决高分辨率图加噪不彻底的问题。 2. StableDiffusionWebUI(SD):这是一个免费开源的 AI 绘图模型。其核心功能包括文生图(txt2img)、图生图(img2img)、模型训练等。可以结合 ChatGPT 生成文本内容,由 SD 生成相应的图像,减轻人工编辑负担,提高工作效率。 3. DALL·E 3:这是 OpenAI 发布的文生图模型,可以利用 ChatGPT 生成提示,然后根据提示生成图像。生成的图像质量较高,使用门槛相对较低。
2024-12-28
生成证件照的工具
以下为您介绍一些生成证件照的工具: 1. 有一个能将上传照片生成白底、蓝底和红底的证件照生成工具。 2. Stability AI 推出的基于 Discord 的媒体生成和编辑工具,其中包括(在保留前景的同时删除背景,价格 2 积分)。 此外,还有悠船工具,其基础使用教程如下: 进入官网,可以选择桌面端下载和浏览器使用。若选择浏览器使用,第一次使用需注册,选择企业用户注册,输入对应名称和手机号即可注册成功(目前不需要填写企业信息),注册完成后进入具体操作页面。 基础操作:点击开始想象按钮,粘贴生成的提示词,回车后耐心等待几十秒可生成 4 张图片,可选择喜欢的图片进行对应操作。 创作调整:风格化数字越大越艺术;怪异化数字越大越奇怪;多样化数字越大结果越意想不到。建议新手一开始不用怪异和多样化。模式默认标准,朴实 raw 会让图片质感更好;版本默认最高 V6,二次元可选 NIJI。生成图片速度默认快速,越快对支付套餐要求越高。 图片详情:左侧是提示词,右上可下载对应图片,可进行参数调整,任何点击都会重新生成图片,免费用户可能会提示超出套餐。
2024-12-28
什么是生成式人工智能
生成式人工智能是一种能够生成新内容的人工智能技术,生成的内容可以是多模式的,包括文本、图像、音频和视频等。当给出提示或请求时,它可以帮助完成各种任务,例如文档摘要、信息提取、代码生成、营销活动创建、虚拟协助和呼叫中心机器人等。它从大量现有内容中学习,这个学习过程称为训练,其结果是创造的“基础模型”,如为 Bard 等聊天机器人提供支持的 LLM 或大型语言模型。基础模型可用于生成内容并解决一般问题,还可以使用所在领域的新数据集进一步训练以解决特定问题。 AIGC 即 AI generated content,又称为生成式 AI,意为人工智能生成内容,例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等都属于其应用。 Gen AI/Generative AI 是“生成式人工智能”的正式称呼,而 AIGC 指的是由人工智能生成的内容的创作方式,实际上是 Generative AI 的应用结果。
2024-12-28
图像生成语言描述
以下是关于图像生成语言描述的相关内容: Gemini 模型能够处理多种模态和全球语言的任务,包括图像理解任务(如包含冰岛文本的图像)和生成任务(如为多种语言生成图像描述)。在 Crossmodal3600(XM3600)基准测试的选定语言子集上使用 Flamingo 评估协议在 4shot 设置下评估生成图像描述的性能,相比现有最佳模型 Google PaLIX 有显著改进。图 5 中的定性评估展示了 Gemini Ultra 多模态推理能力的例子,如解决生成由用户提供的一组子图重新排列的 matplotlib 代码的任务。 在生成式人工智能模型中,提示词是用户输入的用于引导模型产生期望输出的文本,可简单或复杂。例如在 DALLE3 这样的图像生成模型中提示词通常是描述性的,在 GPT4 或 Gemini 这样的 LLM 中可以是简单查询或复杂问题陈述。提示词通常包含指令、问题、输入数据和示例,为得到期望回应必须包含指令或问题,其他元素可选。在 LLM 中,基本提示词可直接提问或提供特定任务指令,高级提示词如“思维链”提示词引导模型遵循逻辑推理过程得出答案。 ChatGPT 给 DALL·E 3 优化提示词的元提示中,规定了一系列关于图像生成的政策,如翻译非英文描述、限制图像数量、避免特定人物形象、遵循特定艺术风格要求、明确图像类型和多样化人物形象描述等。
2024-12-28
图片生成语言描述
以下是关于图片生成语言描述的相关内容: Gemini 模型能够处理多种模态和全球语言的任务,包括图像理解和生成任务,如为多种语言生成图像描述。在 Crossmodal3600(XM3600)基准测试的选定语言子集上使用 Flamingo 评估协议进行 4shot 设置下的评估,Gemini 模型相比现有最佳模型 Google PaLIX 有显著改进。图 5 中的定性评估展示了 Gemini Ultra 多模态推理能力的例子,如解决生成由用户提供的一组子图重新排列的 matplotlib 代码的任务。 ComfyUI 中 JoyCaption 提示词反推很强,结合 MiniCPM 和 ollama 效果好,与 Flux 特别搭。模型的安装配置方面,siglip 是由 Google 开发的负责理解和编码图像内容的视觉特征提取模型,其工作流程包括接收输入图像、分析视觉内容并将其编码成特征向量。image_adapter.pt 是连接视觉模型和语言模型、优化数据转换的适配器,其工作流程包括接收视觉模型的特征向量、转换和调整特征以及进行特定任务的优化或微调。MetaLlama3.18Bbnb4bit 是负责生成文本描述的大型语言模型,其工作流程包括接收经过适配器处理的特征、基于特征生成相应文本描述以及应用语言知识确保描述的连贯性和准确性。 ComfyUI 的整体工作流程为:用户输入一张图片,视觉模型提取图片的关键特征,适配器将视觉特征转换为语言模型可以理解的形式,语言模型基于这些特征生成文本描述,系统输出最终的图像描述文本。工作流中分别使用了 JoyCaption、MiniCPM、ollama,也可以只使用一个,但同时使用需要较高的显存。JoyCaption 出来的提示词有截断问题,可通过在相关 prompt 中添加“: ”和空格解决,其原理用了 llama 的续写功能。
2024-12-28