Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

图片可以转文字描述吗

Answer

图片可以转文字描述。以下是一些相关的实现方式和应用场景:

  • 在“AI 拍立得”中,用户上传图片后,大模型会根据选择的场景生成与内容相关的文字描述或解说文本。其逻辑在于大模型对图片内容的理解和对生成文本的整理润色,可应用于生成美食点评、朋友圈发布文案、闲鱼上架示例模版等场景。
  • 在 Midjourney 中,图片描述可以理解为以图生图。把找到的设计参考图上传到 Midjourney 中,得到专属链接,再使用“参考图链接+文本描述”的方式生成图像。例如,想要得到特定风格的 UI 界面图,可通过调整文字提示来实现。还可以通过加入特定参数来控制生成图像的比例。此外,Midjourney 不仅能生成整张设计图,还能输出多种风格的设计组件。

同时,关于图片模型和语言模型的大小差异,这是因为图像生成的核心质量实际上由文本控制,去掉图片只用文字表达要求的模型复杂度会小很多。人类对图像的容错率相对较高,大脑在处理视觉信息时可以进行一定程度的“脑补”,但对于语言,补偿有限,所以文字的准确性非常重要。

Content generated by AI large model, please carefully verify (powered by aily)

References

0基础手搓AI拍立得

点击下方拍摄按钮,一起打开有意思的未来:)[heading1]1.背景[content]在每次使用大模型工具时,总需要先编写复杂的Prompt,再上传图片,接着等待模型生成反馈,整个流程显得繁琐冗长。出于简化操作、提升效率的需求(作为一个懒人的自我救赎),我萌生了“AI拍立得”的概念:即拍即得,简化流程,让操作更直观、更高效。之前的直播分享内容中也有提到关于AI拍立得的能力,往期回顾:[Inhai:Agentic Workflow:AI重塑了我的工作流](https://waytoagi.feishu.cn/wiki/MhC0wBXyBiDB8DkR0L5c6P7Pn1g)[heading2]1.1在线体验[content]究竟什么是AI拍立得呢?不如快速体验一把就知道了!Pailido->拍立得的谐音名称,是不是很好记😂AI拍立得-Pailido拍照就能给你快速生成各类文案!🔍微信小程序搜索:Pailido丰富场景自由切换快速生成闲鱼文案生成外卖/大众点评[heading2]1.2交互逻辑[content]用户可以选择拍摄场景类型,并立即拍照,AI会自动识别和分析照片中的内容信息,依据预设场景规则,迅速生成符合情境的反馈,避免繁琐的额外操作。[heading2]1.3实现场景[content]1.图片转成文本1.1.逻辑:用户上传图片后,大模型根据选择的场景生成与内容相关的文字描述或解说文本。1.2.核心:图片理解和文本整理润色。1.3.场景:生成美食点评、朋友圈发布文案、闲鱼上架示例模版...2.图片转绘图片2.1.逻辑:用户上传图片后,大模型按照指定的风格快速生成图像的转绘版本,适应不同风格和场景需求。2.2.核心:图片风格化滤镜。2.3.场景:图片粘土风、图片积木风、图片像素风...

如何用Midjourney生成B端产品页面?收下这份AI关键词总结!

Midjourney中的图片描述可以理解为以图生图。把找到的设计参考图上传到Midjourney中,得到一个专属的链接,再使用「参考图链接+文本描述」的方式生成图像。使用方法例如我想得到一个带有交互流程的UI界面图,先把找好的素材图上传到Midjourney中。在Midjourney中复制参考图的链接再加上文字提示:「参考图链接+node UI」,就能得到和参考图很类似的设计图。如果想要纯正面、扁平效果的设计流程图,可以继续调整文字提示:「参考图链接+flat UI,node UI,frontal」如果想要手绘风格、黑白风格的交互设计图,在文字提示中加入:「参考图链接+node UI,drawing style,frontal,black and white,flat UI,2D,no shadow」加入参数Midjourney生成的图默认是正方形,如果想得到其他比例的图,需要在文字描述中加入特定的参数来做到这一点:「--aspect」或「--ar」比例为9:16的设计图,使用提示:「参考图链接+node UI,black and white--ar 9:16」或者16:9的图「参考图链接+node UI,--ar 16:9」组件设计Midjourney的作用不同于设计软件,利用AI能在几秒钟内得到很有创造力的图像,这些设计图能为后面的设计提供更多灵感。除了生成整张的设计图,还可以扩宽思路,利用AI输出多种风格的设计组件,探索更多设计风格的可能性。扁平组件系统关键词:「UI kit,flat design,outline,--ar 16:9」古驰风格按钮

为什么图片模型比语言模型小

用户在形成一些使用习惯后,可能会发现,如果引入内嵌的AI技术,他们的体验会变得更加理想。我觉得,这种技术在文字理解方面,可能会比大多数现有技术要好。这是有道理的。比如一个绘图软件或AI,要想绘制出优秀的作品,首先需要对图像有深刻理解。那么,谁拥有最好的语言模型呢?目前看来,是OpenAI和它的GPT-4模型。因为图像生成(无论是text to image还是text to video)的核心质量,实际上是由文本控制的。去掉图片,只用文字表达,其实要求的模型复杂度会小很多,因为人类对图像的容错率相对较高。但如果一句话语法或逻辑错误,我们很容易察觉。我们的大脑在处理视觉信息时可以进行一定程度的“脑补”,但对于语言,这种补偿是有限的。所以,对于我们这些普通人来说,文字的准确性仍然非常重要。

Others are asking
文学性强、逻辑性差的文字描述转成图片或图表的AI工具有什么
以下是一些可以将文学性强、逻辑性差的文字描述转成图片或图表的 AI 工具: 1. AI“词生卡”:通过将抽象的文字描述转化为直观的逻辑图表和流程图,改变处理和呈现信息的方式。例如,在商业领域可根据项目描述自动生成流程图,还能用于自定义活动海报、商务名片、简历等,实现文图双输出。 2. 以下工具可用于绘制逻辑视图、功能视图和部署视图: Lucidchart:流行的在线绘图工具,支持多种图表创建,用户可通过拖放界面轻松操作。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合使用,支持逻辑视图创建。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(现称为 diagrams.net):免费在线图表软件,支持多种图表类型创建。 PlantUML:文本到 UML 转换工具,通过编写描述生成序列图等。 Gliffy:基于云的绘图工具,提供架构图创建功能。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。 如果您想将小说做成视频,可以参考以下工具和流程: 工具与网址: 1. Stable Diffusion(SD):AI 图像生成模型,基于文本描述生成图像。网址: 2. Midjourney(MJ):AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 一般流程包括文本分析、角色与场景生成、视频编辑与合成等。
2025-02-09
可以根据文字描述,生成画面或图表的AI工具有什么
以下是一些可以根据文字描述生成画面或图表的 AI 工具: 文生图工具: DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104 ),可以查看更多文生图工具。 绘制逻辑视图、功能视图、部署视图的工具: Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可使用拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具一起使用,该工具提供图形化界面创建 ArchiMate 模型。 Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 draw.io(现在称为 diagrams.net):免费的在线图表软件,允许用户创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 如果您想用 AI 把小说做成视频,可以参考以下步骤和工具: 工具与网址: Stable Diffusion(SD):AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI Midjourney(MJ):AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/
2025-02-09
根据文字描述生成产品原型设计
以下是关于如何用 Midjourney 生成 B 端产品页面的详细介绍: 文本描述: 文本描述是 Midjourney 中最重要的出图逻辑,在输入框中输入“/image+文本描述”来生成图像。 若要生成 B 端界面,需清楚 B 端产品的可用关键词。例如输入“「SaaS dashboard」”可得深色 B 端界面效果。若想要简约浅色风格,可加入“白色背景”描述,如“「SaaS dashboard,UI,white background」”。还可尝试其他颜色,如“「SaaS dashboard,UI,purplr,black,white background,frontal」”。 Midjourney 会默认给出 4 张图像,图像下有两行按钮。第一行的 U 是放大图像提升细节,数字对应图像(U1,U2,U3,U4);第二行的 V 是在基础上发生变化,数字对应图像(V1,V2,V3,V4)。 文本描述操作便捷,但对于新手可能存在两个问题:一是难以准确描述所需关键词提示;二是输入很多关键词提示但生成图像与预想效果不一致,调整关键词的字序或增减字可能对结果产生很大影响,导致产生废稿。 图片描述: Midjourney 中的图片描述可理解为以图生图。将找到的设计参考图上传到 Midjourney 中得到专属链接,再使用“参考图链接+文本描述”的方式生成图像。 例如想得到带有交互流程的 UI 界面图,先上传素材图,在 Midjourney 中复制参考图链接再加上文字提示,如“「参考图链接+node UI」”。若想要纯正面、扁平效果的设计流程图,可调整为“「参考图链接+flat UI,node UI,frontal」”;若想要手绘风格、黑白风格的交互设计图,可加入“「参考图链接+node UI,drawing style,frontal,black and white,flat UI,2D,no shadow」”。 若想得到特定比例的图,在文字描述中加入特定参数,如 9:16 比例的设计图提示为“「参考图链接+node UI,black and whitear 9:16」”,16:9 比例的图提示为“「参考图链接+node UI,ar 16:9」”。 Midjourney 不同于设计软件,能快速得到有创造力的图像,为设计提供灵感。除生成整张设计图,还可利用 AI 输出多种风格的设计组件,如扁平组件系统,关键词为“「UI kit,flat design,outline,ar 16:9」”,还有古驰风格按钮。
2025-01-06
ETNA:怎么用,需要注册登陆吗,是免费的吗,我把文字描述写入它网页的对话框里,点击了coming soon 但是没有任何反应,怎么回事
ETNA 的使用方法可能因具体版本和功能而有所不同。通常来说,使用这类工具可能需要注册登录。关于其是否免费,也取决于具体的服务策略。您在网页对话框中输入文字描述并点击“coming soon”没有反应,可能有以下原因: 1. 该功能尚未正式开放或仍在准备中。 2. 网络连接存在问题,导致请求无法正常发送和接收。 3. 可能是网页本身存在技术故障或错误。 由于目前知识库中没有关于 ETNA 更详细的信息,建议您查看其官方说明或联系相关技术支持以获取准确的使用指导。
2024-12-10
搭建一个数据解读的ai工具,文字描述要有逻辑性,符合金字塔原则
很抱歉,目前知识库中没有关于搭建一个数据解读的 AI 工具且文字描述要符合金字塔原则的相关内容。但一般来说,搭建这样一个工具需要以下几个关键步骤: 1. 明确数据来源和类型:确定您要处理的数据是来自数据库、文件、网络等,以及数据的格式和特点,例如结构化数据、非结构化数据等。 2. 选择合适的技术框架:根据需求和技术能力,选择适合的 AI 框架和工具,如 TensorFlow、PyTorch 等。 3. 数据预处理:对原始数据进行清洗、转换、归一化等操作,以提高数据质量和模型的训练效果。 4. 特征工程:提取有意义的特征,以便模型能够更好地理解和处理数据。 5. 选择模型:根据数据特点和任务需求,选择合适的 AI 模型,如决策树、神经网络等。 6. 训练模型:使用预处理后的数据对模型进行训练,并不断调整参数以优化性能。 7. 评估模型:使用合适的指标对训练好的模型进行评估,如准确率、召回率等。 8. 优化和改进:根据评估结果对模型进行优化和改进。 9. 设计文字描述逻辑:按照金字塔原则,先给出结论或主要观点,然后逐步展开支持性的细节和论据。 需要注意的是,这只是一个大致的框架,实际搭建过程中可能会遇到各种技术和业务上的挑战,需要不断探索和优化。
2024-11-03
我想用文字描述由AI为我制作出漫画视频,请问用哪款免费的AI可以实现
以下是一些可以免费将文字描述制作成漫画视频的 AI 工具及相关信息: Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 使用 AI 把小说做成视频的制作流程大致如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-09-20
海报图片生成
以下是关于海报图片生成的相关内容: 女神节海报生成: 操作步骤: 第一步:打开即梦 AI,选择“图片生成”功能,网址为 https://jimeng.jianying.com 。 第二步:模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 第三步:点击生成,几秒钟后即可完成专属字体海报。 海报案例: 案例一提示词:女神节主题,3D 设计,梦幻氛围,明亮春天场景,花田,数字 38,天空“女神节”,五彩缤纷的蝴蝶,晴朗的蓝天,茂密的绿色草地,盛开的花朵,柔和光线。 案例二提示词:粉色主题,梦幻氛围,数字 38,心形气球,花卉装饰,玫瑰花,漂浮的花瓣,柔和的云朵,美丽的湖面倒影,奇幻风格,柔和的色调,庆祝场景。 案例三提示词:妇女节,3D 设计,粉色主题,大号装饰数字 38,爱心,郁金香花朵,柔和光照,背景城市天际线,精致花卉装饰,优雅节日氛围,金色文字,春天氛围,细致鲜艳。 其他海报生成(如城市艺术字海报): 操作步骤与女神节海报生成相同,即: 第一步:打开即梦 AI,选择“图片生成”功能,网址为 https://jimeng.jianying.com 。 第二步:模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 第三步:点击生成,几秒钟后即可完成专属字体海报。
2025-03-07
我是一名电商工作者,主要负责产品图的图片设计,我该怎么学习AI,能给我带来效率和品质上的提高?
以下是为您提供的学习 AI 以提高电商产品图设计效率和品质的建议: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,快速获取关键信息,如受欢迎的产品、价格区间和销量等,以便在设计中更好地把握方向。 2. 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词,优化产品图的标题和描述,提高搜索排名和可见度。 3. 产品页面设计:使用 AI 设计工具,根据市场趋势和用户偏好自动生成吸引人的产品页面布局,为产品图的展示提供良好的框架。 4. 内容生成:利用 AI 文案工具撰写有说服力的产品描述和营销文案,与产品图相互配合,提高转化率。 5. 图像识别和优化:运用 AI 图像识别技术选择或生成高质量的产品图片,更好地展示产品特点,吸引顾客。 6. 价格策略:通过 AI 分析不同价格点对销量的影响,制定合理的价格策略,在产品图中体现价格优势。 7. 客户反馈分析:借助 AI 分析客户评价和反馈,了解客户需求,优化产品图和服务。 8. 个性化推荐:利用 AI 根据用户的购买历史和偏好提供个性化的产品推荐,在产品图设计中突出个性化元素。 9. 工具能力提升:对现有 AI 工具进行严格评估和选型,确保其能提供标准化输出和一致性体验,提升设计质量和速度。 10. 工作流程优化:将 AI 深入到日常设计流程中,形成新的工作方式与流程,针对 AI 的特性优化每一个环节,实现效率和创意品质的最大化。 同时,您还可以参考以下成功案例: 1. Show Me 扣子 AI 挑战赛大消费行业专场的三等奖作品,为电商卖家提供全面的图片处理服务,包括 AI 商品图、AI 场景图、AI 模特、AI 素材、AI 海报等。利用先进 AI 技术,帮助卖家无需专业设计经验即可创作出独特且充满想象力的优质素材,且创作素材可商用,有助于提升商品出单率。 2. 大淘宝设计部 2023 年度 AI 设计实践报告中提到,未来设计师要具备持续的学习习惯,将 AI 深入日常设计流程,设计团队要制定并执行明确的 AI 融合策略等。 总之,随着技术的不断进步,AI 在视觉设计领域将扮演更重要的角色,为您创造更多的可能性。
2025-03-07
图片识别
图片识别是一个复杂但重要的领域,以下为您介绍相关知识: 神经网络在图片识别中的应用:神经网络专门处理未知规则的情况。例如,将图片转换为黑白,调整图片至固定尺寸,与数据库中的内容进行对比,最终得出结论。其发展得益于生物学研究的支持,在数学上提供了方向,能够处理如手写体识别等未知情况。 感知机网络在图片识别中的工作方式:受大脑神经元网络的启发,罗森布拉特提出应用感知机网络执行视觉任务,如人脸和物体识别。以识别手写数字为例,将图像转换为一组数值输入,确定感知机的权重分配和阈值,使其能正确输出。感知机通过类似行为心理学中的训练方式,在样本上进行监督学习来获得正确的权重和阈值。 判断图片是否为 AI 生成:现在有不少网站通过对大量图片数据的抓取和分析来判断画作属性。例如 ILLUMINARTY 网站,但在测试中可能存在误判,如将结构严谨的真实摄影作品识别为 AI 作图,这反映出鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种表现。
2025-03-07
deepseek加什么软件能生成图片
DeepSeek 本身可能不具备直接生成图片的能力,但可以通过以下方式结合其他软件来生成图片: 开发浏览器插件:先开发基础版本,包括选择文字,可以自定义生成图片,图片底部包含文章标题和链接二维码。在开发过程中,可能需要使用 Trae 运行并在 Chrome 浏览器内加载扩展程序进行调试。 使用其他 AI 生成图片的软件来生成图标,例如多模态模型 JanusPro ,它既能进行视觉理解,也能生成图像。
2025-03-07
从图片提取文字,包含艺术字
以下是关于从图片提取包含艺术字的文字的相关信息: 艺术字生成:可以选择模型图片 2.1,并输入提示词,参考案例提示词如“金色立体书法,‘立冬’,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风”等。原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA MewXAI 平台:这是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。其中的 AI 艺术字功能是其最新玩法,能把光影文字、隐藏文字、艺术字融入艺术作品,美观且实用。访问地址:https://www.mewxai.cn/ LayerStyle 副本中的 LayerUtility TextImage:支持从文字生成图片以及遮罩,可调整字间距、行间距、横排竖排、文字的随机变化(包括大小和位置)等。节点选项包括 size_as、font_file、spacing、leading、horizontal_border、vertical_border、scale、variation_range、variation_seed、layout、width、height、text_color、background_color 等。
2025-03-06
想要生成一张图片 用什么ai更合适
以下为您介绍几种适合生成图片的 AI 工具及相关操作流程: 1. Stable Diffusion 模型:可根据文本指令生成图片,图片的样子取决于使用者输入的提示词,非排列组合工作模式下难以出现完全相同的两张输出图片。类似于画笔,构造出的图画取决于使用者自己的设计。在当下技术背景与现实下,利用新兴智能工具,把自己的独创性思想转化为现实作品,极大地节省了创作成本。案例中法官承认这样依靠使用者的输出设计生成的图片属于美术作品,具有独创性和智力投入,受到著作权的保护。 操作流程:使用者根据自己的审美个性,通过增删提示词、修改相关参数,得出不同的图片,最后选定。 2. Tusiart: 简明操作流程: 定主题:确定生成图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora,控制图片效果及质量。 ControlNet:控制图片中特定的图像,如人物姿态、生成特定文字等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:选择 840000 。 Prompt 提示词:用英文写想要生成的内容,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写想要避免产生的内容,单词、短语之间用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 3. Liblibai: 简明操作流程: 定主题:确定生成图片的主题、风格和表达的信息。 选择 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora,控制图片效果及质量。 设置 VAE:选择 840000 。 CLIP 跳过层:设成 2 。 Prompt 提示词:用英文写想要生成的内容,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写想要避免产生的内容,单词、短语之间用英文半角逗号隔开。 采样方法:一般选 DPM++2M Karras,参考模型作者推荐的采样器更有保障。 迭代步数:选 DPM++2M Karras 时,迭代步数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 生成批次:默认 1 批。
2025-03-06