直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

生成midjuney提示词的

回答

以下是一些关于生成 Midjourney 提示词的相关内容:

  • 相关网站:
  • 生成 B 端产品页面的方法:
    • 文本描述是 Midjourney 中最重要的出图逻辑,在输入框中输入「/image+文本描述」来生成图像。
    • 若要生成 B 端界面,先清楚 B 端产品的关键词,如输入「SaaS dashboard」可得深色 B 端界面效果。若想要简约浅色风格,可加入“白色背景”描述,如「SaaS dashboard,UI,white background」。还可尝试其他颜色,如「SaaS dashboard,UI,purplr,black,white background,frontal」。
    • Midjourney 会默认给出 4 张图像,图像下有两行按钮,第一行的 U 是放大图像提升细节,数字代表对应的图像;第二行的 V 是在基础上发生变化,数字表示对应的图像。选择觉得效果不错的图,点击相应按钮可生成更多类似图像。
    • 文本描述操作便捷,但对于新手可能存在无法准确描述关键词或生成图像与预想不一致的问题,此时可使用图片描述来创作。
  • Prompt 关键词基本格式:
    • 高质量绘图的提示词要遵循一定逻辑,可总结为“形容词+主语+环境+行为+构图+参考风格+渲染程度+后缀”的公式。
    • 对人物、环境、摄影灯光、成像质量等描述越详细,最终效果越接近期望。后缀词可规定绘图比例。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Prompt网站精选

|站点名|网站介绍|地址|附件||-|-|-|-||MidLibrary|Midjourney最全面的流派、艺术技巧和艺术家风格库|[https://www.midlibrary.io/](https://www.midlibrary.io/)|||MidJourney Prompt Tool|类型多样的promot书写工具,点击按钮就能生成提示词修饰部分|[https://prompt.noonshot.com/](https://prompt.noonshot.com/)|||OPS可视化提示词|这个网站有Mid Journey的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词|[https://moonvy.com/apps/ops/](https://moonvy.com/apps/ops/)|||AI-art魔法生成器|中文版的艺术作品Prompt生成器|[https://www.ai-art.com.cn/?prompter/](https://www.ai-art.com.cn/?prompter/)|||IMI Prompt|支持多种风格和形式的详细的MJ关键词生成器|[https://www.imiprompt.com/](https://www.imiprompt.com/)|||Prompt Hero|好用的Prompt搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney|[https://prompthero.com/](https://prompthero.com/)|||OpenArt|AI人工智能图像生成器|[https://openart.ai/](https://openart.ai/)|||img2prompt|根据图片提取Prompt|[https://replicate.com/methexis-inc/img2prompt](https://replicate.com/methexis-inc/img2prompt)|||MidJourney提示词工具|专门为MidJourney做的提示词工具,界面直观易用|[https://aijiaolian.chat/midjourney](https://aijiaolian.chat/midjourney)|||PromptBase|Prompt交易市场,可以购买、使用、销售各种对话、设计Prompt模板|[https://promptbase.com/](https://promptbase.com/)|||AiTuts Prompt|AiTuts Prompt是一个精心策划的高质量Midjourney提示数据库,提供了广泛的不同风格供你选择。|[https://prompts.aituts.com/](https://prompts.aituts.com/)||

如何用Midjourney生成B端产品页面?收下这份AI关键词总结!

文本描述是Midjourney中最重要的出图逻辑,在输入框中输入「/image+文本描述」来生成图像。操作方法如果我们想要生成一个B端界面,首先要清楚B端产品有哪些关键词可以使用。先试着在Midjourney中输入一条简单的prompt提示:「SaaS dashboard」,就能得到一个深色的B端界面效果。比如现在更流行简约浅色的B端设计风格,我们可以在prompt提示中加入“白色背景”描述,生成更加简约和流行的B端界面:「SaaS dashboard,UI,white background」当然除了深色和白色,还可以继续尝试其他颜色,例如你负责的产品主色是紫色,想得到一个主题色为紫色的深色B端界面,使用这段提示:「SaaS dashboard,UI,purplr,black,white background,frontal」Midjourney会根据关键词提示默认给出4张图像,图像下面有2行按钮,通过这些按钮能进一步控制生成的图像效果。第一行的U是Upscale,代表放大图像提升细节,数字代表对应的图像U1,U2,U3,U4。第二行的V是Variation,代表在基础上发生变化,数字表示对应的图像V1,V2,V3,V4。选择你觉得第2张图效果不错,还想看更多类似的图像,就可以点击V2,再生成四个和第2张图相似的图像。使用分析文本描述虽然操作起来很便捷,但对于刚使用Midjourney的小伙伴来说容易导致两个问题:一是无法准确描述出想要生成的图像需要哪些关键词提示;二是输入了很多关键词提示,但生成的图像和预想的效果不一致。对于一段关键词提示,可能调整两个字的前后顺序或者增删某一个字,都会对生成的结果产生很大的影响,从而导致产生很多废稿。对于这种情况,为了能更快更好地控制输出效果,我们就可以使用下面要讲到的图片描述来AI创作。

【Midjourney】Prompt关键词基本格式

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-04-25 20:01原文网址:https://mp.weixin.qq.com/s/uJ0ldUQ0v-ps7LBC2DPUOQ在刚开始使用Midjourney绘图的时候,我们经常会发现自己渲染出来的图片和别人的相比总是感觉不够高级,按照自己想象中的画面去描述也得不到想要的效果,这些原因其实与我们给Midjourney的提示词有很大的关系。比如我曾经写过的一部长篇小说《长生谣》,我想使用Midjourney帮我生成一些小说中的剧照场景。在里面有一场主角在大雪中和一群土匪对峙的戏,满山的大雪,主角执剑而立,我希望能表现一种英雄大侠的气势。一开始我使用了这样的关键词。这是Midjourney给我生成的四张图,虽然好像是这个意思,但是画面看起来确实一言难尽,没有体现出英雄的感觉,构图也只是像一张张拍摄花絮。出现这样的情况,主要是和我们的提示词有关,虽然怎么输入好像都可以生成图片,但是高质量的绘图还是要遵循一定的逻辑的。我们可以把提示词总结成这样一段公式“形容词+主语+环境+行为+构图+参考风格+渲染程度+后缀”。接下来,我重新编写一下提示词。首先是对人物的描述,情绪、发型、穿着,你写得越详细,最终的效果就会和你期望得越接近。然后是对环境的描写,天气、地理位置等。再然后是对摄影、灯光的描述,和成像质量的描述,最后的后缀词可以规定绘图的比例。接下来,Midjourney给我生成了四张图,这次的结果就像那么回事了。尤其是这一张,挺接近我心目中主角的样子了,无论是光影的层次,还是背景肃杀的大雪,都体现出了一个坚毅、冷峻的大侠风骨。

其他人在问
写施工方案的提示词有没有
以下是一些常见的提示词技巧,可用于写施工方案: 类比:要求 AI 用类比或示例阐明概念,例如“请用一个类比解释施工中的关键技术”。 引述:要求包含专家的相关引言或陈述,比如“在施工方案中引用著名建筑专家的观点来支持关键施工步骤”。 幽默:表明是否应融入幽默,例如“在施工方案的安全注意事项部分加入一些幽默元素,以增强记忆”。 轶事:要求包含相关轶事,比如“在关于大型建筑施工的方案中,分享一则有趣的施工过程中的轶事”。 隐喻:鼓励使用隐喻使复杂观点更具亲和力,例如“在描述施工流程的复杂性时,用‘施工像搭积木一样需要有序进行’这样的隐喻”。 趣闻:鼓励包含有趣或令人惊讶的事实,比如“在谈论新型建筑材料时,分享一些有趣的材料特性的事实”。 关键词:列出需要包含的重要关键词或短语,例如“请在施工方案中包含‘施工进度’‘质量控制’和‘安全保障’”。 小贴士:鼓励 AI 分享与主题相关的小窍门和技巧,比如“分享几个关于提高施工效率的小贴士”。 保密性:说明保密要求或限制,比如“在施工方案涉及商业机密的部分,不要泄露相关信息”。 格式化:指定所需的格式元素(如标题、副标题、列表),例如“在写施工方案时,使用列表来呈现施工步骤”。 概括:要求对较长内容进行简要概括,比如“请为这个复杂的施工方案提供一个简短的概要”。 讲故事:要求使用讲故事或叙事技巧,例如“请用一个成功的施工案例故事来展示优秀的施工管理”。 优缺点:要求 AI 评估主题的优缺点,比如“分析这种新型施工方法的优缺点”。 利弊分析:要求对主题的利弊进行分析,例如“分析使用预制构件施工的利与弊”。 问题解决:要求针对特定问题提供解决方案或建议,比如“请提供几个有效的解决施工中遇到的技术难题的方法”。 最佳实践:要求 AI 提供关于某主题的最佳实践或指南,比如“请提供一份关于如何确保施工质量的最佳实践指南”。 时间线:要求 AI 提供事件或发展的时间线,比如“请为这个建筑项目的施工进程提供一个简要的时间线”。 行动呼吁:要求明确的行动呼吁或后续步骤,比如“在施工方案结尾提出具体的施工推进行动建议”。 分步指南:要求提供过程的分步指南或说明,比如“提供一个关于如何进行基础施工的分步指南”。 历史背景:要求考虑历史背景或背景,比如“在写关于高层建筑施工的方案时,谈论高层建筑施工的历史发展”。 对比:要求 AI 比较和对照不同的观点或概念,比如“请比较传统施工方法和现代施工方法的优缺点”。 敏感性:提及需要谨慎处理或避免的敏感主题或问题,比如“请谨慎讨论施工中的环保敏感问题”。 伦理考虑:提及要遵循的道德准则,比如“在施工方案中探讨施工过程中的伦理和道德问题”。 修订要求:提及修订或编辑指南,比如“请根据行业标准对施工方案进行编辑和修订”。 未来影响:鼓励讨论潜在的未来影响或趋势,比如“在谈论建筑施工技术的发展时,探讨其未来在城市建设中的应用前景”。 视觉元素:询问是否包括图表、图形或图像,比如“请在施工方案中包含相关的施工图纸和进度图表”。 截止日期:提及时间敏感回应的截止日期或时间范围,比如“请在一周内给我一份完整的施工方案”。 文化参考:鼓励包含相关的文化参考,比如“在关于古建筑修复的施工方案中谈论当地的建筑文化特色”。
2024-12-22
如何写好提示词
以下是关于如何写好提示词的一些要点: 1. 明确任务:清晰地定义任务,如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 5. 使用示例:如有特定期望结果,提供示例帮助模型理解需求。 6. 保持简洁:提示词简洁明了,避免过多信息导致模型困惑。 7. 使用关键词和标签:有助于模型理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整提示词,可能需多次迭代。 此外,还需注意以下几点: 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,如“一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量”。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,输入不想生成的内容,如“不好的质量、低像素、模糊、水印”。 利用“加权重”功能:在功能框增加提示词并调节权重,数值越大越优先,也可编辑已有提示词权重。 善用辅助功能:如翻译功能可一键将提示词翻译成英文,还有删除所有提示词、会员加速等功能。 同时要记住,提示词应清晰明确,避免模糊不清的指令,提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。
2024-12-21
如何写提示词
以下是关于如何写提示词的一些建议: 1. 明确任务:清晰地定义任务,比如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,要提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,应在提示词中明确指出。 5. 使用示例:如有期望结果,可提供示例帮助 AI 理解需求。 6. 保持简洁:避免过多信息导致 AI 模型困惑。 7. 使用关键词和标签:有助于 AI 模型理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整提示词。 对于特定的设计工具,如星流一站式 AI 设计工具: 1. 输入语言方面,通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),且支持中英文输入。 2. 写好提示词的方法包括: 预设词组:小白用户可点击提示词上方官方预设词组进行生图。 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,例如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:在功能框增加提示词并进行加权重调节,权重数值越大越优先,也可对已有的提示词权重进行编辑。 辅助功能:如翻译功能可一键将提示词翻译成英文,还有删除所有提示词、会员加速等功能。 此外,还需注意提示词应清晰明确,避免模糊不清的指令,提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。
2024-12-21
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
通过提示词可以提高模型的数学计算能力吗
通过提示词可以在一定程度上提高模型的数学计算能力。例如 PoT 技术,它是思维链技术的衍生,适用于数值推理任务,会引导模型生成一系列代码,再通过代码解释器工具进行运算,这种方式能显著提升模型在数学问题求解上的表现。PoT 作为 CoT 的衍生技术,遵循零样本和少样本的学习范式,零样本 PoT 与 CoT 方法相似,不需要大量样本即可进行有效推理,少样本 PoT 也通过较少样本优化模型表现。但需要注意的是,大模型在解决数学问题时可能存在不够可靠的情况。
2024-12-20
有哪些好的提示词网站
以下是一些好的提示词网站: 文本类 Prompt 网站: Learning Prompt:授人以渔,有非常详尽的 Prompt 学习资源,包括 ChatGPT 和 MidJourney。网址: FlowGPT:国外最大的 prompt 站,内容全面且更新快。网址: LangChain Hub:LangChain 推出的提示词管理工具。网址: 微软 Prompt Flow:微软发布的开源 LLM 开发工具集,简化了基于 LLM 的人工智能应用程序的开发周期。网址: PromptPort(支持中文):AI Prompt 百科辞典,聚合了市场上大部分优质的 prompt 词库。网址: PromptKnit:The best playground for prompt designers。网址: ChatGPT Shortcut:提供了非常多使用模板,简单修改即可指定输出。网址: ClickPrompt:轻松查看、分享和一键运行模型,创建 Prompt 并与其他人分享。网址: Prompt Extend:让 AI 帮你自动拓展 Prompt。网址: 图像类 Prompt 网站: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库。网址: MidJourney Prompt Tool:类型多样的 prompt 书写工具,点击按钮就能生成提示词修饰部分。网址: OPS 可视化提示词:有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词。网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器。网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器。网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney。网址: OpenArt:AI 人工智能图像生成器。网址: img2prompt:根据图片提取 Prompt。网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用。网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板。网址: AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格。网址: 其他图像类 Prompt 网站: NovelAI tag 生成器:设计类 Prompt 提词生成器。网址: 魔咒百科词典:魔法导论必备工具,简单易用的 AI 绘画 tag 生成器。网址: KREA:设计 AI 的 Prompt 集合站,create better prompts。网址: Public Prompts:免费的 prompt 合集,收集高质量的提示词。网址: AcceleratorI Prompt:AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词。网址:
2024-12-20
准备开通小红书账号想生成一个图作为头像使用什么工具最好
以下为您推荐两款适合生成小红书头像的工具及相关介绍: Recraft: 是一款由 Recraft AI 推出的多功能人工智能图像生成与编辑工具。 自 2022 年成立以来,总部位于伦敦,赢得了全球超过 150 万设计师的青睐,包括 Netflix、Airbus 等大型企业团队。 具有卓越的文本渲染功能,能将描述性文字精确转化为图像中的清晰文本,适用于品牌设计、广告文案和书籍封面等创意场景。 提供多种风格控制功能,确保品牌在图像中的视觉一致性,并支持生成矢量图形,对设计行业友好。 集成多种 AI 工具,包括擦除、修改、放大和背景去除,能高效调整图像细节。 具有实时协作和无限画布功能,适合团队合作。 2024 年 10 月推出的全新 Recraft V3 模型,在 Hugging Face 的文本到图像生成基准测试中位居榜首,提升了图像生成的精度和速度,优化了生成内容的风格一致性与细节控制。 个性卡通头像生成方法: 复杂提示词:如果觉得简单提示词不够好,可以选择更复杂的提示词,如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 不同照片生成:如果对照片风格不满意,可以更换新照片并使用上述提示词重新生成。 其他调整:若觉得 Disney 风格太过卡通,可将提示词中的 Disney 换成 Pixar;若为女孩,可将提示词中的 boy 换成 girl。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。
2024-12-22
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。介绍技术点的技术逻辑以及技术细节。
目前在游戏领域应用的前沿 AI 技术点主要包括以下几个方面: 1. 利用 AIGC 技术实现游戏产业的生产力革命: 降低开发成本:借助人工智能的内容创作工具,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等,能够缩减游戏开发的成本。 缩短制作周期:例如通过程序化内容生成,包括利用人工智能生成文字、图像、音频、视频等来创作游戏剧本、人物、道具、场景、用户界面、配音、音效、配乐、动画和特效等,从而减少游戏开发时间。 提升游戏质量和带来新交互体验:AIGC 技术为游戏带来不同以往的新体验,甚至创造出新的游戏类型以及新的交互方式。 2. 游戏内容辅助生成: 生成文、生成图、生成 3D 以及生成音乐。应用场景包括游戏策划人和制作人、美术设计师等。 对于工业化的游戏公司,基于 Stable Difussion 的生成能够通过 2D 美术素材的辅助生成提高创业效率 50%,降低 20%80%的成本。 文生图:通过提示词加参数就可以形成 2D 的参考图,适配度高。 图生图:原画师或美术可以使用,用一个线稿或原画,在原画基础上加一些 Prompt 和参数,就可以形成一个效果图和二级的素材。 动画辅助渲染:用 Lora 对角色背景、关键帧进行风格渲染,例如将真人视频渲染成二次元风。 3. 游戏的智能运营: 智能 NPC 互动:保持长期记忆,保持人物个性和对话表现形式,同时满足成本平衡。 客服、攻略的问答、代码和脚本的生成。主要针对游戏的产品经理、运营经理和社区的运营经理。 游戏社区运营:如海外的 Discord,国内的 Fanbook,让更多玩家在游戏之外,在社群里面很好地互动,基于游戏的美术素材进行二创、查询攻略和使用智能客服。 这些技术的技术逻辑和技术细节如下: 1. AIGC 技术:基于大语言模型和扩散模型,通过机器学习、强化学习等先进技术进行训练,能够理解和生成各种游戏相关的内容。 2. 游戏内容辅助生成:利用深度学习算法对大量的游戏相关数据进行学习和分析,从而能够根据给定的提示或参数生成相应的游戏内容。 3. 智能运营方面:通过构建智能模型,对玩家的行为和需求进行分析和预测,从而提供个性化的服务和互动。
2024-12-22
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。
目前在游戏领域最前沿的 AI 技术点主要包括以下几个方面: 1. 探索将游戏环境中的成果迁移至现实世界:电子游戏作为人工智能算法的测试场,为人工智能模型的构建与训练提供了理想化的场所。但将游戏中的技术推广到现实世界应用仍面临诸多挑战。 2. 利用 AIGC 技术实现游戏产业的生产力革命: 借助人工智能的内容创作工具,降低开发成本、缩短制作周期、提升游戏质量和完成度,带来新体验,创造新游戏类型和交互方式。 应用于电子游戏开发的多个方面,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等。 3. 为通用人工智能的孵化提供帮助:经过多个复杂游戏训练后的“玩游戏”的人工智能体。 4. 借助人工智能完成大型游戏的制作:如《微软模拟飞行》通过与 blackshark.ai 合作,利用人工智能从二维卫星图像生成无限逼真的三维世界,且模型可随时间改进。 5. 生成式人工智能模型在游戏资产中的应用:出现了用于游戏中几乎所有资产的生成式人工智能模型,包括 3D 模型、角色动画、对话和音乐等。 6. 降低游戏制作的内容成本:整合生成式 AI 可大幅降低制作游戏的时间和成本,例如为一张图片生成概念图的时间从 3 周下降到 1 小时。
2024-12-22
我想生成一张机器人的图片
以下是为您生成机器人图片的相关指导: 提示词:使用简笔画的方式帮我画一张机器人的图片,画风可爱一些,去掉所有辅助线,要求只有唯一的一个主人公,同时左右对称结构,线条少一些简单点。 图像流搭建: 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。 了解图像流节点的意义:左侧工具栏集合了智能处理、基础编辑、风格处理等工具,右侧类似画布,可拖拽工具模块并连接形成工作流程。 根据需求进行图像流设计:例如生成海报功能,需总结故事,优化提示词,输入生图大模型并调整输出最终配图海报。 图片处理: 以中轴线为基础裁剪图片,图片左边保持原样不动,右边增加一个与左边相同的空白图片且背景色一致,并展示结果。 针对新生成的整张图,加入水平和竖直方向各 11 条等距虚线辅助线,并展示结果。 另外,关于机器人图片生成和相关处理还存在一些问题及解答: 理想生成图片只实现了一次,其他几次生产文字加链接,链接需点进去查看且图片需渲染或加载,可在 github 上搜索 nicecoze 插件将 markdown 转换为图片消息。 Coze 里面模型配置用的 GPT4o,程序运行调用的是 GPT3.5 Turno,这没有影响,依然使用的是 GPT4o,只是 token 计算方式用的 3.5。 Coze 加入插件 Data Analysia 等互动过程无法实现功能,需在 coze 里处理,与 cow 的 config 无关。 yum 安装报错可能是重新安装导致,需确认服务器类型,如阿里云自带 yum 则无需执行相关安装步骤。
2024-12-22
可灵和即梦哪个生成视频的能力更强
目前难以直接明确可灵和即梦哪个生成视频的能力更强。 Google DeepMind 和 OpenAI 展示了强大的文本到视频扩散模型预览,但访问受限且技术细节披露不多。Meta 更进一步,将音频加入其 Movie Gen 模型。 在 2024 年,国内涌现出一系列 AI 生成视频工具,如可灵、即梦、智谱清影等,生成结果甚至远超国外。 即梦是剪映旗下的,生成 3 秒视频,动作幅度有很大升级,有最新的 S 模型和 P 模型。可灵支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。 在图生视频方面,市面上主要的工具包括可灵、即梦、Luma,核心方法是穷举和不断调整 prompt 来设计人物动作、辅助镜头运镜等。
2024-12-21
文字生成视频有哪些好的应用
以下是一些文字生成视频的好的应用: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要注意的是,Runway 是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 6. Genmo:相较于 Pika 和 Runway,生成视频的清晰度大幅提高,人像的稳定性和美观度强很多,支持镜头控制且控制粒度更细,但还没开放图片生成视频,只能用文字提示词。 7. VIGGLE:能直接通过文字描述让任何静态图动起来,能做各种动作,还能直接文字生成视频,进行各种角色混合和动作替换。其核心技术基于 JST1 模型,该模型是首个具有实际物理理解能力的视频3D 基础模型,能够根据用户需求,让任何角色按照指定方式进行运动。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。内容由 AI 大模型生成,请仔细甄别。
2024-12-21