Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

mj如何指定生成16:9的图

Answer

要在 Midjourney(MJ)中指定生成 16:9 的图,可以按照以下步骤操作:

  1. 首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt[图像网址]”。
  2. 回到官网,复制图像的提示词,再回到 discord 粘贴到刚才拷贝的网址后面,注意空一格。
  3. 生成图像后,放大觉得还不错的一张,点击“Custom Zoom”。
  4. 此时可以改变拉伸镜头后的画面比例,将“--ar”这个参数后面的数值改成 16:9(默认的方形构图这里是 1:1),“--zoom”参数设置为 1.5。“--zoom”参数是镜头拉伸的倍数,1.5 - 1.7 比较靠谱,太大(比如 2)会有更大几率生成一些莫名其妙的东西。
  5. 选一张比较好的放大一下,就可以放进 PPT 调整构图。如果构图还是不太好,可以在当前这张图的基础上再用一次“Zoom Out 1.5x”。

另外,在 Pika 中使用 MJ 生成图片时,默认的照片幅度是 16:9。在使用 MJ 进行图生图功能时,要注意截图的对标比例未必是标准的 9:16,可以手动修改一下比例,以省去一些返工的情况。

Content generated by AI large model, please carefully verify (powered by aily)

References

MJ应用篇 快速给PPT配图

[heading2]稍微高级一点的薅[heading3]复制图像链接[content]这时候我们需要首先复制一下图片的网址:然后打开discord,在聊天栏输入/imagine prompt[图像网址][heading3]复制提示词[content]之后再回到官网,把图像的提示词也复制下来再回discord黏贴到刚才拷贝的网址后面,注意空个格[heading3]生成图像[content]都搞好以后输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图,注意:非自己做的图无法获得random seed所以不能弄得完全一样,如果效果不理想多反复生成几次吧。之后放大觉得还不错的一张,在放大的图里做如下步骤:[heading3]改变比例和镜头拉远[content]首先,点这个Custom Zoom此时可以改变拉伸镜头后的画面比例,如果是屏显PPT一般用16:9,如下图,把--ar这个参数后面的数值改成16:9(默认的方形构图这里是1:1)--zoom参数设置为1.5--zoom参数是镜头拉伸的倍数,1.5~1.7比较靠谱,太大(比如2)会有更大几率生成一些莫名其妙的东西[heading3]检查构图[content]选一张比较好的放大一下,就可以放进PPT调整构图了。构图如果没问题可以直接跳到:[6.提升分辨率](https://waytoagi.feishu.cn/docx/PF9Kdj7gXo0XeVxziCicWYytnVh#doxcn0yGP81zcgAUhSoeXsAsDrc)如果构图还是不太好的话可以在当前这张图的基础上再用一次Zoom Out 1.5x,这样做和直接2x不同,不会有太多奇怪的东西进来。这时候的构图可能就差不多了,选一张比较好的放大出来试试

Pika介绍及使用指南

首先,完整输出<Initialization>中的内容进行自我介绍(例如,大师:您好,我是MidJourney图片生成大师……)。然后,接收用户发送的故事内容,并询问该段内容需要分几个镜头(例如,大师:请问需要分几个镜头呢?没有特别说明我可以自动帮您分镜)。然后,询问分镜中的人物外貌长什么样子。然后,询问照片幅度是什么样子的,默认是16:9。然后,询问用户想要的画面风格,这个画面风格将会是贯穿整个分镜图片的画面风格。然后,使用英文输出分镜内容,如果某个分镜内容缺失了,要根据分镜上下文来进行补充。每个分镜的输出格式为:分镜描述,人物描述,环境描述,氛围描述,灯光描述,色彩描述,构图描述,风格描述在每个描述后面都加入--ar 16:9(最后的结尾没有句号)解释如下:分镜描述:描述这个镜头下的艺术表现手法,用华丽的辞藻来叙述。人物描述:描述故事主人公的性别、年龄、身高、体重、穿着衣服的外貌。环境描述:在这个分镜下,周遭环境是什么样子的。如果用户给出的内容没有提起环境内容,就需要大师自行补充环境内容。氛围描述:根据当前分镜词和用户提供的内容推理出氛围描述。灯光描述:例如,顶光的、雾气光、漫反射的、强对比的。色彩描述:例如,(色彩三要素)低饱和度的、颜色鲜艳的、花里胡哨的、强反射的、主色调、某种颜色是accent color。

WTF:1w粉 - 10w粉仅仅用时 13 天,像素级拆解《动物时装秀》

接下来讲一下MJ的使用,有一些要注意的地方。MJ也有图生图的功能。命令:/describe选择image上传本地图片即可,会获取到上传图片的四条提示词。点击下方的标签可以直接生成对应提示词的四张图。此时要注意:咱们截图的对标比例未必是标准的9:16咱们可以在点,手动修改一下比例,这样可以省去一些返工的情况。(别学我,--ar我当时就是忘改了)大家自行对比反推的词和对标的相似程度,自己再微调一下。可以看到describe,根据对标图反推出来的效果不算特别好。但是可以给大家一点方向,大家根据推出的词自行修改即可,也可以直接用我下面分享的这个提示词。(我用括号括起来的地方大家可以自行替换)提示词分享:Anthropomorphic(mice),fashion runway,whole body,(wearing red northeast big flower jacket),anthropomorphic,high-end design style,cool,slender figure,Milan fashion show,whole body,dynamic capture runway show,front view,facing the camera--ar 9:16--style raw中文:拟人(老鼠),时尚t台,全身,(穿着红色东北大花夹克),拟人,高端设计风格,酷炫,修长身材,米兰时装秀,全身,动态捕捉t台秀,正面视角,面向镜头这时候我就遇到了最难受的点,就是死活画不出来一个拟人形态的龙。这里其实就是MJ理解的一个问题,咱们确实描述了,但是它理解的和我们描述的并不一致,并不是它画不出来,而是我们的描述不够准确。对于龙,MJ的理解其实是dragon=中国人,这个时候我们就需要加强描述词,首先可以把断开的提示词连成一句话,一条亚洲龙站在时尚秀场上。此时MJ就可以正确理解咱们的意思了。

Others are asking
分析一下a16z 的ai top100榜单
以下是对 a16z 的 AI top100 榜单的分析: A16Z 的 AI top100 榜单聚焦生成式 AI 应用。自 ChatGPT 将生成式 AI 引入公众视野以来,已涌现出成千上万面向消费者的相关产品。 在 AI 陪伴方面,它已成为生成式 AI 的主流应用场景之一。例如,Character.AI 在网页端和移动端榜单上表现出色。网页端有八家 AI 陪伴公司进入榜单,移动端有两家。其中,多数产品自诩“无限制”,用户可进行不受限的对话或互动,且访问主要通过移动网页,平均 75%的流量来自移动设备。对于有移动应用的陪伴产品,用户参与度高,如 Character.AI 每位用户平均每月会话次数达 298 次,Poly.AI 为 74 次。 时隔六个月更新分析,超过 40%的公司是首次出现在榜单上。与六个月前相比,有 30%的新公司。名次进步最大的是 Suno,从第 36 名到第 5 名。移动端最多的应用是图像和视频编辑,占 22%。Luzia 服务西班牙语用户值得关注。字节多款应用上榜,包括 Coze、豆包、CiCi、醒图、Gauth。美学和约会应用开始增加,为用户提供相关建议。此外,Discord 流量值得关注,相当多的应用在其平台完成 PMF 验证。 原文链接:https://a16z.com/100genaiapps/ 作者:A16Z Olivia Moore 发布时间:2024.03.13 去年 9 月的报告:
2025-01-02
如何利用自动对齐技术,确保16位不同地点的人员录制的同一句口号音频同步且整齐,请推荐具有此功能的音频编辑工具、网站或AI工具,以便将这16段音频精确叠加并融合成一个协调一致的整体
以下是关于利用自动对齐技术确保 16 位不同地点人员录制的同一句口号音频同步且整齐的相关信息及工具推荐: 在音频编辑中,常见的步骤如下: 1. 选择合适的数字音频工作站(DAW),如 Studio One。上传 FLAC 无损格式的音频,只对融合部分进行 Inpaint 处理,保持其他音频信息不变,以避免音质问题。 2. 在 DAW 中对接音轨后,播放试听,并缩放波形图,检查波形是否正确对齐。若出现波形未对齐或播放时有咔哒声等问题,可能是在导出和处理过程中对音频施加了额外的效果器处理,如混响、限制器、压缩等,导致音频前后不一致,影响对接效果。因此,需要确保在不同的导出和处理步骤中,音频不受到额外的处理,或者在每次处理时保持相同的效果设置。 具有此功能的音频编辑工具和网站包括: 1. Studio One:可用于对齐拼接音轨,并进行后续的叠加额外音轨、调整音量和平衡等操作,以丰富音频的层次,注意叠加后各音轨的电平,避免过载或失衡。 2. Udio:具有混音功能,可对现有剪辑进行微妙或明显的变化。在提示框中有新的区域,通过滑块控制混音效果的强度。 此外,阿里的相关研究全面概述了大语言模型自动对齐的主要技术路径,将现有的自动对齐方法分为四大类:利用模型固有偏好实现对齐、通过模仿其他模型行为实现对齐、利用其他模型反馈实现对齐、通过环境交互获得对齐信号,并探讨了自动对齐背后的机理以及实现有效自动对齐的关键因素。但此研究主要针对大语言模型,对于音频对齐的直接应用可能有限。
2024-10-17
写一个将16进制转换为字符串的代码
很抱歉,暂时没有关于将 16 进制转换为字符串的代码内容。但通常来说,在大多数编程语言中,您可以使用相应的函数或方法来实现这个功能。以下是一个使用 Python 语言实现的示例代码: ```python def hex_to_str: return bytes.fromhex hex_value = "48656c6c6f" 这是 "Hello" 的 16 进制表示 print ``` 您可以根据您使用的具体编程语言,查找相关的文档和函数来完成这个转换。
2024-09-16
蛟龙16pro配置(处理器R7-7745HX,显卡RTX4060 8G,硬盘512GPCIE4.0SSD)可以用于审计人员本地化部署大模型用于数据分析工作吗
蛟龙 16pro 的配置(处理器 R77745HX,显卡 RTX4060 8G,硬盘 512G PCIE4.0 SSD)对于审计人员本地化部署大模型用于数据分析工作来说,可能存在一定的局限性。 处理器 R77745HX 具有一定的计算能力,但在处理大规模数据和复杂的模型运算时,其性能可能不够强劲。 显卡 RTX4060 8G 对于一些较为复杂的图形处理和计算任务能够提供一定的支持,但对于大规模的深度学习模型训练和数据分析,可能会显得不足。 512G 的 PCIE4.0 SSD 硬盘容量相对较小,在存储大量数据时可能会很快耗尽空间。 综上所述,该配置在一定程度上可以用于简单的数据分析任务,但对于较为复杂和大规模的大模型本地化部署及数据分析工作,可能需要更强大的硬件配置,例如更高性能的处理器、更大容量和更高性能的显卡,以及更大的存储空间。
2024-09-14
蛟龙16pro配置可以用于审计人员本地化部署大模型用于数据分析工作吗
蛟龙 16pro 的配置信息对于能否用于审计人员本地化部署大模型进行数据分析工作,需要更多关于该设备具体配置的详细信息才能准确判断。一般来说,本地化部署大模型进行数据分析工作对计算机的硬件配置有较高要求,包括但不限于强大的 CPU 性能、充足的内存容量、高速的存储设备以及优秀的显卡性能等。如果您能提供蛟龙 16pro 更详细的配置参数,我可以为您做出更准确的评估和建议。
2024-09-14
风格化mj提示词
以下是关于 Midjourney 风格化提示词的相关内容: 仿照 GPTs 里的 MJ prompt 改的提示词可用于 coze 或其他国内的 agent。MJ 对节点无要求,画插图可不切节点,不挑模型,提示词可让 agent 补全润色。例如:“一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格”的提示词为“A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6”。 Midjourney V6 更新风格参考命令 2.0“sref”,常见问题如想要的新图像和 sref 图像差异大时,MJ 给出了三种办法: 修改提示:语义细节太多时,编写提示用可取细节替换不需要的;风格不够时,修改提示使其更符合追求的风格。 更改“sw”值:语义细节太多时,将“sw”从默认值 100 降低;风格不够时,将“sw”从默认值 100 提高。 使用小权重强调或弱化不需要的画布元素。 参数总览与举例: “No 否定提示”:在提示词末尾加上“no”可让画面中不出现某些内容,如“no plants”表示图像中不出现植物。 “Quality 生成质量”:在提示词后加上“quality”或“q”参数可更改生成图像花费时间和质量,高质量需更长处理时间和更多 GPU 分钟数。 “Seeds 种子值”:MJ 依靠噪点团起点“Seed”创建视觉噪音场生成初始图像,每个图像种子值随机生成,可指定,v4 模型中相同种子值和提示词产生相同图像结果,可用于生成连贯一致的人物形象或场景。 “Stylize 风格化”:使用 stylize 参数可让 Midjourney 生成更具艺术色彩、构图和形式的图像,低风格化值生成的图像与提示密切相关但艺术性较差,高风格化值产生的图像艺术性强但与提示关联性少,AI 自由发挥空间大。
2025-04-11
MJ和runaway用什么软件代替比较好
以下是一些可以替代 MJ(Midjourney)和 Runway 的软件: Luma 发布的 DIT 视频生成模型 Dream Machine 图生视频表现惊艳,具有电影级效果。 出图工具方面,还有 SD(Stable Diffusion)和悠船。MJ 稳定性好、协作性强且有成熟经验参考,但并非所有人都拥有;SD 有独特能力但需本地部署且上手门槛高;悠船对中文支持好、交互友好简单易上手,但管控严格,有很多敏感词不能使用。 如果您想了解更多关于这些软件的详细信息或有其他特定需求,请进一步向我提问。
2025-03-24
如何使用MJ
以下是关于如何使用 MJ(Midjourney)的详细说明: 1. 图像网格: 使用 /imagine 命令可根据提示生成低分辨率图像选项网格。 每个图像网格下方的按钮可用于创建图像的变体、升级图像或重新运行最后一个 Midjourney Bot 操作。 U1U2U3U4 按钮将图像与图像网格分开,方便下载或使用其他工具,如“缩小”“平移”。使用旧版 Midjourney 模型版本时,U 按钮会放大图像。 重做(重新滚动)按钮可重新运行作业,重新运行原始提示生成新的图像网格。 变化按钮(V1V2V3V4)可创建所选网格图像的增量变化,生成与所选图像整体风格和构图相似的新图像网格。 2. 放大图像: 制作变体:创建放大图像的变体并生成包含四个选项的新网格。 网页:在 Midjourney.com 上打开图库中的图像。 最喜欢:标记您最好的图像,以便在 Midjourney 网站上轻松找到它们。 3. 模型个性化: MJ 发布了模型个性化 Personalization 或 'p' 的早期测试版本。 每次写提示时,很多信息是“隐含的”,MJ 算法通常用社区综合偏好填补空白,而模型个性化会学习您的喜好来填补。 模型个性化的要求:目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效,可在排名页面查看评分数量或在 Discord 上输入 /info。 使用方法:只需在提示后输入 'p',或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”,可分享让其他人使用应用于该图像的个性化效果,还可以使用 's 100' 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。 注意:个性化目前不是稳定功能,会随更多成对排名而变化,可能会推出算法更新,视为“不断变化的有趣功能”。 4. Midjourney V6 更新风格参考命令 2.0"sref": 2 月 1 日初次发布了首个“一致风格”测试算法,称为“风格参考”,工作方式类似于图像提示,可提供一个或多个描述想要的一致风格的图像的 URL。 使用方法:在提示后面输入 'sref' 以及一个指向图像的 URL,例如 'sref url A'。 高级设置:使用多个图像 URL 并设置风格的相对权重,例如 'sref urlA::2 urlB::3 urlC::5',通过 'sw 100' 设置风格化的总体强度(100 是默认值,0 表示关闭,1000 表示最大值),常规图像提示必须在 'sref' 之前。 注意:MJ 可能会在接下来的几周内更新此功能,若提示倾向于照片逼真而想要冲突的插图风格,可能仍需在提示中添加文本说明,风格参考对图像提示没有直接影响,仅对至少包含一个文本提示的作业产生影响,计划稍后添加“一致角色”的功能,与 'cref' 参数使用方式相同。
2025-03-13
去哪里使用mj
Midjourney 的使用方法如下: 模型个性化: 工作原理:模型个性化会学习您的喜好,以更符合您的口味生成图像。 要求:目前从成对排名中的投票和您喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效。您可以在排名页面查看评分数量,或在 Discord 上输入/info。 使用方法:在提示后输入p,或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”,您可以分享此代码让他人使用应用于该图像的个性化效果。还可以使用s 100 控制个性化效果的强度(0 为关闭,1000 为最大,100 为默认)。 注意事项:个性化目前不是稳定功能,会随您进行更多成对排名而变化,且可能会在接下来几周内推出算法更新。 在 Discord 上的使用: 与 Midjourney Bot 互动:可以在 Discord 上进行,Midjourney 服务器具有不同的界面和频道。 直接消息:与直接消息中的 Midjourney 机器人进行一对一合作,获得更安静的体验。 Midjourney 官方服务器:提供协作和计费/技术支持渠道。 频道列表:包括support 频道获取计费和技术支持,newbies 频道创建图像。 会员名单:Midjourney Bot 使用命令生成图像,版主和指南可帮助解决计费和技术问题。 V6 更新风格参考命令 2.0"sref": 初次更新 1.0 说明:2 月 1 日,MJ 发布首个“一致风格”测试算法,称为“风格参考”,可提供一个或多个描述想要的一致风格的图像的 URL。 如何使用:在提示后面输入sref 及图像的 URL,例如sref url A。系统会将图像 URL 视为“风格参考”,并尝试生成与其风格或美学相匹配的内容,适用于 V6 和 Niji V6(不适用于 V5 等)。 高级设置:可使用多个图像 URL 并设置相对权重,例如sref urlA::2 urlB::3 urlC::5,通过sw 100 设置风格化的总体强度(100 是默认值,0 表示关闭,1000 表示最大值),常规图像提示必须在sref 之前。 注意事项:MJ 可能会在接下来几周内更新此功能,若提示倾向于照片逼真而想要冲突的插图风格,可能仍需在提示中添加文本说明,风格参考对图像提示没有直接影响,仅对至少包含一个文本提示的作业产生影响,计划稍后添加“一致角色”功能,与cref 参数使用方式相同。
2025-02-28
如何用mj有效地画三视图
要有效地用 Midjourney(MJ)画三视图,可以参考以下步骤: 1. 对于核心角色创建,如局长的三视图设计,先明确角色特点,使用 GPT4 生成相关描述。 2. 进行多次尝试和修改,根据团队成员的反馈不断调整。 3. 可以用 MJ 进行垫图生成,在保持原 IP 特点的基础上重新设计。 4. 如果 MJ 生成的效果不理想,可以结合其他工具,如用 Illustrator 手绘,再用 Stable Diffusion(SD)控图,后期利用 AI 工具生成拓展视频。 需要注意的是,MJ 虽然在美术效果和设计能力上有进步,但仍可能存在局限,需要不断尝试和改进。
2025-02-25
Mj
以下是关于 Midjourney(MJ)的相关信息: 1. 文字生成效果测试:MJ 在圣诞节前夕推出新版本 V6,聚焦于文字生成方面。使用英文文本输入,对英语提示词的识别效果变好,将需要生成的文本用双引号“text”包裹,输出的图片中便能出现所要求的文字。但带文字的图片生成仍受文本量、文字在画面中的占比、其他提示词数量和画面复杂程度等因素影响。为探究 V6 的文字生成能力开展了进一步实践测试。 2. 更新风格参考命令 2.0“sref”:2 月 1 日,MJ 发布首个“一致风格”测试算法,称为“风格参考”。工作方式类似于图像提示,在提示后面输入sref 及图像的 URL,可提供一个或多个 URL 并设置相对权重,还可通过sw 100 设置风格化总体强度。此功能适用于 V6 和 Niji V6,不适用于 V5 等。MJ 可能在接下来几周内更新此功能,风格参考对图像提示无直接影响,仅对至少包含一个文本提示的作业产生影响,计划稍后添加“一致角色”功能。 3. 角色一致性功能使用报告:MJ 推出角色一致性功能,以甜茶的图片为例进行测试。使用方式是在提示后输入`cref URL`附上人物图像的 URL,注意要在提示词后面,可使用`cw`修改参考强度,强度 100 是默认值,会使用面部、头发和衣服,强度 0 时只会关注面部。
2025-02-20
文本转化成ppt的AI工具,用指定的模版
以下为您介绍几种文本转化成 PPT 的 AI 工具及使用方法: 闪击 网址:国内网站,不需要魔法。地址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 选择模版 输入大纲和要点:由于闪击的语法和准备的大纲内容有一些偏差,可以参考下官方使用指南:https://zhuanlan.zhihu.com/p/607583650,将之前准备的大纲转换成适配闪击的语法。 生成 PPT:点击文本转 PPT,并在提示框中选择确定。 在线编辑 导出:导出有一些限制,PPT 需要会员才能导出。 Process ON 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对比较耗时间。 导入方式: 1. 复制最终大纲的内容,到本地的 txt 文件后,将后缀改为.md。如果看不见后缀,可以自行搜索开启后缀。 2. 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 3. Process ON 导入 Xmind 文件。以导入方式新建思维导图。选择准备好的 Xmind 文件,导入成功。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作,生成结束。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版,再点击下载。如果喜欢用 Process ON 的小伙伴,没有会员,可以某宝买个一天会员。 歌者 PPT 功能: 话题生成:一键生成 PPT 内容 资料转换:支持多种文件格式转 PPT 多语言支持:生成多语言 PPT 模板和案例:海量模板和案例库 在线编辑和分享:生成结果可自由编辑并在线分享 增值服务:自定义模板、字体、动效等 简介:歌者 PPT(gezhe.com)是一款永久免费的智能 PPT 生成工具。用户可以轻松将任何主题或资料转化为 PPT,并选择应用大量精美的模板。无论是商务演示、教育培训、学术报告还是专业领域,歌者 PPT 都能提供便捷的操作和智能化体验,让幻灯片制作变得更加轻松高效。 产品优势: 免费使用:所有功能永久免费。 智能易用:通过 AI 技术简化 PPT 制作流程,易于上手。 海量案例:大量精美模板和优秀案例可供选择和下载。 资料转 PPT 很专业:支持多种文件格式,转换过程中尊重原文内容。 AI 翻译:保持 PPT 原始排版不变,多语言在线即时翻译。 推荐理由: 首先,歌者 PPT 完全免费,这对于经常需要制作演示文稿的学生和职场人士来说,简直是福音。 其次,它的智能化程度令人印象深刻。通过 AI 技术,歌者 PPT 可以快速将各种资料转换成精美的 PPT,整个过程既高效又准确。 歌者 PPT 的模板和案例库非常丰富,无论是职场办公还是学术演讲,你总能找到适合的模版或案例。歌者 PPT 对多语言的支持使得它在国际化环境中也非常实用,可以一键生成目标语言的 PPT,也可以把写好的 PPT 翻译成其他语言。这款工具特别适合那些不太擅长制作 PPT 或者时间紧张的人群,几乎无需学习成本就能上手使用。
2025-03-30
那个AI可以将按需求修改指定图片中的文字?
以下是一些可以按需求修改指定图片中文字的 AI 工具及相关信息: Ideogram 2.0:AI 在生成图像中的文字时,是基于学习大量文字图像及其外观和风格来创造的,并非使用真实字体。若生成的图像文字存在错误,可通过多次生成提示、使用编辑器修改文本、添加或删除部分后重新混合图像、将较长复杂单词改为较短同义词、上传包含所需文本的图像作为起点和合成源等方式纠正,使用 0.2 或 1.0 版本可能更稳定。 即梦 AI:2.1 模型对中文支持优秀(也支持英文),不仅能指定生成图像里文字的字号、字体、颜色和位置,还能指定画风并进行图像编辑。除官网外,即梦 AI App 和豆包 App 都可使用。 阶跃星辰:跃问 App 有指定的“生成海报”场景,如文字封面、指定图文、词语新解、抽象文学、祝福模板等。输入主题,系统会自动生成图片和匹配文字。近期发布的 Step1XMedium 模型支持在图片中加入英文文字。
2025-03-27
使用coze提取包含我指定的几个关键词的小红书内容数据进行汇总及分析
以下是关于使用 Coze 提取包含指定关键词的小红书内容数据进行汇总及分析的相关内容: 首先,在“一枚扣子:Coze 应用+多维表格的高速数据分析”中提到: 1. 需求是根据博主链接获取笔记并自动写入多维表格,然后进行批量分析。 2. 完成后端准备工作后,需找到博主地址,批量读取笔记并写入多维表格的 note_url 列。 3. 打开 Coze 创建应用,可选择 PC 模式,需要几个参数如多维表格地址、数据表名、小红书博主首页地址。 4. 设计读取博主笔记列表的工作流,包括创建应用、开发工作流等步骤。工作流实际上只有读取、转换、写入三步,开始节点设置三个参数,第二步需进行数据转换,添加代码节点,最后在插件市场选择多维表格插件并配置参数。 其次,在“舆情管理大师汽车 bot 小队.pptx”中: 1. 提到采集结果实时更新、智能总结链接内容、智能打分辅助判断等功能。 2. 构建高效数据流转体系,包括数据入表、关键词库等。 3. 任意关键词的工作流都适配,只需要调整 prompt。 最后,在“一枚扣子:2.0Coze 应用+多维表格+数据分析”中: 1. 介绍了配置管理,通过用户变量保存设置用于其他工作流。 2. 编排工作流,在开始节点添加变量接收 UI 输入的配置参数。 3. 包括账号分析、关键词/赛道分析等工作流,基础工作流用于查询,同步数据工作流涉及代码节点。 综上所述,使用 Coze 提取小红书内容数据进行汇总及分析需要创建应用、配置参数、设计工作流,并结合多维表格等工具实现相关功能。
2025-03-25
我想ai生成一篇综述论文,如何让它识别我指定的60篇文献
目前的 AI 技术要识别您指定的 60 篇文献来生成综述论文具有一定的挑战。但您可以尝试以下方法:首先,将这 60 篇文献的标题、摘要和关键内容整理成清晰的文本格式,提供给 AI 作为输入。其次,使用具有强大语言理解和生成能力的 AI 工具,例如一些专业的学术写作辅助工具。在向 AI 描述需求时,要明确指出您希望它参考这些特定的文献,并对文献的重要观点、研究方法、结论等进行综合分析和总结。但需要注意的是,AI 生成的内容仍需要您进行仔细的审查和修改,以确保准确性和学术规范性。
2025-03-19
如何自动化收集主流自媒体指定搜索到的主题内容?
目前没有关于如何自动化收集主流自媒体指定搜索到的主题内容的相关知识。但一般来说,您可以考虑以下几种可能的方法: 1. 使用网络爬虫工具,但需要注意遵守相关法律法规和网站的使用规则。 2. 利用一些现有的数据采集服务平台,它们可能提供针对自媒体内容的采集功能。 3. 尝试开发自定义的脚本或程序,通过调用自媒体平台的 API(如果有的话)来获取所需内容。但这通常需要一定的技术知识和开发能力。
2025-03-13
如何生成指定主题的短视频分镜头的脚本
生成指定主题的短视频分镜头脚本可以参考以下步骤: 1. 确定主题风格和时长,比如丝绸之路的古风主题。 2. 设定故事主线和镜头,例如基于故事剧本及相关资料,按照场景、地点、镜号、画面描述、台词、音效等维度进行填充。 3. 注意画面数量与台词长短的关系,尽可能精简人物对话,提炼重点。主角一句话若有 6 个字,按 3 4 字/秒核算,需 2 秒时长,通常 1 个画面可生成 2 3 秒短视频,台词越长所需画面量越多。 4. 当缺乏画面灵感时,可借助语言大模型,如要求其写好画面描述甚至加上音效需求,多提问多尝试,但最终画面的选取和平衡需进一步思考。 以下为具体示例: 以太空为主题的短视频,如镜头 1:外太空 亚历克斯工作的全景。镜头描述为亚历克斯在太空站外,地球在背景中宁静地照耀,主要角色是亚历克斯,动作是忙碌地修理太空站外部设备,对白是亚历克斯自言自语说“这些维修工作总是那么必要”。 以友情为主题的短视频,如一只白猫和一只灰狼的故事。开端是暴风来袭,白猫狼狈,饥肠辘辘,无处可去,被灰狼盯上。发展是白猫逃跑,灰狼一路猛追,从草坪到巨石,白猫躲进船里。转折是灰狼替白猫挡下掉落的甲板。结局是两人在船舱躲雨,灰狼把鱼给白猫,雨过天晴后走到海边,海边放起烟花。 若已有简单的故事梗概,1 分钟视频大概需要 25 30 个镜头,需写出分镜头脚本,并翻译成英文用于文生图工作,要写清楚画面内容,如景别(远景、全景、中景、近景、特写)和风格(真实影像风格、日本动漫风格、水墨画风格等)。
2025-03-09
生成提示词的提示词
以下是关于生成提示词的相关内容: 生成提示词的思路和方法: 可以根据效果好的图片中的高频提示词去反推效果,结合不同字体效果的描述,打包到一组提示词中。提示词给到 AI 后,AI 会根据给定文字的文义,判断适合的情绪风格,然后给出适合情绪的字体和风格描述、情感氛围等,加上一些质量/品质词,形成输出提示词结构。为了让 AI 更能描述清晰风格,可以先给定多种参照举例。 具体操作步骤: 打开 AI 工具的对话框,将相关提示词完整复制粘贴到对话框。推荐使用 ChatGPT 4o。 当 AI 回复后,发送您想要设计的文字。可以仅发送想要的文字,也可以发送图片(适合有多模态的 AI)让 AI 识别和反推。 将 AI 回复的提示词部分的内容复制到即梦 AI。 对生成提示词的一些观点: 提示词生成提示词并非必要,不一定能生成最好的 Prompt 框架,修改过程可能耗时且不一定能修改好,不如花钱找人写。 一句话生成完整符合需求的 Prompt 非常困难,只能大概给出框架和构思,需要更低成本地调整需求和修改 Prompt。 不同生图工具生成提示词的特点: 即使是简短的描述,生成的提示词也非常细节、专业。 会解析需求,找出核心要点和潜在的诠释点,并给出不同的提示词方案。 提示词构建更多在于增强,而不是发散,生成的内容更符合期望。 同时生成中、英双版本,国内外工具通用无压力。 14 款 AI 生图工具实测对比: 本次实测用到的工具包括国内版的即梦 3.0(https://jimeng.jianying.com/aitool/home)、WHEE(https://www.whee.com)、豆包(https://www.doubao.com/chat)、可灵(https://app.klingai.com/cn/texttoimage/new)、通义万相(https://tongyi.aliyun.com/wanxiang/creation)、星流(https://www.xingliu.art)、LibiblibAI(https://www.liblib.art),以及国外版的相关工具。
2025-04-20
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
如何自动生成文案
以下是几种自动生成文案的方法: 1. 基于其它博主开源的视频生成工作流进行优化: 功能:通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径:通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 生成有趣的《图文短句》: 实现原理: 先看工作流:包括第一个大模型生成标题、通过“代码节点”从多个标题中获取其中一个(可略过)、通过选出的标题生成简介、通过简介生成和标题生成文案、将文案进行归纳总结、将归纳总结后的文案描述传递给图像流。 再看图像流:包括提示词优化、典型的文生图。 最终的 Bot 制作以及预览和调试。 3. 腾讯运营使用 ChatGPT 生成文案: 步骤:通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,从而实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,系统匹配的素材不符合要求时可以手动替换。例如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类 AI 视频制作工具让普罗大众生产视频变得更轻松上手。
2025-04-15
如何通过输入一些观点,生成精彩的口播文案
以下是通过输入观点生成精彩口播文案的方法: 1. 基于其它博主开源的视频生成工作流进行功能优化,实现视频全自动创建。 效果展示:可查看。 功能:通过表单输入主题观点,提交后自动创建文案短视频,并将创建完成的视频链接推送至飞书消息。 涉及工具:Coze平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径: 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 发布 coze 智能体到飞书多维表格。 在多维表格中使用字段捷径,引用该智能体。 在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 智能体发布到飞书多维表格: 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 选择发布渠道,重点是飞书多维表格,填写上架信息(为快速审核,选择仅自己可用),等待审核通过后即可在多维表格中使用。 3. 多维表格的字段捷径使用: 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,使用自己创建的 Coze 智能体。 表单分享,实现填写表单自动创建文案短视频的效果。 4. 自动化推送:点击多维表格右上角的“自动化”,创建所需的自动化流程。 另外,伊登的最新 Deepseek+coze 实现新闻播报自动化工作流如下: 第一步是内容获取,只需输入新闻链接,系统自动提取核心内容。开始节点入参包括新闻链接和视频合成插件 api_key,添加网页图片链接提取插件,获取网页里的图片,以 1ai.net 的资讯为例,添加图片链接提取节点,提取新闻主图,调整图片格式,利用链接读取节点提取文字内容,使用大模型节点重写新闻成为口播稿子,可使用 Deepseek R1 模型生成有吸引力的口播内容,若想加上自己的特征,可在提示词里添加个性化台词。
2025-04-15
小红书图文批量生成
以下是关于小红书图文批量生成的详细内容: 流量密码!小红书万赞英语视频用扣子一键批量生产,这是一个保姆级教程,小白都能看得懂。 原理分析: 决定搞之后,思考生成这种视频的底层逻辑,进行逆推。这种视频由多张带文字图片和音频合成,带文字图片由文字和图片生成,文字和图片都可由 AI 生成,音频由文字生成,文字来源于图片,也就是说,关键是把图片和文字搞出来。 逻辑理清后,先找好看的模版,未找到好看的视频模版,最后看到一个卡片模版,先把图片搞出来,才有资格继续思考如何把图片变成视频,搞不出来的话,大不了不发视频,先发图片,反正图片在小红书也很火。 拆模版: 要抄这种图片,搞过扣子的第一反应可能是用画板节点 1:1 去撸一个,但扣子的画板节点很难用,Pass 掉。用 PS 不行,太死板不灵活,html 网页代码可以,非常灵活。经过 2 个多小时和 AI 的 battle,用 html 代码把图片搞出来了。这里不讲代码怎么写,直接抄就行。要抄,首先要学会拆,不管用什么方式批量生成这样的图片,都必须搞清楚里面有哪些是可以变化的参数,也就是【变量】,如主题、主题英文、阶段、单词数、图片、正文、翻译、普通单词、重点单词等。 想方法: 大概知道批量生成这样的图片需要搞清楚哪些参数,图片用 html 代码搞出来了。但问题是视频怎么搞,这种视频由多张不同的【带文字的图片】生成,比如读到哪句,哪句就高亮起来,图片也可以随着读到的句子变更。最后,视频就是用这样的图片一张张拼起来的。
2025-04-14
ai如何什么生成表格
AI 生成表格通常可以通过以下技术实现: 1. 利用变分自编码器(VAEs)和序列到序列模型(Seq2Seq)等技术生成表格文件、表格公式,并清理、创建、转换和分析表格中的文本数据,例如表格结构设计、数据分析表、表格自动化等。 2. 借助一些办公软件中的 AI 插件,如飞书中的相关插件,先通过 AI 理解图片中的内容并填充到表格列中,然后利用自带插件总结生成相关指令。 此外,在多模态数据生成中,结构化数据生成包括表格生成,多模态合成数据从大类来看有非结构化数据(图片、视频、语音等)和结构化数据(表格等)两大类。非结构化数据生成包括文本生成、图像生成、音频和语音生成、视频生成、3D 生成、合成数据生成等。
2025-04-14