直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

生成一个优质的AI视频,如何提供一个好的提示词

回答

以下是关于如何提供一个好的 AI 视频提示词的相关指导:

在 AI 视频生成中,提示词(prompt)是直接描述或引导视频生成的文本或指令,类似于给 AI 的提示,包含主体、运动、风格等信息,借此控制和指导生成内容。其作用十分重要,是表达需求的方式,影响视频内容和质量。您可以理解为将输入的文字变成对应的画面和运动形式。

在测试 AI 视频产品模型 txt2vid、img2vid 能力时,通常基于以下结构撰写提示词,您也可以参考以下内容对提示词进行丰富:“我正在测试 Runway、Luma 等视频生成产品对文本的语义理解能力和视频生成效果,现在需要你帮我写几段提示词。提示词需要满足:主体物+场景+运动内容+相机视角+氛围描述的基本内容描写,请分别给出中英文提示词内容。”

对于 PixelDance V1.4 模型,写好 prompt 对于视频生成的效果非常重要。I2V 提示词的秘诀是用简洁准确的自然语言写出想要的变化,尽量不描述静止的部分。上传图片的质量对图生视频影响较大,尽量上传高清高质量的图片。PixelDance 的特色包括多个连续动作、自由的运镜控制、多镜头切换。当获得稳定结果后可尝试增加更多动作/镜头描述以获得更生动效果。当生成的视频不符合预期时,修改提示词,换成具象描述,删除不重要部分,将重要内容前置。如果擅长提示词写作,可以关闭【提示词增强】获得更精准操控;刚开始 AI 视频创作,推荐打开【提示词增强】。

总之,要想获得最佳的视频质量,需要认真撰写提示词。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

即梦AI 视频生成 | 教你如何写好prompt

即梦Dreamina是一款具备强大视频生成功能的工具,它可以根据用户提供的图片、prompt(文字指令)和各种参数设置生成高质量的视频。但是,要想获得最佳的视频质量,需要写好prompt。在本教程中,我们将探讨如何写好prompt,以获得最佳的视频效果,减少您的“抽卡”成本。[heading2]⭐️【新手必看】什么是Prompt/文字指令[content]✅在AI视频生成中,prompt是直接描述或引导视频生成的文本或指令;✅类似给AI的提示,包含主体、运动、风格等信息,用户借此控制和指导生成内容;✅ Prompt在AI视频生成中作用十分重要,是表达需求的方式,影响视频内容和质量;✅如果上述过于抽象,您可以理解Prompt为:将您输入的文字变成对应的画面和运动形式。图片生视频- prompt输入位置文本生视频- prompt输入位置

AI视频爆发式更新- 近半年闭源产品趋势

在测试AI视频产品模型txt2vid,img2vid能力时,我通常会基于以下结构撰写提示词你也可以参考以下内容对提示词进行丰富:当然,也可以让Claude等大模型帮助我们撰写提示词,这里是输入给语言模型的Prompt,你可以基于此进行修改:“我正在测试Runway、Luma等视频生成产品对文本的语义理解能力和视频生成效果,现在需要你帮我写几段提示词。提示词需要满足:主体物+场景+运动内容+相机视角+氛围描述的基本内容描写,请分别给出中英文提示词内容。”[heading1]节语[content]今年最大的感受是AI技术进步越来越快,几乎每隔几天都会刷新一次新模型、产品能力的认知。目前图像、视频生成解决的主要问题还是素材生产,各家产品还在卷数据集、模型能力,卷生成的质量、速度。比起单一素材的生产、创意表达,我会更关注可以工业化的机会,因为这里蕴含的产品化可能性更高。上半年我将大部分业余精力都投入在了ComfyUI的学习上,6月也小小实践了一下将一批AI工业化生产的内容落地上线。但素材生产的需求不是每个C端产品都有,机会可遇不可求。想打磨好一个AI功能。每个具体case其实都需要团队从模型到技术方案、生产流程、参数细节精心打磨,需要环境给予耐心,AI并不像媒体每天喊的那样颠覆颠覆,其渗透到用户的日常使用消费中,还需要各个团队沉下心来投入大量时间。经过上半年的学习实践,我也愈发感受到AI对使用者综合能力的要求,能做出优秀作品的总是那些原本就在某个行业处于头部的人。在技术还在快速刷新的时期,AI产品的学习难度还在持续提升,随着产品能力愈来愈强,行业出现了更多对技术能力综合使用,去解决更复杂的问题的案例。如果大家有更多的交流诉求、更好的建议,欢迎关注公众号后台交流,谢谢~

PixelDance V1.4 提示词指南

PixelDance V1.4是ByteDance Research团队开发的DiT结构的视频生成大模型。同时支持文生视频和图生视频,能够一次性生成长达5秒或10秒的精彩视频片段,支持6种不同的尺寸。[heading1]提示词指南[content]写好prompt对于视频生成的效果非常重要,请认真撰写。I2V提示词的秘诀就是:用简洁准确的自然语言写出你想要的变化,尽量不要描述静止的部分。上传图片的质量对图生视频影响较大,请尽量上传高清高质量的图片。PixelDance的特色:多个连续动作、自由的运镜控制、多镜头切换。当你获得稳定的结果后可以尝试增加更多的动作/镜头描述,以获得更生动的效果。当生成的视频不符合预期时,修改提示词,换成具象描述,删除不重要的部分,将重要内容前置。如果您擅长我们的提示词写作,可以关闭【提示词增强】,获得更精准的操控;如果您刚开始ai视频的创作,推荐打开【提示词增强】。

其他人在问
我能不能用AI做一个实时交流的社群
以下是关于您能否用 AI 做一个实时交流社群的相关信息: AI 音乐方面: 存在 AI 音乐共建者的社群。 使用方式:文档中可贴喜欢的音乐或投稿教程,定期组织音乐交流会,社群中可实时交流音乐相关创作作品和经验分享。 加入条件:至少有一首以上的 AI 音乐作品,添加 AAAAAAAJ 备注音乐。 近期活动:「在线音乐会」网友出题,现场生音乐(时间待定);「Reaction」收集 AI 音乐,大家一起欣赏,记录听到意想不到的好听的歌的反应(时间待定)。 有趣的音乐可贴在文档下方,持续收集中。 Inworld AI 方面: 使 NPC 能够自我学习和适应,具有情绪智能。 特点和功能: 实时语音:使用内置语音设置进行最小延迟,可配置角色的性别、年龄、音调和说话速度,或使用第三方服务创建自定义和克隆语音。 “Contextual Mesh”功能:定制 AI 非玩家角色(NPC)的行为和知识。 可配置的安全性:可配置 NPC 对话方式,适应不同年龄级别游戏。 知识:输入“个人知识”控制角色应知道或不应知道的信息,使用“共享知识”定义多个角色拥有的知识。 玩家档案:收集玩家信息,让 NPC 在互动时考虑。 关系:配置角色关系流动性,创建不同关系的角色。 第四堵墙:确保角色只从其世界中的知识获取信息,创建更沉浸的体验。 可与各种游戏引擎(如 Unity、Unreal Engine 等)和其他游戏开发工具无缝对接,帮助品牌创建交互性强的 AI 角色,无需编码。
2024-12-22
制作PPT的AI应用有那些
以下是一些制作 PPT 的 AI 应用: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品中表现出色,背后有实力强大的团队,能敏锐把握市场机遇,已确立市场领先地位。 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-22
如何学习AI
以下是新手学习 AI 的方法和建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-22
AI英文全称
AI 的英文全称是 Artificial Intelligence,意思是人工智能。它是指让计算机或机器能像人类一样思考和学习的技术。在不同的应用场景中,AI 有着丰富的表现形式,比如聊天机器人、推理者、智能体、创新者和组织等。同时,在 AI 领域还有众多的术语,如 BlackBox Attack(黑盒攻击)、Bonding Environments(成键环境)、Bonferroni Correction(邦弗朗尼校正)等。
2024-12-22
ai音乐创作管线
AI 音乐创作管线包括以下几个方面: 1. ByteComposer:由字节跳动人工智能实验室开发,利用大型语言模型(LLM),通过概念分析、草稿创作、自我评估与修改、审美选择四个关键步骤生成旋律。其核心模块包括专家模块、生成器模块、投票器模块以及记忆模块,通过精心设计的提示激发 LLM 的音乐理论知识,并通过交叉验证优化提示设计。在实验中证明了其在音乐创作方面的有效性,达到了初级作曲家的水平,为用户提供了直观、可控且富有创造性的音乐创作平台。 2. 《We Are The One》的融合工作流:呼应了 AI 技术在音乐创作中不可或缺的愿景,核心是介绍使用 AI 音乐平台 UDIO.com 进行音乐创作的技术分享,以歌曲《We Are the One》的制作过程为例,展示如何结合 AI 与传统音频处理手段,打造以 AI 为主导的音乐制作工作流。 3. 自定义前奏的工作流:Suno 和 Udio 推出上传音频文件生成音乐的功能,可精确控制速度、旋律、配器、合成等。节省的点数可用于多 Roll 与流派、心情、场景相关的曲子并存好旋律素材,也可用于 roll 更多细节调整部分以提升作品品质。通过简单例子演示工作流。
2024-12-22
AI客服用哪个智能体
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并具有以下关键组成部分: 1. 规划:将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 3. 记忆:包括短期记忆(所有的上下文学习利用模型的短期记忆来学习)和长期记忆(通过外部向量存储和快速检索实现长时间保留和回忆无限信息的能力)。 4. 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 AI Agent 有效使用工具的前提是全面了解工具的应用场景和调用方法。利用 LLM 强大的 zeroshot learning 和 fewshot learning 能力,AI Agent 可以通过描述工具功能和参数的 zeroshot demonstration 或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。 AI Agent 学习使用工具的方法主要包括从 demonstration 中学习和从 reward 中学习。环境反馈包括行动是否成功完成任务的结果反馈和捕捉行动引起的环境状态变化的中间反馈;人类反馈包括显性评价和隐性行为,如点击链接。 在追求人工通用智能(AGI)的征途中,具身 Agent(Embodied Agent)正成为核心的研究范式,强调将智能系统与物理世界紧密结合。与传统的深度学习模型相比,LLMbased Agent 不再局限于处理纯文本信息或调用特定工具执行任务,而是能够主动地感知和理解其所在的物理环境,进而与其互动,并利用内部丰富的知识库进行决策和产生具体行动来改变环境。 然而,关于 AI 客服适合使用哪个智能体,需要根据具体的需求和场景来确定。例如,如果需要处理大量复杂的任务分解和协调,可能需要具备强大规划和推理能力的智能体;如果需要与用户进行频繁的互动和反馈,可能需要对环境感知和理解能力较强的智能体。
2024-12-22
可灵和即梦哪个生成视频的能力更强
目前难以直接明确可灵和即梦哪个生成视频的能力更强。 Google DeepMind 和 OpenAI 展示了强大的文本到视频扩散模型预览,但访问受限且技术细节披露不多。Meta 更进一步,将音频加入其 Movie Gen 模型。 在 2024 年,国内涌现出一系列 AI 生成视频工具,如可灵、即梦、智谱清影等,生成结果甚至远超国外。 即梦是剪映旗下的,生成 3 秒视频,动作幅度有很大升级,有最新的 S 模型和 P 模型。可灵支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。 在图生视频方面,市面上主要的工具包括可灵、即梦、Luma,核心方法是穷举和不断调整 prompt 来设计人物动作、辅助镜头运镜等。
2024-12-21
文字生成视频有哪些好的应用
以下是一些文字生成视频的好的应用: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要注意的是,Runway 是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 6. Genmo:相较于 Pika 和 Runway,生成视频的清晰度大幅提高,人像的稳定性和美观度强很多,支持镜头控制且控制粒度更细,但还没开放图片生成视频,只能用文字提示词。 7. VIGGLE:能直接通过文字描述让任何静态图动起来,能做各种动作,还能直接文字生成视频,进行各种角色混合和动作替换。其核心技术基于 JST1 模型,该模型是首个具有实际物理理解能力的视频3D 基础模型,能够根据用户需求,让任何角色按照指定方式进行运动。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。内容由 AI 大模型生成,请仔细甄别。
2024-12-21
监控视频算法
很抱歉,目前知识库中没有关于监控视频算法的相关内容。但一般来说,监控视频算法涵盖了目标检测、跟踪、行为分析等多个方面。常见的算法包括基于深度学习的目标检测算法,如 YOLO 和 SSD 等,用于识别视频中的人物、车辆等目标;还有基于光流的目标跟踪算法,用于持续跟踪目标的运动轨迹;在行为分析方面,会运用模式识别和机器学习算法来判断异常行为等。如果您能提供更具体的需求,我可以为您提供更有针对性的信息。
2024-12-21
🚀接着上期SOP+AI:打造职场高效能人士的秘密武器的分享,今天继续聊聊SOP+AI的应用,🎯今天的主题是“怎样利用AI节约10倍内容创作时间?”📚最近跟团队有开始运营小红书账号,就想着先给自己打造点顺手的工具,于是乎「小红书文案专家」就出生啦~🎉[heading1]一、先介绍下我们小Bot[content]🛺BOT名称:小红书文案专家功能价值:见过多个爆款文案长啥样,只需输入一个网页链接或视频链接,就能生成对应的小红书文案,可以辅助创作者生成可以一键复制发布的初稿,提供创意和内容,1
以下是关于“SOP+AI”的相关内容: 怎样利用 AI 节约 10 倍内容创作时间? 最近团队开始运营小红书账号,于是打造了“小红书文案专家”。 BOT 名称:小红书文案专家 功能价值:见过多个爆款文案,输入网页或视频链接就能生成对应的小红书文案,辅助创作者生成可一键复制发布的初稿,提供创意和内容,节约 10 倍文字内容创作时间。 应用链接:https://www.coze.cn/s/ij5C6LWd/ 设计思路: 痛点:个人时间有限,希望有人写初稿并生成配图。 实现思路:为自己和团队设计工作流,让 AI 按运营思路和流程工作。 一期产品功能: 1. 提取任何链接中的标题和内容。 2. 按小红书平台文案风格重新整理内容。 3. 加入 emoji 表情包,使文案更有活力。 4. 为文案配图片。 二期计划功能:持续优化升级,增加全网搜索热点功能,提炼热点新闻或事件关键信息,结合用户想要生成的内容方向输出文案和配图。 SOP+AI:打造职场高效能人士的秘密武器 案例分享:X 公司客服团队引入 SOP 和 AI 助手后,工作效率显著提升。引入 SOP 前,客服工作流程混乱,效率低下,客户满意度不高。引入 SOP 标准化操作后,效率提高。进一步引入 AI 助手,自动回复常见问题、处理简单请求,减少客服工作量,还能及时发现问题帮助优化。结果客服团队工作效率提升 30%以上,客户满意度显著提高。SOP 能提升效率、减少失误、促进协作,借助 AI 助手,SOP 制定和优化更高效智能。
2024-12-20
视频生成哪一个ai最强
目前在视频生成领域,以下几个 AI 表现较为突出: Luma AI: Dream Machine 功能包括 txt2vid 文生视频和 img2vid 图生视频,还支持 Extend 延长 4s、循环动画、首尾帧动画能力。 8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力,对视频内文字的表现很强。 在 img2vid 图生视频方面,生成效果在多方面远超其他产品,如生成时长较长(5s)、24 帧/s 非常丝滑、运动幅度大且能产生相机的多角度位移、提示词中可增加无人机控制的视角变化、运动过程中一致性保持较好、分辨率高且有效改善了运动幅度大带来的模糊感。 Runway:推出了实力强劲的 Gen3 模型。 此外,以下是其他视频生成的 Top10 产品及相关数据: |排行|产品名|分类|4 月访问量(万 Visit)|相对 3 月变化| |||||| |1|InVideo|其他视频生成|736|0.118| |2|Fliki|其他视频生成|237|0.165| |3|Animaker ai|其他视频生成|207|0.076| |4|Pictory|其他视频生成|122|0.17| |5|Steve AI|其他视频生成|76|0.119| |6|decohere|其他视频生成|57.5|0.017| |7|MagicHour|其他视频生成|53.7|0.071| |8|Lumen5|其他视频生成|51|0.149| |9|democreator|其他视频生成|41.9|0.136| |10|腾讯智影|其他视频生成|35.4|0.131|
2024-12-20
在国内可以免费用的图生视频的ai工具
以下是在国内可以免费用的图生视频的 AI 工具: 1. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps,文生视频,支持中文,时空理解。 3. Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以,文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸,图生视频、视频生视频除了尺寸不可选以外,其他跟文生视频基本相同,默认生成 3s 的视频。 4. 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文,文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸,图生视频除了不可运镜控制以外,其他跟文生视频基本相同,默认生成 5s 的视频。 此外,还有一些国内外提供文生视频功能的产品推荐: 1. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-20
如何写好提示词
以下是关于如何写好提示词的一些要点: 1. 明确任务:清晰地定义任务,如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 5. 使用示例:如有特定期望结果,提供示例帮助模型理解需求。 6. 保持简洁:提示词简洁明了,避免过多信息导致模型困惑。 7. 使用关键词和标签:有助于模型理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整提示词,可能需多次迭代。 此外,还需注意以下几点: 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,如“一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量”。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,输入不想生成的内容,如“不好的质量、低像素、模糊、水印”。 利用“加权重”功能:在功能框增加提示词并调节权重,数值越大越优先,也可编辑已有提示词权重。 善用辅助功能:如翻译功能可一键将提示词翻译成英文,还有删除所有提示词、会员加速等功能。 同时要记住,提示词应清晰明确,避免模糊不清的指令,提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。
2024-12-21
如何写提示词
以下是关于如何写提示词的一些建议: 1. 明确任务:清晰地定义任务,比如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,要提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,应在提示词中明确指出。 5. 使用示例:如有期望结果,可提供示例帮助 AI 理解需求。 6. 保持简洁:避免过多信息导致 AI 模型困惑。 7. 使用关键词和标签:有助于 AI 模型理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整提示词。 对于特定的设计工具,如星流一站式 AI 设计工具: 1. 输入语言方面,通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),且支持中英文输入。 2. 写好提示词的方法包括: 预设词组:小白用户可点击提示词上方官方预设词组进行生图。 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,例如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:在功能框增加提示词并进行加权重调节,权重数值越大越优先,也可对已有的提示词权重进行编辑。 辅助功能:如翻译功能可一键将提示词翻译成英文,还有删除所有提示词、会员加速等功能。 此外,还需注意提示词应清晰明确,避免模糊不清的指令,提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。
2024-12-21
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
通过提示词可以提高模型的数学计算能力吗
通过提示词可以在一定程度上提高模型的数学计算能力。例如 PoT 技术,它是思维链技术的衍生,适用于数值推理任务,会引导模型生成一系列代码,再通过代码解释器工具进行运算,这种方式能显著提升模型在数学问题求解上的表现。PoT 作为 CoT 的衍生技术,遵循零样本和少样本的学习范式,零样本 PoT 与 CoT 方法相似,不需要大量样本即可进行有效推理,少样本 PoT 也通过较少样本优化模型表现。但需要注意的是,大模型在解决数学问题时可能存在不够可靠的情况。
2024-12-20
有哪些好的提示词网站
以下是一些好的提示词网站: 文本类 Prompt 网站: Learning Prompt:授人以渔,有非常详尽的 Prompt 学习资源,包括 ChatGPT 和 MidJourney。网址: FlowGPT:国外最大的 prompt 站,内容全面且更新快。网址: LangChain Hub:LangChain 推出的提示词管理工具。网址: 微软 Prompt Flow:微软发布的开源 LLM 开发工具集,简化了基于 LLM 的人工智能应用程序的开发周期。网址: PromptPort(支持中文):AI Prompt 百科辞典,聚合了市场上大部分优质的 prompt 词库。网址: PromptKnit:The best playground for prompt designers。网址: ChatGPT Shortcut:提供了非常多使用模板,简单修改即可指定输出。网址: ClickPrompt:轻松查看、分享和一键运行模型,创建 Prompt 并与其他人分享。网址: Prompt Extend:让 AI 帮你自动拓展 Prompt。网址: 图像类 Prompt 网站: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库。网址: MidJourney Prompt Tool:类型多样的 prompt 书写工具,点击按钮就能生成提示词修饰部分。网址: OPS 可视化提示词:有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词。网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器。网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器。网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney。网址: OpenArt:AI 人工智能图像生成器。网址: img2prompt:根据图片提取 Prompt。网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用。网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板。网址: AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格。网址: 其他图像类 Prompt 网站: NovelAI tag 生成器:设计类 Prompt 提词生成器。网址: 魔咒百科词典:魔法导论必备工具,简单易用的 AI 绘画 tag 生成器。网址: KREA:设计 AI 的 Prompt 集合站,create better prompts。网址: Public Prompts:免费的 prompt 合集,收集高质量的提示词。网址: AcceleratorI Prompt:AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词。网址:
2024-12-20
Ai视频镜头提示词,及案例
以下是一些 AI 视频镜头的提示词及案例: 一、视频镜头 1. 浅焦镜头(Shallow focus shot) 提示词:一个老奶奶手拿照片面对观众,镜头从照片聚焦到老奶奶脸上,营造出温馨和怀旧的氛围。 2. 窥视镜头(Spy shot) 提示词:镜头在一个隐蔽的位置拍摄。一位头发发白的老奶奶坐在窗前双手捧着一张老照片,面带思念地看着照片,场景温馨。 3. 摇晃镜头(Handheld shot) 提示词:镜头摇晃地跟随一个在战斗中的士兵,画面展示战场上的混乱、飞扬的尘土和四处奔跑的战友,增加紧张和真实感。 4. 穿梭镜头(Hyperlapse shot) 提示词:镜头穿过一条隧道,通过隧道外面是美丽的雪山。 5. 跟随镜头(Tracking shot) 提示词:镜头紧跟一辆在赛道上高速行驶和漂移的跑车。 6. 车载镜头(Carmounted shot) 提示词:镜头从驾驶员或汽车前部的视角出发,展示前方的道路和沿途的建筑物。 7. 动作镜头 提示词:镜头快速捕捉一个男人在激烈的打斗中差点摔倒,增强紧张感和动态性。 8. 无人机视角(Drone perspective shot) 提示词:无人机视角展示一个人站在高山顶峰,俯瞰壮丽景色,远处是连绵的山脉和云海,营造广阔和宏伟的氛围。 9. 低视角镜头 提示词:镜头从楼梯低处仰视一个天空和建筑,增强仰视感和宏伟感 提示词:相机在地上拍摄一个清晨正在跑步的人,背景远处虚焦。 10. 仰拍镜头(Lowangle shot) 提示词:镜头从树底向上拍摄,展示高大的树干和繁茂的树冠。 11. 推镜头(Dolly in) 提示词:镜头从远处向前推进,打开城堡的大门。 12. 旋转变焦镜头 提示词:镜头在变焦的同时快速旋转,展示一个人在旋转木马上。 13. 时间流逝镜头(Timelapse shot) 提示词:镜头固定不动,长时间拍摄并加速播放,展示城市从白天到夜晚的变化。 14. 背光镜头 提示词:镜头逆光拍摄,一个男人站在夕阳下,背光照亮他的轮廓,面部隐在阴影中。 15. 失焦镜头 提示词:镜头失焦拍摄城市的霓虹灯,灯光模糊,呈现出梦幻的效果。 16. 平行镜头(Side dolly shot) 提示词:镜头与骑自行车的少年平行移动,跟随他的骑行路径,保持在相同的水平线上。 17. 镜头推拉变焦 提示词:镜头同时进行推拉和变焦,展示一个人在惊讶地看着远方。 18. 虚实结合镜头 提示词:镜头将真实场景和虚拟场景结合,以 X 光效果拍摄骨骼,以真实场景展示一个手拿着一把钥匙,钥匙的轮廓清晰,背景虚化。 19. 反射镜面镜头(Reflection shot) 提示词:反射镜头,通过浴室镜子反射展示一个人在洗脸的画面 20. 黑白镜头 提示词:黑白镜头,展示一个老街区的复古场景,增强怀旧感。 21. 特写镜头(Closeup shot) 提示词:特写镜头展示一双男性眼睛。 二、全新 AI 整活计划第一期:平行宇宙通勤指南 1. 一致性多镜头提示词 Prompt:女孩后退,拿着斧头的骷髅朝镜头走近。镜头切换,近景正面拍摄女孩的上半身,她满脸惊恐发出尖叫。 基础参数:镜头固定,16:9,10s 视频链接: 2. 一致性多镜头提示词 Prompt:远景拍摄,一个男人转身朝画面左侧走去。镜头切换,近景拍摄男人的上半身,他一脸忧愁。 基础参数:镜头固定,16:9,10s 视频链接: 3. 一致性多镜头提示词 Prompt:穿黄色外套的长发白人女人和卷发黑色外套的男人对视微笑。镜头切换,近景拍摄黄色外套的长发女人微笑的脸。镜头切换,近景拍摄卷发黑外套男人微笑的脸。 基础参数:镜头固定,16:9,10s 视频链接:
2024-12-19
我想生成一张机器人的图片
以下是为您生成机器人图片的相关指导: 提示词:使用简笔画的方式帮我画一张机器人的图片,画风可爱一些,去掉所有辅助线,要求只有唯一的一个主人公,同时左右对称结构,线条少一些简单点。 图像流搭建: 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。 了解图像流节点的意义:左侧工具栏集合了智能处理、基础编辑、风格处理等工具,右侧类似画布,可拖拽工具模块并连接形成工作流程。 根据需求进行图像流设计:例如生成海报功能,需总结故事,优化提示词,输入生图大模型并调整输出最终配图海报。 图片处理: 以中轴线为基础裁剪图片,图片左边保持原样不动,右边增加一个与左边相同的空白图片且背景色一致,并展示结果。 针对新生成的整张图,加入水平和竖直方向各 11 条等距虚线辅助线,并展示结果。 另外,关于机器人图片生成和相关处理还存在一些问题及解答: 理想生成图片只实现了一次,其他几次生产文字加链接,链接需点进去查看且图片需渲染或加载,可在 github 上搜索 nicecoze 插件将 markdown 转换为图片消息。 Coze 里面模型配置用的 GPT4o,程序运行调用的是 GPT3.5 Turno,这没有影响,依然使用的是 GPT4o,只是 token 计算方式用的 3.5。 Coze 加入插件 Data Analysia 等互动过程无法实现功能,需在 coze 里处理,与 cow 的 config 无关。 yum 安装报错可能是重新安装导致,需确认服务器类型,如阿里云自带 yum 则无需执行相关安装步骤。
2024-12-22
生成图片的选项U和V是什么意思
在 Midjourney 中,生成图片后出现的 U 和 V 按钮具有以下含义: U 按钮(Upscale):代表放大图像提升细节。数字代表对应的图像,如 U1、U2、U3、U4。点击 U 按钮可以生成选定图像的较大尺寸版本,并优化更多细节呈现。 V 按钮(Variation):代表在基础上发生变化。数字表示对应的图像,如 V1、V2、V3、V4。选择觉得效果不错的某张图,如第 2 张图,点击 V2,会再生成四个和第 2 张图相似的图像。
2024-12-21