直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我需要一个能写生成文生视频prompt的机器人,这个机器人只负责生产宠物做饭视频的文字prompt,请学习文生视频prompt写作技巧,并给我写一个这样的机器人

回答

以下是关于文生视频 prompt 写作技巧及为您生成的一个宠物做饭视频的文字 prompt 示例:

文生视频 prompt 写作技巧:

  1. 明确视觉样式:要具体描述视频的视觉基调和风格,比如是想要现实的、电影的、动画的还是超现实的。对美学的描述越具体,生成的效果就越接近期望。
  2. 考虑视觉风格创意:如电影感要注重戏剧性照明、镜头光晕和高对比度;逼真风格要追求自然光、清晰细节和逼真角色;动画风格可使用卡通、3D 动画或 2D 动画等术语;艺术风格可用印象派、极简主义或抽象等形容词来指导艺术方向。

宠物做饭视频的文字 prompt 示例:“创建一个 2D 动画、色彩鲜艳的视频,一只可爱的猫咪在厨房里熟练地烹饪美味的鱼餐,画面具有温馨的灯光和可爱的卡通风格。”

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

为 Generate video (beta) 编写有效的文本提示

It’s important to be specific on the visual tone and style of the video,such as the type of look you want to generate.For example,do you want a realistic,cinematic,animated,or surreal?The more specific you can be about the aesthetic,the closer Firefly can get to your desired result.明确视频的视觉基调和风格非常重要,例如要生成的外观类型。例如,您想要现实的、电影的、动画的还是超现实的?您对美学的描述越具体,Firefly就越能达到您想要的结果。An example prompt–"Create an animated,high-contrast video of a snow mobile racing through mountains at dusk."“创建雪地摩托在黄昏时分穿越群山的动画、高对比度视频。Some visual style ideas you can try:您可以尝试一些视觉风格创意:Cinematic:Think dramatic lighting,lens flares,high contrast.电影感:想想戏剧性的照明、镜头光晕、高对比度。Realistic:Aim for natural lighting,clear details,and lifelike characters.逼真:以自然光、清晰的细节和逼真的角色为目标。Animated:Use terms like cartoonish,3D animation,or 2D animated.动画:使用卡通、3D动画或2D动画等术语。Artistic:Use adjectives like impressionistic,minimalist,or abstract to guide the art direction.艺术:使用印象派、极简主义或抽象等形容词来指导艺术方向。

即梦AI | 视频生成V1.2 全站教程

[即梦AI视频生成|教你如何写好prompt](https://bytedance.sg.larkoffice.com/docx/SfpfdXEzBoJO7hxVdCaljjWUgxg)✅在AI视频生成中,prompt是直接描述或引导视频生成的文本或指令;✅类似给AI的提示,包含主体、运动、风格等信息,用户借此控制和指导生成内容;✅ Prompt在AI视频生成中作用十分重要,是表达需求的方式,影响视频内容和质量;✅如果上述过于抽象,您可以理解Prompt为:将您输入的文字变成对应的画面和运动形式

生成带有文本提示和图像的视频

Adobe Firefly中的[“生成视频](https://www.adobe.com/products/firefly/features/ai-video-generator.html)”(测试版)将您的书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度),以指导摄像机移动并创建传达所需情绪和信息的视频。您还可以合并图像,为视频生成提供视觉提示。1.On the[Adobe Firefly website](https://firefly.adobe.com/),select Generate video.在[Adobe Firefly网站上](https://firefly.adobe.com/),选择“生成视频”。2.On the Generate video page,enter a[text prompt](https://helpx.adobe.com/firefly/generate-video/generate-video-clips/writing-effective-text-prompts-for-generative-video.html)in the Prompt field.You can also use the Upload option in the Image section to use an image for the first frame and provide a direction reference for the video clip.在Generate video页面上,在Prompt字段中输入[文本提示](https://helpx.adobe.com/firefly/generate-video/generate-video-clips/writing-effective-text-prompts-for-generative-video.html)。您还可以使用Upload(上传)部分中的Image(图像)选项,将图像用于第一帧,并为视频剪辑提供方向参考。Add an image to provide a clear visual guide to align the generated video more closely with your vision.添加图像以提供清晰的视觉引导,使生成的视频更紧密地与您的愿景对齐。1.In the General settings section,you can determine the Aspect ratio and Frames per second.在General settings部分,您可以确定Aspect ratio和Frames per second。

其他人在问
prompt有什么优缺点
以下是关于 prompt 的优缺点: 优点: 能够提升模型对通用任务的解题表现,充分发挥其潜力。 结构化的 prompt 可以降低沟通难度,提高结果的准确度。 缺点: 效果因任务而异,部分情况下可能存在“表演思考”的现象。 结构化的 prompt 会限制更多可能性。 大部分框架不太适合解决过于主观、个人情绪的问题,也没必要解决过于简单的问题。想要完全符合需求,往往不是一个框架能完全搞定的。 相关参考链接: Prompt 项目链接: 网友点评: 详细分析来源: 原推文:
2024-11-23
什么是prompt
Prompt 是您给人工智能(如 Claude 等大模型)的文本,用于引发相关输出。它通常以问题或指示的形式出现,例如“为什么天空是蓝色的?”。简单来说,它是一套您和大模型交互的语言模板,通过这个模板,您可以输出对大模型响应的指令,指定大模型应该做什么、完成什么任务、如何处理具体任务,并最终输出您期望的结果。 从更专业的角度定义,大模型的本质是一个基于语言的概率模型,它返回其认为概率最大的内容。如果直接问大模型而不提供 Prompt,相当于大模型随机给出答案。有了 Prompt,就相当于给了一个包含对模型的要求、输入和输出限制的模板,大模型在这个限制下得到概率最大的答案。 此外,Prompt 是一段指令,用于指挥 AI 生成您所需要的内容,每个单独的提示词叫 tag(关键词)。它支持英语等语言(不用担心英语不好的问题,”或多层括号的方式;还可以进行 tag 的步数控制。
2024-11-23
根据Python实验内容(包括实验场景和实验内容)和参考资料链接,如何优化prompt,以完成程序?
以下是一些优化 prompt 以完成程序的建议: 1. 对于算术推理相关的程序,若思维链(及生成的方程式)存在正确但模型执行算术运算错误的情况,可添加一个 Python 程序作为外部计算器(使用 Python 的 eval 函数)处理生成的思维链中的所有方程式。当思维链中包含多个方程式时,通过字符串匹配将外部计算器的结果从一个方程式传递到下一个方程式,以提高思维链提示在大多数任务上的性能。 2. 在涉及迷宫生成的程序中,若生成的迷宫存在边未封好等问题,可调整提示词。若对复杂度不满意,也可提出并进行调整。 3. 在涉及图像生成的程序中,对于提示词编写,应遵循不改变梗图、虚构角色起源、未出现人物等的原则,保持原始提示的意图并优先保证质量。不创建任何具有冒犯性的图像。对于可能存在偏见的场景,确保如性别和种族等关键特征以无偏见的方式指定。对于包含特定人物或名人的提示词,需进行适当修改,以通用描述替代,除非其作为图像中的文本出现。提示词应详细、客观地描述图像的每个部分,思考描述的最终目标并进行推断以生成满意的图像。
2024-11-22
prompt
以下是关于 prompt 的相关知识: 提示简介: 提示是您给 Claude 的文本,用于引发相关输出。提示通常以问题或指示的形式出现。例如: |角色|提示| ||| |用户|为什么天空是蓝色的?| Claude 回答的文本被称为“响应”,有时也被称为“输出”或“完成”。 提示工程: 提示工程是人工智能领域中,特别是在自然语言处理(NLP)和大型语言模型(LLMs)的上下文中一个相对较新的概念。它涉及设计和优化输入提示,以引导 AI 模型生成特定类型的输出或执行特定的任务。 提示工程的关键点包括: 1. 精确性:通过精确的提示,可以提高 AI 模型输出的相关性和准确性。 2. 创造性:提示工程需要创造性地思考如何构建问题或请求,以激发 AI 模型的特定能力。 3. 迭代:通常需要多次尝试和调整提示,以获得最佳结果。 4. 上下文理解:提示需要包含足够的上下文信息,以便 AI 模型能够理解并执行所需的任务。 提示词通常指的是直接输入到 AI 模型中的问题、请求或指示,它们是提示工程的一部分。提示词可以非常简单,如“给我总结这篇文章的主要观点”,或者更复杂,如设计一个包含多个步骤和条件的复杂任务。 提示词是实际输入到 AI 系统中的具体文本,用以引导模型的输出。提示工程则是一个更广泛的概念,它不仅包括创建提示词,还涉及理解模型的行为、优化提示以获得更好的性能、以及创造性地探索模型的潜在应用。提示工程的目标是最大化 AI 模型的效用和性能,而提示词是实现这一目标的手段之一。在实际应用中,提示工程可能包括对 AI 模型的深入分析、用户研究、以及对特定任务的定制化提示设计。 头脑风暴常用的 20 个 prompt: 1. Brainwriting Prompt: “Let's brainstorm ideas for by writing down as many ideas as you can, then I can build on them with related ideas. Structure your answer using markdown.” 2. Reverse Brainstorming Prompt: “We will use reverse brainstorming for coming up with intentionally bad ideas can spark creativity and lead us in new directions.” 3. Mind Mapping Prompt: “Please create a complete mind map for starting with a central concept and expanding outward with connected branches of related ideas.” 4. Assumptions Prompt: “List your assumptions about . Then, how can you challenge those assumptions to come up with innovative ideas? Describe your journey.” 5. SWOT Analysis Prompt: “Let's do a SWOT analysis on considering internal strengths/weaknesses and external opportunities/threats. Then write a conclusion to summarize.” 6. SCAMPER Prompt: “Use the SCAMPER checklist to ideate on . How can we substitute, combine, adapt, modify, put to other uses, eliminate, or reverse? Detail your answers.” 7. Six Thinking Hats Prompt: “Use the Six Hats method: the red hat is optimistic, the black hat looks at negatives, etc. Ideate on from different mindset angles.” 8. Worst Possible Idea Prompt: “Brainstorm intentionally terrible ideas for to get the creative juices flowing in new directions. Expand on your answers a little, explaining why these ideas are bad.” 9. Trigger Words Prompt: “Here are some random words: ?” 10. Questioning Prompt: “Generate questions about , like who, what, when, where, why, how? Turn the questions into ideas.” 11. Rolestorm
2024-11-22
prompt编写
以下是关于如何编写提示词(prompt)的全面指导: 一、编写 prompt 的一般建议 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:避免模糊或歧义词汇,用简单明了的表述。 4. 给出具体要求:如格式、风格或引用文献等方面的要求。 5. 使用示例:提供期望结果的示例,帮助 AI 理解需求。 6. 保持简洁:避免过多信息导致 AI 困惑。 7. 使用关键词和标签:有助于 AI 理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整 prompt。 二、律师编写 prompt 的建议框架及格式 CRISPE 1. Capacity and Role(能力与角色):明确 AI 的角色和能力,如专注于民商事法律领域、擅长案例研究等。 2. Insight(洞察):提供背景信息和上下文,如案件关键事实、相关法律等。 3. Statement(陈述):明确期望 AI 完成的任务,如总结诉求、检索法条等。 4. Personality(个性):设定 AI 的回答风格或方式。 5. Experiment(举例):通过具体例子说明上述各点。 三、头脑风暴常用的 20 个 prompt 1. Take on the perspective of afrom their point of view.My aim is to find new ways to improve. 2. Scenarios Prompt:Imagine a best case scenario for:everything goes right.Now imagine a worst case scenario:everything goes wrong.Brainstorm ideas for each. 3. Analogy Thinking Prompt:is like what?Identify an analogy,then brainstorm ideas based on properties of the analogy.Explain each idea that follows from this analogy. 4. Idea Spurring Prompt:Build on the following idea related to.What does it make you think of?Use it as a jumping off point for more ideas. 5. Concept Fan Prompt:Here is one idea related to.Fan out from this concept in different directions to generate related ideas.Explain each new idea in a few words. 6. Evil Genius Prompt:Pretend you're an evil genius plotting against.How would you undermine it?Reverse engineer your evil plans into constructive ideas. 7. Random Stimuli Prompt:Use this random.Make unlikely connections. 8. Headline Writing Prompt:Come up with turn them into full ideas. 9. Brainstorming Journey Prompt:Imagine you're on a journey related to.Describe where you are,what you see,who you meet,what you're thinking let the scenario spark ideas. 10. Outside Perspectives Prompt:Bring in different viewpoints to ideate onand get new perspectives.Develop these different points of view,explaining succinctly why they are relevant in each case. 希望以上内容能对您编写 prompt 有所帮助。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-21
写精彩脱口秀文本的prompt
以下是关于写精彩脱口秀文本的一些提示: 基本提示可以只是一个单词、短语或表情符号。 更高级的提示可以包括一个或多个图片 URL、多个文本短语以及一个或多个参数。图片 URL 始终位于提示的最前面,以影响完成结果的风格和内容。参数需要放在提示语的末尾。 作为脱口秀编剧,如李继刚,在编写 Oneliner 风格的脱口秀段子时,需注意以下方面: 角色设定:writer 为李继刚,语言为中文。 注意事项:创作对用户的上台表演影响巨大,段子必须包含铺垫和包袱两部分,要有幽默感,能打破预期。预期违背即在段子的结构中,包袱必须是对铺垫的预期违背。 参考示例:可查看
2024-11-19
我希望做一个回答用户问题的聊天机器人,如何用rag来做
要使用 RAG(RetrievalAugmented Generation,检索增强生成)来做一个回答用户问题的聊天机器人,可以按照以下步骤进行: 1. 加载所需的库和模块:包括用于解析 RSS 订阅源的 feedparse,用于在 Python 程序中跑大模型的 ollama(使用前需确保 ollama 服务已开启并下载好模型)。 2. 从订阅源获取内容:通过特定函数从指定的 RSS 订阅 URL 提取内容,如需接收多个 URL 可稍作改动。然后使用专门的文本拆分器将长文本拆分成较小的块,并附带相关元数据,如标题、发布日期和链接,最终将这些文档合并成一个列表用于后续处理。 3. 为文档内容生成向量:使用文本向量模型 bgem3(可从 https://huggingface.co/BAAI/bgem3 下载,假设放置在某个路径 /path/to/bgem3 ),通过 FAISS 创建一个高效的向量存储。 4. 基于用户的问题,从向量数据库中检索相关段落,并根据设定的阈值进行过滤,最后让模型参考上下文信息回答用户的问题,从而实现 RAG。 5. 创建网页 UI:通过 gradio 创建网页 UI 并进行评测。 6. 技术栈选择:经过调研,可先采取 Langchain + Ollama 的技术栈作为 demo 实现,后续也可考虑使用 dify、fastgpt 等更直观易用的 AI 开发平台。 Langchain 简介:是当前大模型应用开发的主流框架之一,提供一系列工具和接口,其核心在于“链”概念,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具。 Ollama 简介:是一个开箱即用的用于在本地运行大模型的框架。 总结: 1. 本文展示了如何使用 Langchain 和 Ollama 技术栈在本地部署一个资讯问答机器人,同时结合 RSSHub 来处理和提供资讯。 2. 上下文数据质量和大模型的性能决定了 RAG 系统性能的上限。 3. RAG 通过结合检索技术和生成模型来提升答案的质量和相关性,可以缓解大模型幻觉、信息滞后的问题,但并不意味着可以消除。
2024-11-20
如何学习开源机器人,要求是ROS操作系统,如何购置相应的机器人
学习开源机器人并基于 ROS 操作系统购置相应机器人,您可以从以下几个方面入手: 1. 控制系统:负责处理传感器数据、规划路径和执行任务,并与其他子系统协作。通常由嵌入式计算设备或工业计算机组成,通过运行控制算法(如 PID 控制、深度学习模型等)决定机器人运动和操作。 2. 伺服驱动系统:负责驱动机器人关节和执行机构,实现精确运动控制。一般包括伺服电机、伺服驱动器和指令机构。伺服电机作为执行机构实现运动,伺服驱动器作为功率电源控制电机运动,指令机构发出脉冲或速度信号配合工作。能进行速度与转矩控制,以及精确、快速、稳定的位置控制,其结构通常包括电流环、速度环和位置环三个闭环控制。 3. 交互设备:常见的有麦克风、遥控器等,尤其是带屏遥控器,集成了显示屏和控制功能,允许用户直接在遥控器上查看实时图像和进行各种操作。 4. 软件中间件:机器人操作系统中间件负责硬件抽象、设备驱动、库函数、可视化、消息传递和软件包管理等。最常用的元操作系统是 ROS(Robot Operating System),它并非真正的操作系统,而是运行在 Ubuntu 上的软件框架。ROS 将机器人软件功能封装为节点,支持节点间分布式、点对点通信,并由主节点(master)管理调度网络中各节点通信过程。不同节点可使用不同编程语言,可分布式运行在不同主机,这种设计使机器人各模块能松耦合协同工作,便于模块化修改和升级,提高系统容错能力。 在购置相应机器人时,您需要考虑机器人的功能需求、性能指标、价格预算等因素,选择适合您学习和研究的型号。
2024-11-19
怎么制作一个桌面智能机器人
制作桌面智能机器人可以参考以下步骤: 1. 利用 RPA 技术: 可以通过拖拉拽指令控件来构建机器人任务。例如,以在京东查询感冒灵并采集价格为例,包括打开浏览器、填写搜索框、点击搜索、采集数据等步骤。 采集数据后会生成数据表格,编辑器有拖拉拽功能适合业务人员,也可切换为 Python 界面写代码,还封装了很多控件,如 Excel 控件等。 RPA 机器人可通过触发器设置,像搭建奥康 1700 多个脚本的案例还有方太 450 多个基线等,交付的是动态能力。 RPA 加上 AI 效率极大提升,数字化分标准化、自动化、RPA 加 AI 三个阶段。 2. 使用 Coze 平台: 准备一个 Coze 账号,这是一个免费的 AI 机器人搭建平台。 准备一台能够上网的电脑。 用 Coze 搭建的 AI 机器人目前可以发布在“微信(订阅号/服务号/微信客服)、飞书、豆包、Bot Store、掘金”几个渠道,也可以通过网页地址的形式分享。 需要注意的是,不同的方法和平台可能有其特定的要求和特点,您可以根据自己的需求和技术水平选择适合的方式。
2024-11-19
使用coze搭建一个心理咨询机器人,将机器人接入自己开发的应用后,如何再进一步实现让ai把每个用户每天的聊天内容,总结成日记,并传回给应用展示日记
目前知识库中没有关于使用 Coze 搭建心理咨询机器人,并将用户每天聊天内容总结成日记传回应用展示的相关内容。但一般来说,要实现这个功能,您可能需要以下步骤: 1. 数据采集与存储:在机器人与用户交互过程中,采集并妥善存储聊天数据。 2. 自然语言处理与分析:运用相关的自然语言处理技术,对聊天内容进行理解和分析,提取关键信息。 3. 内容总结:基于分析结果,使用合适的算法和模型将聊天内容总结成日记形式。 4. 数据传输:建立与应用的稳定接口,将总结好的日记数据传输回应用。 这只是一个大致的思路,具体的实现会涉及到很多技术细节和开发工作。
2024-11-15
最近AGI机器人特别火,请帮我找出相关新闻
以下是一些与 AGI 机器人相关的新闻: :随着 OpenAI 聊天机器人 ChatGPT 的热潮持续,探讨其如何帮助创建用户体验调查问卷或其他调查问卷。 :给 25 个 AI 代理人动机和记忆,并将它们放在模拟城镇中,其行为被评价比人类角色扮演更“人类化”。 :ChemCrow 是一个 LLM 化学代理,能在合成、药物发现和材料设计等领域执行任务,并集成 13 个专家设计的工具以增强性能。 :OpenAI 发布 GPT4 被证明是生成 AI 的一小步,对 AGI 而言是一大步,自 2022 年 11 月发布以来吸引众多用户和媒体关注,此工作是对 ChatGPT 的首次全面审查。 :有人让 AutoGPT 查找最近一个月的开源相关新闻并汇总成 word 文件,还有人在相关项目基础上做了改进和增强的新项目,如 TeenageAGI、BabyAGIasi、TypeScript 版本的 AutoGPT 等。 :特斯拉训练机器人“Optimus”抓取物体,通过人类示范学习。还提到当训练比 GPT4 大 100 倍的模型时在图像识别、生成图像和视频等方面的预测。
2024-11-10
用Coze创建AI,打造自己的图像生成AI机器人
以下是使用 Coze 创建自己的图像生成 AI 机器人的步骤: 1. 注册 Coze 账号: 访问 Coze 官网,可选择中文版(https://www.coze.cn/,支持大模型:kimi、云雀)或英文版(https://coze.com/,支持大模型:chatgpt4)进行快速注册。 产品定位为新一代 AI 原生应用开发服务平台。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,起一个响亮的名字。 工作空间选“个人空间”。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”用文字描述想要的图标,满意后再把“Bot 名称”改为简洁版名称。 3. 具体创建 AI Bot: 首先打开扣子的首页(https://www.coze.cn/home),直接点击左上角的创建 AI Bot 按钮。 直接在弹窗输入 Bot 的相关信息,完成创建后细化其功能。 设计人设与回复逻辑,根据功能需求设计提示词。 调整模型设置,比如基于聊天为主的需求,将对话轮数记录改为 20 轮。 选择插件,如英文名言警句(get_one_eng_word & get_many_eng_words)随机获取英语名言,Simple OCR(ocr)识别图片中的文字。 设置开场白和预置问题,预置问题有参考价值。 最后设置语音,若为英语陪练 AI Bot,选择亲切的英语音色。
2024-11-09
如果选择一个最需要的AI工具,你会建议我学什么?比如视频剪辑?
如果要选择一个最需要学习的 AI 工具用于视频剪辑,以下是一些相关建议: 工具选择: 剪映是一个较为方便的选择,它具有很多人性化设计和简单的音效库、小特效。但也存在一些不足,如无法协同工作和导出工程文件,难以与其他软件进行工程联通,影响视频的商业化效果。 剪辑流程: 1. 视频粗剪:先确定画面逻辑,声音可作部分参考,快速对片子全貌有整体把握,把素材放上,再进行细节调整和画面替换。画面不需要精美,重点是把握整体。 2. 视频定剪:将画面素材调整和替换到满意效果。 3. 音效/音乐:以剪映为例,有简单音效库,复杂音效可能需另外制作。使用商用音乐要注意版权。 4. 特效:以剪映为例,可适当添加一些光的效果。 5. 包装(如字幕):字幕最后上,剪映可智能匹配字幕再修改。 故事创作: 除了工具,故事也很重要。故事来源有两条路径: 1. 原创(直接经验):自身或周围人的经历、做过的梦、想象的故事等。 2. 改编(间接经验):经典 IP、名著改编、新闻改编、二创等。 剧本写作: 编剧有一定门槛,不能仅套剧作理论和模版,要多写多实践,再结合看书总结经验。短片创作可从自身或朋友经历改编入手,或对触动自己的短篇故事进行改编。多与他人讨论故事,有助于修改和进步。 声音制作: 在传统影视制作中,声音部分包括现场录音、后期配音、音效音乐制作等。对于 AI 声音制作对话,如使用 11labs 进行英文对白制作,效果较好但存在没有情绪和情感的问题,需通过标点符号改变语音效果,不断抽卡调试。国内可使用魔音工坊,其有情绪调节控件。 剪辑软件: 对于 13 分钟的短片,剪映较方便;更长篇幅或追求更好效果,可能需使用 PR/FCP/达芬奇等传统剪辑软件。
2024-11-22
中国国产最好用的免费视频AI是哪个呢
以下是一些中国国产好用的免费视频 AI 工具: Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA(国内):https://etna.7volcanoes.com/ 。是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。 Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。 此外,还有一些其他的相关工具: Leiapix:https://www.leiapix.com/ ,免费,可把一张照片转动态。 Krea:https://www.krea.ai/ ,12 月 13 日免费公测。 luma: ,30 次免费。 hailuoai:https://hailuoai.video/ ,新账号 3 天免费,过后每天 100 分,语义理解能力强。 Opusclip:https://www.opus.pro/ ,可利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材可直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法生成脚本和分镜描述,生成视频后可人工二编合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,有一次免费体验,可自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ ,免费,高级功能付费。 typeframes:https://www.revid.ai/?ref=aibot.cn ,有免费额度。
2024-11-22
推荐一款国内不错的AI视频生成软件
以下为您推荐几款国内不错的 AI 视频生成软件: 1. 可灵:在 AI 视频生成领域表现出色,具有以下优势: 卓越的视频生成质量,与国际顶级模型相当,能满足普通用户和专业创作者的需求。 生成速度快,处理效率高于国外同类产品,提升用户工作效率。 对国内用户可访问性强,提供便捷、稳定的使用体验。 2. Hidreamai:有免费额度,支持文生视频、图生视频,提示词使用中文、英文均可,文生视频支持多种控制,可生成 5s 和 15s 的视频。网址:https://hidreamai.com//AiVideo 3. ETNA:由七火山科技开发,可根据简短文本描述生成相应视频内容,生成视频长度 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文,时空理解。网址:https://etna.7volcanoes.com/ 此外,还有 Pika、SVD、Runway、Kaiber、Sora 等国内外提供此类功能的产品,您可以根据自己的具体情况进行选择。更多的文生视频网站可查看: 需注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-22
如何做一个我自己的AI数字人进行短视频出镜主播
以下是制作您自己的 AI 数字人进行短视频出镜主播的方法: 一、准备视频内容 1. 准备一段视频中播放的文字内容,可以是产品介绍、课程讲解、游戏攻略等。您也可以利用 AI 来生成这段文字。 2. 使用剪映 App 对视频进行处理。电脑端打开剪映 App,点击“开始创作”。选择顶部工具栏中的“文本”,并点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道,然后将准备好的文字内容替换默认文本内容。这将为数字人提供语音播放的内容以及生成相对应的口型。 二、生成数字人 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,例如“婉婉青春”。选择数字人形象时,软件会播放其声音,您可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。 2. 剪映 App 会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成时间,您可点击预览按钮查看生成的数字人效果。 三、增加背景图片 1. 直接删除先前导入的文本内容,因为视频中的音频已包含文字内容。 2. 为视频增加背景图片。点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。 3. 点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。 4. 点击轨道最右侧的竖线,向右拖拽直到与视频对齐。 5. 选中背景图片所在的轨道,在显示区域拖动背景图的一个角,将图片放大到适合尺寸,并将数字人拖动到合适位置。 另外,您还可以通过以下网站生成虚拟数字人短视频: 1. 打开网站(要科学):https://studio.did.com/editor 2. 输入内容选项,在右侧的文字框里面输入从 ChatGPT 产生的内容,还可以更换想要的头像,选择不同的国家和声音。 3. 内容和人像都选择好之后,点击右上角的 Create Video,等待一段时间生成。生成好数字人视频后,结合产品做讲解即可发布去做视频带货。
2024-11-22
现在哪几家的大模型支持通过手机视频多模态实时交流?
以下几家的大模型支持通过手机视频多模态实时交流: 1. PandaGPT:能够理解不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 2. VideoLLaMA:引入了多分支跨模式 PT 框架,使语言模型能够在与人类对话的同时处理给定视频的视觉和音频内容。 3. 视频聊天 GPT:专门为视频对话设计,能够通过集成时空视觉表示来生成有关视频的讨论。 4. NExTGPT:端到端、通用的 anytoany 多模态语言模型,支持图像、视频、音频、文本的自由输入输出。
2024-11-22
我想要能够爬取我想要的视频的工作流有吗
以下为您提供两种关于视频爬取工作流的信息: 1. Stable Video Diffusion 模型的 ComfyUI 部署实战: 完成准备工作后运行 ComfyUI。 安装 ComfyUI Manager 插件。 下载工作流,使用 ComfyUI 菜单的 load 功能加载。 点击菜单栏「Queue Prompt」开始视频生成,可通过工作流上的绿色框查看运行进度。 生成的视频可在 ComfyUI 目录下的 output 文件夹查看。若出现显存溢出问题,请另行处理。工作流可关注公众号「魔方 AI 空间」,回复【SVD】获取。 2. 来来的 AI 视频短片工作流: 完整文档: 工作流概述: 概念设定:MJ 剧本+分镜:ChatGPT AI 出图:MJ,SD,D3 AI 视频:Runway,pika,PixVerse,Morph Studio 对白+旁白:11labs,睿声 音效+音乐:SUNO,UDIO,AUDIOGEN 视频高清化:Topaz Video 字幕+剪辑:CapCut,剪映 直播回放:
2024-11-21
免费文生图
以下是一些免费的文生图工具和相关信息: Pika labs:目前推出了 Beta 版本,支持免费、不限次数地文生视频、图生视频,生成的视频会带上官方水印。官方 Twitter:https://twitter.com/pika_labs 。优秀案例:近期 x 上一个创作者发布的庆祝星球大战 100 周年的短片做的非常成功,这位导演用 Pika labs 产出的视频都非常高质量。 DALL·E:OpenAI 推出的一款文生图工具,可以根据输入的文本描述生成逼真的图片。 StableDiffusion:开源的文生图工具,可以生成高质量的图片,并且支持多种模型和算法。 MidJourney:因其高质量的图像生成效果和用户友好的界面设计而受到广泛欢迎,在创意设计人群中尤其流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 此外,文字生成视频的 AI 产品有: Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:
2024-11-23
文生图反向推出提示词
在文生图中,反向推出提示词的方式主要有以下几种: 1. 在图生图功能中,除了文本提词框外,还有图片框输入口。随便照一张照片拖入后,文本输入框旁边有两个反推提示词的按钮:CLIP 可以通过图片反推出完整含义的句子;DeepBooru 可以反推出关键词组。例如一张小男孩坐在长凳上的图片,通过 CLIP 反推得到的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,通过 DeepBooru 反推得到的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但这两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充好提示词后,调整宽度和高度,使红框刚好匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。 2. 利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个相关模型。上一期活动链接:。 3. 利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流。joycaption 链接(需要魔法):https://huggingface.co/spaces/fancyfeast/joycaptionprealpha 。文生图工作流: 。在哩布上跑文生图:https://www.liblib.art/modelinfo/e16a07d8be544e82b1cd14c37e217119?from=personal_page 。 在写文生图的提示词时,例如“”。
2024-11-22
文生图模型性能排行
以下是一些文生图模型的性能排行相关信息: Kolors 是最近开源的文生图模型中表现出色的一个。它具有更强的中文文本编码器、高质量的文本描述、人标的高质量图片、强大的中文渲染能力以及巧妙解决高分辨率图加噪问题的 noise schedule,实测效果不错。 PIKA1.0 是一个全新的模型,文生视频和文生图的质量都有大幅度提升。在文生图方面稳定得令人惊讶,3D 和 2D 的动画效果出色。 为全面比较 Kolors 与其他模型的生成能力,构建了包含人工评估、机器评估的全面评测内容。在 KolorsPrompts 评估集中,Kolors 在整体满意度方面处于最优水平,其中画面质量显著领先其他模型。具体的平均分数如下: AdobeFirefly:整体满意度平均分 3.03,画面质量平均分 3.46,图文相关性平均分 3.84。 Stable Diffusion 3:整体满意度平均分 3.26,画面质量平均分 3.5,图文相关性平均分 4.2。 DALLE 3:整体满意度平均分 3.32,画面质量平均分 3.54,图文相关性平均分 4.22。 Midjourneyv5:整体满意度平均分 3.32,画面质量平均分 3.68,图文相关性平均分 4.02。 Playgroundv2.5:整体满意度平均分 3.37,画面质量平均分 3.73,图文相关性平均分 4.04。 Midjourneyv6:整体满意度平均分 3.58,画面质量平均分 3.92,图文相关性平均分 4.18。 Kolors:整体满意度平均分 3.59,画面质量平均分 3.99,图文相关性平均分 4.17。所有模型结果取自 2024.04 的产品版本。
2024-11-18
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
文生图的 Prompt 模板
以下是关于文生图的 Prompt 模板的相关内容: 通常描述逻辑包括人物及主体特征(如服饰、发型发色、五官、表情、动作),场景特征(如室内室外、大场景、小细节),环境光照(如白天黑夜、特定时段、光、天空),画幅视角(如距离、人物比例、观察视角、镜头类型),画质(如高画质、高分辨率),画风(如插画、二次元、写实)。通过这些详细的提示词,能更精确地控制 Stable Diffusion 的绘图。 对于新手,有功能型辅助网站帮助书写提示词,如 http://www.atoolbox.net/ ,可通过选项卡方式快速填写关键词信息;https://ai.dawnmark.cn/ ,每种参数有缩略图参考,方便直观选择提示词。还可以去 C 站(https://civitai.com/)抄作业,复制每一张图的详细参数并粘贴到正向提示词栏,然后点击生成按钮下的第一个按键,不过要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同,也可只取其中较好的描述词使用。 在 Tusiart 中,文生图的操作流程如下: 定主题:确定要生成的图的主题、风格和表达的信息。 选择基础模型 Checkpoint:找内容贴近主题的 checkpoint,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 控制图片效果及质量。 ControlNet:控制图片中特定的图像,如人物姿态、特定文字、艺术化二维码等。 设置 VAE:无脑选择 840000 。 Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写要避免的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++ 2M Karras,留意 checkpoint 详情页上模型作者推荐的采样器。 采样次数:根据采样器特征,如选 DPM++ 2M Karras 采样次数在 30 40 之间。 尺寸:根据喜好和需求选择。 在一些提示词中,括号和“:1.2”等是用来增加权重的,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时还有反向提示词,告诉 AI 不要的内容。
2024-11-15
请推荐一下文生PPT好用的免费软件
以下为您推荐几款文生 PPT 好用的免费软件: 1. 歌者 PPT(gezhe.com): 功能:话题生成(一键生成 PPT 内容)、资料转换(支持多种文件格式转 PPT)、多语言支持(生成多语言 PPT)、模板和案例(海量模板和案例库)、在线编辑和分享(生成结果可自由编辑并在线分享)、增值服务(自定义模板、字体、动效等)。 产品优势:免费使用(所有功能永久免费)、智能易用(通过 AI 技术简化 PPT 制作流程,易于上手)、海量案例(大量精美模板和优秀案例可供选择和下载)、资料转 PPT 很专业(支持多种文件格式,转换过程中尊重原文内容)、AI 翻译(保持 PPT 原始排版不变,多语言在线即时翻译)。 推荐理由:完全免费,智能化程度高,模板和案例库丰富,对多语言支持好,适合不太擅长制作 PPT 或者时间紧张的人群。 2. Gamma: 作为在各种交流群中频繁推荐的产品,以其卓越的性能和用户体验赢得广泛认可。免费版本也能生成质量非常高的 PPT,随着不断优化和改进,能满足大多数用户的需求。个人使用体验良好,生成效果令人满意,在内容组织、设计美观度和整体专业感方面表现出色。 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-13