Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

提取视频文案

Answer

以下是为您提取的视频文案相关内容:

在“夙愿:用 AI 化繁为简,解决复杂问题的指南”中提到:

  • 对于一些需求,如“GPT 能帮我快速在小红书上起号吗?帮我直接写做出爆款文案吗?”,GPT 不能做到全部事情。
  • 例如提取视频文案,GPT 不能完成,需要人类使用批量提取文案工具。
  • Prompt Chain 本质上:需要将需求做细颗粒度的分解,把大任务拆成小任务,小任务拆成更小的任务;将每个小任务选择合适的工具/模型来实现。

在“白马:6000 字超详细复盘!《AI 你·南京》AIGC 城市宣传 MV 全流程制作解析”中提到:

  • 一开始打算用旁白朗诵方式做片子,对文案要求高,直接让 GPT 写结果平淡,需把需求提更具体。
  • 利用 360 浏览器字幕提取功能捕捉《爱我中华》的视频文案,让 kimi 和 GPT 进行分析和学习,对比两者结果,kimi 在中文理解和写作能力上更突出,整合两段文案并调整,让文案更顺口。

在“使用 GPT 的视觉功能和 TTS API 处理和讲述视频”中提到:

  • 首先使用 OpenCV 从包含野牛和狼的自然视频中提取帧。
  • 制作提示并向 GPT 发送请求(不需要发送每一帧给 GPT 来了解发生了什么),并给出了视频的标题、描述等内容。
Content generated by AI large model, please carefully verify (powered by aily)

References

夙愿:用 AI 化繁为简,解决复杂问题的指南

例如有的人需求是:“GPT能帮我快速在小红书上起号吗?🤔帮我直接写做出爆款文案吗?”我想问:你的对标账号是什么❓GPT知道吗?不知道!GPT知道从哪里去找吗?不知道!只能人类自己去找对标账号🔍。他的优秀文案有哪些📝?——GPT知道吗?不知道!GPT能帮你提取视频文案吗?不能!需要人类使用批量提取文案工具去提取。你的用户群是哪些🤷?——GPT知道你的用户群吗?不知道!只能人类自己做好粉丝画像分析再告诉GPT。从上面的问题中,我们可以看到:其实GPT并不能帮助我们做到全部的事情💡很多时候,在我们的解决方案当中,一定会穿插一些GPT能力之外的事情🌌这些事情,需要我们用其他的一些非AI大模型的工具来进行辅助🔨当然,你完全可以将这些工具,也穿插在你的Prompt Chain的工作流当中⚙️讲了这么多,总结一下,Prompt Chain本质上想要传达的是:1.你需要将你的需求做细颗粒度的分解,也就是把大任务拆成小任务,小任务拆成更小的任务👷2.你需要将每个小任务选择合适的工具/模型来实现🔧;好,明白了Prompt Chain的原理之后,接下来,我们用几个示例来讲解怎么运用Prompt Chain在实际的AI对话中。

白马:6000字超详细复盘!《AI你·南京》AIGC城市宣传MV全流程制作解析

一开始,我们打算用旁白朗诵的方式来做这条片子,类似《舌尖上的中国》的那种感觉,这就对文案会有比较高的要求。但是如果你直接要求GPT去写这段文案的话,它给的结果会比较平淡,因为它并不知道你要写这段文字的前因后果,也不清楚你的喜好和拍摄风格,所以想要得到好的结果,我们需要把需求提得更具体一些。于是,我利用360浏览器的字幕提取功能,捕捉了一下《爱我中华》的视频文案。接下来,分别让kimi和gpt进行分析和学习,这是让AI能按照我们的预期进行写作的一个好的方法。它并不是简单的模仿,而是去理解目标的写作风格,并融会贯通。KimiChatGPT我写文案的时候通常会同时开kimi和gpt两个窗口,来对比它们的结果,我发现在对中文的理解和写作能力上,kimi的表现还是要更突出一些。毕竟是国产大模型,本土化将是我们最大的优势。做完文案分析之后,我们就可以让AI按照此风格去写作了,这次创作的稿子就比一开始的要好很多。两个AI的作品各有千秋,我决定稍作调整,把这两段整合一下。KimiChatGPT在调整阶段,我们首先要让文案读起来更顺口,所以我挑选了一些语句让它单独修改。比如“钟山风雨起苍黄,江南佳丽地,金粉六朝都”这一句,我希望能更押韵一点,于是在我的提示下,kimi将其改为了“钟山风雨起苍黄,古都烟云梦犹长”,虽然有一些拼接的痕迹,但是我觉得对于AI来说,能完成到这样也是不错的了。毕竟对于不是作家不是诗人的普通人,要如此快完成这种水准的输出还是很难的。文案整理完之后,就可以让AI输出简单的画面分镜了,这样能让我们看到一个比较直观的构想。很多时候,从1到2比从0到1要轻松很多。Kimi

使用GPT的视觉功能和TTS API处理和讲述视频

First we use OpenCV to extract frames from a nature[video](https://www.youtube.com/watch?v=kQ_7GtE529M)containing bisons and wolves:首先,我们使用OpenCV从包含野牛和狼的自然视频中提取帧:618 frames read.Display frames to make sure we've read them in correctly:显示帧以确保我们已正确读取它们:Once we have the video frames we craft our prompt and send a request to GPT(Note that we don't need to send every frame for GPT to understand what's going on):一旦我们有了视频帧,我们就制作了提示并向GPT发送请求(注意,我们不需要发送每一帧给GPT来了解发生了什么):Title:Survival Instincts:The Epic Standoff between Bison and Wolves in the Frigid Wild Description:Witness the raw and riveting drama unfold on the snowy plains,where the formidable bison faces off against a determined pack of wolves.Set against a dazzling winter backdrop,this video captures the harrowing and breathtaking interaction between predator and prey.With survival at stake,each move is a dance of life and death in nature's great theater.Watch as these majestic creatures engage in a timeless struggle,showcasing the power,resilience,and indomitable spirit that define the wild.Join us for an unforgettable journey into the heart of nature's resilience–the ultimate testament to the cycle of life in the animal kingdom.#Wildlife#Nature#Survival#BisonVsWolves

Others are asking
有哪些AI工具具备文案写作、代码生成、API接口功能
以下是一些具备文案写作、代码生成、API 接口功能的 AI 工具: 1. OpenAI API:可以应用于几乎所有涉及生成自然语言、代码或图像的任务,提供了一系列不同能力级别的模型,适用于不同任务,并且能够微调您自己的自定义模型。 2. Ideogram 2.0:是目前 AI 设计能力较强的工具,文字生成效果好且准确(仅限英文),图像生成效果优于 Flux&Dalle·3,提供 API 接口,方便企业集成高级图像生成功能。 3. Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台,适用于多种语言。 4. Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,适用于改善写作风格和简洁性。 5. ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议,功能强大,支持多种平台和集成,特别适合专业写作者。 6. Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等,生成速度快,适合需要快速创作和灵感的用户。 7. Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。
2025-02-25
我是做游乐场运营的,我想通过deepseek来帮我写短视频文案,但是不知道怎么使用提示词
以下是关于如何使用 DeepSeek 写短视频文案的提示词相关指导: 首先,在使用 DeepSeek 时,需要注意以下几个方面: 1. Coze 智能体创建: 共有 4 个输入变量,分别为 idea_txt(主题观点)、left_to_txt(画面左上角的文字)、right_to_txt(画面右上角的文字)、img_prmpot(画面中间图片生成提示词)。要确保这 4 个变量名称与智能体中提示词的变量对应一致,以便接收用户传入的参数。 2. 大模型节点: 使用 DeepSeek R1 模型,提示词要求不复杂,直接说出需求即可,格式可以用大白话。 3. 文本节点: 为了将文案分句,每一句要生图、配音。可选择按“句号”分句,也可根据文案格式选择不同方式。 4. 图像生成节点: 使用官方插件,模型选“LOGO 设计”。若要生成全景图,此插件效果可能不佳,建议选择其他插件。 5. 抠图节点: 将上个节点生成的图片进行抠图。 在编写提示词时,还可以运用以下针对性技巧: 1. 身份定位技巧: 目的是让 AI 理解您的背景和专业水平。 示例:差:“帮我写一篇营销方案”;好:“作为一名刚入职的电商运营,需要为天猫美妆店铺制定 618 活动方案” 2. 场景描述技巧: 目的是提供具体的应用场景和限制条件。 示例:差:“写一篇新品发布文案”;好:“为新上市的儿童智能手表写一篇朋友圈文案,目标用户是 25 35 岁的年轻父母,预算 3000 以内,需强调安全定位功能” 3. 结构化输出技巧: 目的是指定具体的输出格式和内容结构。 示例:差:“分析最近的新能源汽车销量数据”;好:“请用表格对比 2024 年 Q1 特斯拉、比亚迪的销量数据,包含以下维度:月度销量、同比增长、市场份额,并在表格下方总结三个关键发现” 4. 分步骤提问技巧: 目的是将复杂问题拆解为可管理的小任务。 示例:差:“怎么做短视频运营?”;好:“请分三步指导新手做美食短视频:前期准备:需要哪些设备和技能;拍摄阶段:关键场景和机位选择;后期制作:剪辑节奏和音乐配合建议” 5. 反馈优化技巧: 目的是通过追问获得更精准的答案。 示例:第一轮:“帮我做一份产品分析报告”;追问 1:“内容太专业了,能用更通俗的语言解释吗?”;追问 2:“可以增加一些具体的用户案例来支撑观点吗?” 6. 深度思考引导技巧: 目的是获得更深入的分析和见解。 此外,在生成单词相关的短视频时,例如生成关于非洲动物、真实风格、2 个单词的内容,您可以这样设置提示词: 角色:您是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 技能:当用户输入主题{{zhuti}}时,分析主题内涵,运用专业知识,输出{{shuliang}}个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。
2025-02-25
有没有输入点子可以生成视频文案的多维表格模板
以下是关于输入点子生成视频文案的多维表格模板的相关信息: 概述: 基于其他博主开源的视频生成工作流进行功能优化,实现视频全自动创建。感谢开源,现提供教程参考。 先看效果: 功能: 通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 3. 在多维表格中使用字段捷径,引用该智能体。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。 获取字节火山 DeepSeek 系列 API 完整教程及使用方法: 邀请可拿 3000 万 tokens,附上宝藏飞书多维表格模板,包括营销类、投资和电商、工具论文效率类、有趣类等,如: 智能体发布到飞书多维表格: 1. 工作流调试完成后,加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。 2. 发布时选择需要的发布渠道,重点讲飞书多维表格。记得智能体提示词的 4 个变量,发布时会自动出现,目的是为了在多维表格中选择关联字段。填写上架信息(为快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 多维表格的字段捷径使用: 1. 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,使用自己创建的 Coze 智能体。选择“自动更新”,输入 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 2. 表单分享,实现填写表单自动创建文案短视频。 自动化推送: 点击多维表格右上角的“自动化”,创建想要的自动化流程。
2025-02-24
爆款短视频文案prompt
以下是为您提供的爆款短视频文案 prompt 相关信息: Kimi 新出的常用语功能中有 15 款预设好的 Prompt,其中包括生成高质量的爆款网络文案。此外,还有如整理生成高质量会议纪要、整理课程 PPT、推荐影视、生成电影评论、进行职业导航、提供营销策划、进行面试模拟、生成宣传口号、进行期刊审稿、进行诗意创作、快速写新闻、凝练要点、创作短剧脚本、优化文字排版等功能。 使用 GPT 模仿创作内容的万能思路中,核心在于 GPT 对少样本范例的学习。编写 Prompt 时,要明确提供创作的方法论和技巧供 GPT 模仿学习,例如创作标题时,要明确运用的修辞手法、写作人称、语言风格、内容结构等。在数据收集方面,可以通过人工采集(复制粘贴、OCR 识别、自己手打)或自动采集(爬虫、脚本)的方式收集几十个对标博主的视频标题,采集完毕后可导出 Excel 表格并按点赞数降序筛选。
2025-02-21
口播文案 Prompt
以下是关于口播文案 Prompt 的相关内容: 一、景淮:漫画趣味高中大学时期对比图 GPTs 实战 在这个示例中,先将相关示例喂给 GPT,观察其生成文案的效果。提示词为上述高中和大学区别的口播搞笑视频,重点突出不同时期的生活状态和鲜明反差。输入关键词“下雨了”后,生成了以下口播文案: 1. 高中:下雨了,天哪,怎么办,我的数学书会湿!大学:下雨了,哦,正好,再睡一会儿。 2. 高中:下雨了,得快跑,别迟到了!大学:下雨了,那今天就不去了,网课见。 3. 高中:下雨了,我的鞋子!得小心踩!大学:下雨了,穿拖鞋去了,方便。 4. 高中:下雨了,雨衣雨伞全副武装!大学:下雨了,抓个文件夹顶顶就行。 5. 高中:下雨了,课间不能出去玩了。大学:下雨了,正好和室友打个牌。 6. 高中:下雨了,哦不,体育课怎么办?大学:下雨了,哈,今天体育课取消了! 7. 高中:下雨了,我的作业别淋湿了!大学:下雨了,电脑在宿舍,作业得推迟了。 8. 高中:下雨了,赶紧找地方躲雨。大学:下雨了,雨中漫步也挺浪漫的。 9. 高中:下雨了,不会影响放学吧?大学:下雨了,嘿,这是不是个不去自习的理由? 10. 高中:下雨了,我的头发!大学:下雨了,谁还没个糟糕的头发日呢。 二、歌词提示词 1. 柔和的原声乐器引子:指在歌曲开头使用柔和的原声乐器(如原声吉他或钢琴)演奏的部分。作用是设置温暖、亲密的氛围,引导听众进入歌曲。适用于民谣、流行音乐、乡村音乐等风格,编曲技巧是使用原声吉他或钢琴演奏柔和的旋律或和声,创造出温暖和亲密的开场效果。 2. 富有灵魂感的:充满情感和灵魂的表现,通常具有深情的旋律和强烈的情感表达。作用是增强音乐的情感深度和感染力,适用于灵魂乐、R&B、流行音乐等风格,编曲技巧是使用深情的旋律、柔和的和声和强烈的情感表达。 3. 富有灵魂感的桥段:在歌曲中间部分或过渡部分,充满情感和灵魂的旋律或和声。作用是增强音乐的情感深度和结构变化,适用于灵魂乐、R&B、流行音乐等风格,编曲技巧是在歌曲的过渡部分设计一个深情且富有灵魂感的桥段。 4. 口语:在歌曲或音乐中使用普通说话的方式进行表演,而不是唱歌。作用是增加音乐的叙述性和亲密感,强调歌词的内容和表达,适用于说唱、独立音乐、实验音乐等风格,编曲技巧是在适当的段落使用口语表演。 三、Prompt 的专场教程 基础篇 1. Prompt 是一段指令,用于指挥 AI 生成所需内容,每个单独的提示词叫 tag(关键词)。 2. 支持的语言为英语(不用担心英语不好的问题,),另外 emoji 也可以用。 3. 语法规则: 用英文半角符号逗号,来分隔 tag,逗号前后有空格或者换行都不影响效果。 改变 tag 权重:tag 顺序越靠前对于 SD 来说权重越大,可通过“括号,权重就重 1.1 倍,每加一层括号就反向减弱 1.1 倍)两种方式设置。 进行 tag 的步数控制(高级玩法):“”,数字大于 1 理解为第 X 步前为 tag1,第 X 步后变成 tag2,数字小于 1 理解为总步数的百分之 X 前为 tag1,之后变成 tag2。
2025-02-18
有哪些在企业内部落地应用AI大模型工具的实践案例?不要营销文案生成、代码开发助手、智能客服问答机器人这种太常见的
以下是一些在企业内部落地应用 AI 大模型工具的实践案例: 1. 阿里云百炼: 智能体应用:能够弥补大模型的不足,如回答私有领域问题、获取实时信息、回答专业问题等。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,以及缺少技术人员开发大模型问答应用的场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 内部业务助手:通过企业内部规章制度、部门结构、产品介绍等文档构建知识库,并借助 RAG 智能体实现内部知识问答功能。系统支持多源异构数据,并通过复杂文档解析和视觉增强技术,提升文档理解的准确性与深度。目前该功能已灰度上线,需提供 UID 并通过白名单进行开启。 2. 达摩院: AI 模特(虚拟换装):支持虚拟换装、姿态编辑。 3. 电商零售: 推广文案写作:通过内置的多样化营销场景的文体模板,基于用户输入的创作主题以及参考素材,大模型即可为您生成对应的营销文案,为营销活动和宣传文案提供灵感和文案写作支持。 4. 泛企业: VOC 挖掘:是一个面向各类企业的 VOC 标签挖掘的工具。不论是用户的长短评论、帖子、还是用户和客服/销售的聊天记录、通话记录,都可以使用。通过选中或自定义标签,即可让大模型针对海量非结构化的 VOC 数据快速打标。相比于人工打标或规则打标准确率更高;对于业务标签变动频繁的情况,也能更敏捷、快速地影响。 5. 通义晓蜜:基于深度调优的对话大模型,为营销服类产品提供智能化升级所需的生成式摘要总结、质检、分析等能力应用。
2025-02-18
国内的AI做视频工具
以下是一些国内的 AI 做视频工具: 1. Hidreamai(国内,有免费额度) 网址:https://hidreamai.com//AiVideo 支持文生视频、图生视频。 提示词使用中文、英文都可以。 文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,有时空理解。 3. Dreamina(国内内测,有免费额度) 网址:https://jimeng.jianying.com/aitool/video/generate 支持文生视频、图生视频,视频生视频。 支持图生视频首尾帧功能。 提示词使用中文、英文都可以。 文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸。 图生视频、视频生视频除尺寸不可选外,其他与文生视频基本相同。默认生成 3s 的视频。 4. 可灵(免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除不可运镜控制外,其他与文生视频基本相同。默认生成 5s 的视频。 此外,在视频制作方面,国内还可以使用出门问问的魔音工坊来调节声音情绪。在剪辑方面,对于 1 3 分钟的短片,剪映比较方便,因其有人性化设计及简单的音效库/小特效;但对于更长篇幅或追求更好效果的视频,可能需要使用 PR/FCP/达芬奇等传统剪辑软件。剪辑流程通常为:视频粗剪 视频定剪 音效/音乐 特效 包装(如字幕)。
2025-02-26
免费的图生视频软件
以下为一些免费的图生视频软件: Runway:可将图片拖进去生成 4 秒视频,但它是收费的,您也可以在闲鱼或淘宝找号。进入官网首页点击“start with image”,直接拖图片进来,动画幅度用 3,5 有时会乱跑,无需等进度条转完可继续放图。 Haiper:有免费额度,网址为 https://haiper.ai/ 。能生成文生视频、图生视频、素描生视频、扩展视频,还能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值,图生视频只能写提示词、秒数(2s 和 4s)、种子值。 DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,可生成 2 秒图生视频,还能做短视频拼长视频。 此外,还有一些相关模型的特点供您参考: |排序(从高到低)|模型|特点(优缺)| |||| |1|pd 2.0 pro|生成的画面有点颗粒感,p2.0 模型很能打,适合做一些二次元动漫特效,理解能力更强,更适合连续运镜| |2|luma 1.6|画面质量挺好,但太贵| |3|可灵 1.6 高品质|YYDS!| |4|海螺01live|文生视频比图生视频更有创意,图生也还可以,但大幅度动作下手部会出现模糊的情况,整体素质不错,就是太贵| |5|runway|画面质量不算差,适合做一些超现实主义的特效、经特殊就容镜头| |6|智谱 2.0|做的一些画面特效挺出圈,适合整过,但是整体镜头素质还差点,好处就是便宜,量大,管饱,还能给视频加音效| |7|vidu1.5|二维平面动画的快乐老家,适合做特效类镜头,单镜头很惊艳,大范围运镜首尾帧 yyds! 就是太贵| |8|seaweed 2.0 pro|适合动态相对小的,更适合环绕旋转运镜动作小的| |9|pixverse v3 高品质|首尾帧能打,就是画面美学风格还有待提升| |10|sora|不好用,文生视频挺强,但图生视频抽象镜头太多,半成品都算不上,不建议使用|
2025-02-26
什么工具可以帮忙总结课程视频的知识点
以下是一些可以帮忙总结课程视频知识点的工具: 1. 剪映:只需提供文案,能够自动配图配音,帮助优化线上课程,为微课总结内容和知识点。 2. BibiGPT:支持小红书、B 站等网站视频的归纳总结,还可以提问互动,答案会附上对应的视频节点,是融合课程备课的好助手,网址为 https://bibigpt.co/ 。 3. 飞书妙记:可以先从视频网站上提取出视频的音频部分,利用其免费语音转文字功能将音频转换成文本,下载文本后上传至其他工具进行总结。 此外,可汗学院出品的 AI Tutor Khanmigo 也具有一定的辅助作用,它可以为学生总结视频内容,并以苏格拉底式教学法引导学生思考和学习。
2025-02-26
怎么用comfyUI中的视频IC-light
使用 ComfyUI 中的视频 IClight 的步骤如下: 1. 在管理器中的节点管理中搜索 ComfyUIICLight 进行安装,安装后重启 ComfyUI。 2. 模型可以在网盘里下载,然后放入 ComfyUI/models/unet 文件夹。 3. IC Light 用于处理原视频和新背景之间的光影效果。 4. 辅助工具 ICLight 的打光方式有两种: 文本方式:上传 1 张前景图片,自动抠图,填写详细文本提示词,并在几种给定的光源方向选择。 背景+前景方式:上传 1 张背景图+1 张前景图,自动融合,填写简单文本提示词,并在几种给定的光源方向选择。 需要注意的是,IC Light 处理过的图片可能会颜色发黄偏色,不是处理过的就是好的,有时可能会负优化。另外,在进行背景替换时,不同图片合并要考虑光线、色调、边缘细节等问题。
2025-02-26
Cursor相关的资料与视频
以下是关于 Cursor 的相关资料与视频: 海辛:用 cursor + comfyUI 做应用 视频操作流程: 具体设计思路会在 10 月 18 日在通往 AGI 之路视频号分享 开设了 cursor 专区,增加了一些文章 相关文章: Cursor 官方:介绍视频 AI 代码编辑工具 The AI Code Editor:Built to make you extraordinarily productive,Cursor is the best way to code with AI. 使用 cursor See Cursor In Action: 读懂数据库 Knows your codebase:Get the best answers from your codebase—or refer to specific files or docs.Use the model's code in one click. 相关视频: 使用 tab 来编辑 Just hit tab:Cursor lets you breeze through changes by predicting your next edit. 相关视频: Cursor 小白速通:成为赤脚程序员 介绍:Cursor 是一款结合了 AI 大语言能力的编程工具,最近比较火的是的视频。在即刻和推上关注的开发者都在使用、推荐 Cursor,人工智能大佬 AK 甚至打趣说,未来编程不断摁 tab 键就行了。 主打的三个功能:代码库参考、代码补全、对话编程
2025-02-26
请推荐视频清晰度修复的AI网站
以下为您推荐一些视频清晰度修复的 AI 网站: 1. https://www.topazlabs.com/topazvideoai :Topaz Video AI 是一款用于消除视频抖动和运动模糊的插件,可提升画质、帧率等。解压对应文件后,右键管理员运行 VideoAIportable.exe 文件,导入处理好的视频进行操作。预设部分有放大视频、提升画质等功能,稳定 AI 模式分为自动裁切和完整帧,强度在 60 左右为宜。 2. Kraken.io :主要用于图像压缩,但也提供免费的图像放大功能,能保证图像细节清晰度。 3. Deep Art Effects :强大的艺术效果编辑器,通过 AI 技术能将图像放大并赋予艺术效果,支持多种滤镜和风格。 4. https://replicate.com/nightmareai/realesrgan :基于 RealESRGAN 的图像超分辨率增强模型,可选人脸修复和调节放大倍数,但使用几次后收费。 此外,还可以通过以下方式进行视频清晰度修复: 使用 Photoshop Generative AI 功能,主要工具包括 Remove tool、Clone brush、Generative fill 以及 Neural filters。链接:https://x.com/xiaohuggg/status/1692751080973828468?s=46&t=F6BXooLyAyfvHbvr7Vw2g SD 图生图,重绘幅度小一点。 另外,新的视频修复与超分辨率工具具有画面缺失修补、模糊去除、清晰度提升(最高 4 倍超分辨率)等功能,同时支持去模糊、修复、超分任务,操作简便,仅需一张 13G 显存 GPU。项目地址:https://visionxl.github.io
2025-02-25
如何把视频的内容,包括对话的文字提取并总结成文字?
要把视频的内容包括对话文字提取并总结成文字,可以按照以下步骤进行: 1. 对于有字幕的 B 站视频,如果视频栏下面有字幕按钮,说明视频作者已上传字幕或后台适配了 AI 字幕。 2. 安装油猴脚本: 。 3. 安装之后刷新浏览器,点击字幕会出现“下载”按钮。 4. 点击下载按钮,选择多种字幕格式,如带时间或不带时间的。 5. 将下载的字幕文字内容全选复制发送给 GPTs 进行总结。 此外,还有一个集成的视频理解系统 MMVid,它由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具,能处理和理解长视频和复杂任务,能够自动识别和解释视频中的元素,如人物行为、情感表达、场景变化和对话内容,从而实现对视频故事线的理解,其核心功能是将视频中的多模态信息转录成详细的文本脚本,方便大语言模型理解视频内容。
2025-02-20
视频内容提取
视频内容提取的方法主要有以下几种: 1. 使用 OpenCV 从视频中提取帧,例如从包含野牛和狼的自然视频中提取帧,显示帧以确保正确读取。 2. 对于谷歌 Gemini 多模态提示词培训课中的示例,在数字营销中从视频提取关键元素,如标题、描述和元数据。首先加载数据,包括视频的 URI、URL 和 Path,然后导入视频,写好提示,为模型指定角色和明确任务,如提取标题、撰写摘要、提供以 JSON 格式的元数据。 3. 如果想用 AI 把小说做成视频,流程如下: 小说内容分析:使用如 ChatGPT 等 AI 工具分析小说,提取关键场景、角色和情节。 生成角色与场景描述:用如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 图像生成:使用 AI 图像生成工具创建图像。 视频脚本制作:将关键点和生成的图像组合成脚本。 音频制作:利用如 Adobe Firefly 等工具将文本转换为语音,添加背景和音效。 视频编辑与合成:使用如 Clipfly 或 VEED.IO 等软件合成视频。 后期处理:进行剪辑、添加特效和转场以提高质量。 审阅与调整:观看视频并根据需要调整。 输出与分享:完成编辑后输出并分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异,且 AI 工具的可用性和功能可能会变化,建议获取最新信息和使用指南。
2025-02-20
有哪些AI网站是支持视频文字提取的?
以下是一些支持视频文字提取的 AI 网站及相关操作方法: 对于 B 站视频,如果视频有字幕,您可以安装油猴脚本“Bilibili CC 字幕工具”(https://greasyfork.org/zhCN/scripts/378513bilibilicc%E5%AD%97%E5%B9%95%E5%B7%A5%E5%85%B7 )。安装后刷新浏览器,点击字幕会多出一个“下载”按钮,可选择多种字幕格式,如带时间或不带时间的。然后将下载的字幕文字内容全选复制发送给 GPTs 进行总结。 需要注意的是,目前大部分用 AI 总结视频的工具、插件或应用都是通过提取视频字幕来实现的。
2025-02-20
图片提示词提取工具
以下是一些图片提示词提取工具: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,网址: MidJourney Prompt Tool:类型多样的 prompt 书写工具,点击按钮就能生成提示词修饰部分,网址: OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词,网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney,网址: OpenArt:AI 人工智能图像生成器,网址: img2prompt:根据图片提取 Prompt,网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,网址: AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供选择,网址: 关于悠船工具的基础使用教程: 进入官网,可以选择桌面端下载和浏览器使用。为方便选择浏览器使用,第一次使用需注册,选择企业用户注册,输入对应名称和手机号即可注册成功(目前不需要填写企业信息)。注册完成后进入具体操作页面。 基础操作:点击开始想象按钮,将生成的提示词粘贴在下面,回车等待几十秒生成 4 张图片,可选择喜欢的图片进行对应操作。 创作调整: 风格化:数字越大,越艺术,但并非越大越好,取决于创作,人像不用调整过高。 怪异化:数字越大越奇怪,可不碰。 多样化:数字越大,结果越意想不到,越低越接近提示词。建议新手一开始不用怪异和多样化,可做实验测试。 模式:默认标准,朴实 raw 会让图片质感更好,个人喜爱。 版本:默认最高 V6,建议最高,二次元可选 NIJI。 生成图片的速度:默认快速,越快对支付套餐要求越高。 “城市狂想”直接上手操作的教程中关于图片提示词生成: 提供了猫叔写的一段提示词的 prompt 并生成了三条,还为大家直接生成了 1 组共 12 段提示词,可直接使用。注意提示词在悠船和 MJ 中可直接用,在其他平台工具请复制后删除包含“”以后的部分。拿到提示词后可进入喜欢的 AI 绘画工具界面,例如悠船,点击开始想象按钮粘贴提示词。
2025-02-18
短视频文案提取和改写
以下是关于短视频文案提取和改写的相关内容: 智能体功能实现: 卖点转化模块:作用是将卖点转化为用户视角的买点,目的是用户视角的内容更易打动用户,提升营销效果。实现方式包括用户选择改写时强调的情绪价值点,并将相应内容添加到大模型的用户提示词,以及从产品名称、产品描述和通用性/独特性/保障性卖点,利用大模型转化为对应的买点。 营销内容产出模块:作用是利用总结的买点,结合产品信息,产出小红书文案和短视频脚本。目的是使用户提炼卖点、转化卖点之后产出可直接使用的高质量营销内容。实现方式包括使用循环节点产出任意数量的文案内容,将大模型的随机性调到最高以确保多次产出内容的差异性,用数组分别保存小红书文案和短视频脚本,即使两种内容交叉生成,最终也能在文档中分开显示。 文档保存模块:作用是将产品名称,以及产出的所有内容,包括卖点、买点、小红书文案、短视频脚本保存到飞书文档。目的是供未来重复使用和决策支持,并方便对产出内容进行管理。实现方式包括使用 create_document 插件创建新的飞书文档,并填充内容,使用文本处理节点整合所有产出内容,并调整格式。 电商带货本地生活: 用 ChatGPT 生成短视频选题文案:表明身份、描述需求、提出回答要求,以美妆行业为例展开。 用 ChatGPT 生产短视频文案:将需求与框架结合,让 ChatGPT 生成短视频文案。 生成虚拟数字人短视频:打开相关网站,输入内容选项,选择头像、国家和声音,点击 Create Video 生成视频,结合产品讲解后即可发布进行视频带货。 《AI 你·南京》AIGC 城市宣传 MV 全流程制作解析: 文案创作:最初打算用旁白朗诵方式,对文案要求高。直接让 GPT 写文案结果平淡,需更具体提需求。利用 360 浏览器字幕提取功能捕捉《爱我中华》视频文案,让 kimi 和 GPT 分析学习,对比两者结果,发现 kimi 对中文理解和写作能力更突出。整合两段文案并调整,让文案更顺口,还可让 AI 输出简单的画面分镜。
2025-02-17
使用飞书机器人(如Coze智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)
以下是使用飞书机器人(如 Coze 智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)的相关内容: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口输入更符合用户习惯。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用步骤: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,然后复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。 目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出,由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,理论上无需开发任何插件、APP,就能实现跨平台的稍后读收集与智能阅读计划的推荐。部署完成后,您可以在电脑、手机端通过飞书机器人与稍后读助手进行对话,也可以直接在 Coze 商店中与 bot 进行对话,如果部署到微信服务号、订阅号,还可以通过这些渠道调用 bot。
2025-02-16