以下是关于视频文案提取的相关内容:
在《AI 你·南京》AIGC 城市宣传 MV 全流程制作解析中,一开始打算用旁白朗诵方式制作片子,这对文案要求较高。直接让 GPT 写文案效果平淡,需更具体提需求。利用 360 浏览器字幕提取功能捕捉《爱我中华》视频文案,让 Kimi 和 GPT 分析学习,写文案时同时对比两者结果,发现 Kimi 对中文理解和写作能力更突出。做完文案分析后让 AI 按风格写作,整合两段并调整,使文案更顺口。文案整理完可让 AI 输出简单画面分镜。
在阿里云百炼大模型多模态能力解析中,借助视频处理、理解和大语言模型串联能力,实现对视频指定要点的理解提取,按要求生成指定类型文案、提取标签和洞察分析。输入视频,可集成文本描述和内容,模型能理解生成基于文本的摘要等。在视觉语言分析和文本处理阶段,可通过自定义 prompt 执行相关任务,产出视频标签等。上传视频可根据不同场景生成文案描述。
在企业级 AI 应用开发知识点中,同样借助视频处理等能力实现对视频要点的理解提取和生成指定文案等。参考视频数据,选择营销场景应用提示词模版,输出效果包括万相营造,这是阿里旗下的 AI 智能创意平台,提供一站式生成图片、视频、文案服务,有多种 AI 工具助创意提效,可免费使用网站 https://www.wanxiang.art/ 。未来可将不错的应用上架到阿里云百炼市场联合售卖。
一开始,我们打算用旁白朗诵的方式来做这条片子,类似《舌尖上的中国》的那种感觉,这就对文案会有比较高的要求。但是如果你直接要求GPT去写这段文案的话,它给的结果会比较平淡,因为它并不知道你要写这段文字的前因后果,也不清楚你的喜好和拍摄风格,所以想要得到好的结果,我们需要把需求提得更具体一些。于是,我利用360浏览器的字幕提取功能,捕捉了一下《爱我中华》的视频文案。接下来,分别让kimi和gpt进行分析和学习,这是让AI能按照我们的预期进行写作的一个好的方法。它并不是简单的模仿,而是去理解目标的写作风格,并融会贯通。KimiChatGPT我写文案的时候通常会同时开kimi和gpt两个窗口,来对比它们的结果,我发现在对中文的理解和写作能力上,kimi的表现还是要更突出一些。毕竟是国产大模型,本土化将是我们最大的优势。做完文案分析之后,我们就可以让AI按照此风格去写作了,这次创作的稿子就比一开始的要好很多。两个AI的作品各有千秋,我决定稍作调整,把这两段整合一下。KimiChatGPT在调整阶段,我们首先要让文案读起来更顺口,所以我挑选了一些语句让它单独修改。比如“钟山风雨起苍黄,江南佳丽地,金粉六朝都”这一句,我希望能更押韵一点,于是在我的提示下,kimi将其改为了“钟山风雨起苍黄,古都烟云梦犹长”,虽然有一些拼接的痕迹,但是我觉得对于AI来说,能完成到这样也是不错的了。毕竟对于不是作家不是诗人的普通人,要如此快完成这种水准的输出还是很难的。文案整理完之后,就可以让AI输出简单的画面分镜了,这样能让我们看到一个比较直观的构想。很多时候,从1到2比从0到1要轻松很多。Kimi
借助视频处理、视频理解、大语言模型的串联能力,实现对视频里指定要点的理解和提取,并按要求生成指定类型的文案、提取标签、洞察分析。输入一段视频,可集成文本描述和视频内容,使模型能够理解并生成基于文本的摘要、描述或对视频内容的提取、分析。在视觉语言分析阶段,可通过自定义的prompt让大模型重点关注和提取视频中的某些特征,或者按要求做视频筛选;在文本处理阶段,则可通过自由定义的prompt,执行基于上一阶段的抽取、写作、分析等任务,产出视频标签、视频分析总结,或指定文体、风格的各类文章等。测试视频数据:[测试视频.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RgiBbgoiroqFN5xoUgJcJPCHnPb?allow_redirect=1)我们上传视频后,可以根据不同的场景去生成文案描述,我们可以使用刚才通义万相里面生成的视频,看看是什么效果!可以看到针对这个视频,多模态模型应用理解后生成的文案效果。[a487322677804f818e3e61bd8ea31f4e.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RlW9b1qhKo5jz9xtBkQcKspJnCc?allow_redirect=1)
借助视频处理、视频理解、大语言模型的串联能力,实现对视频里指定要点的理解和提取,并按要求生成指定类型的文案、提取标签、洞察分析。输入一段视频,可集成文本描述和视频内容,使模型能够理解并生成基于文本的摘要、描述或对视频内容的提取、分析。在视觉语言分析阶段,可通过自定义的prompt让大模型重点关注和提取视频中的某些特征,或者按要求做视频筛选;在文本处理阶段,则可通过自由定义的prompt,执行基于上一阶段的抽取、写作、分析等任务,产出视频标签、视频分析总结,或指定文体、风格的各类文章等。参考视频数据:[标准_奥特曼送出的生日祝福_拿出生日蛋糕.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/K9FMbljkpoBup3xLIvXcLBdAn4e?allow_redirect=1)我们选择使用营销场景应用提示词模版输出效果:[heading5]2.2.6万相营造[content]万相营造是阿里旗下AI智能创意平台,提供一站式生成图片、视频、文案服务。平台支持海量模板一键生成大片级商品图、超多AI模特任您选择、平铺服装一键上身立体呈现,更有智能抠图、高清放大、尺寸魔方等各种AI工具助您创意提效!(不用付费)大家可以直接使用这个网站:https://www.wanxiang.art/生成效果展示:未来大家也可以把自己的不错的应用上架到阿里云百炼市场中联合售卖。百炼大模型AI应用合作咨询:https://survey.aliyun.com/apps/zhiliao/4V74sMCdH