Chat with Wiki - 提取视频文案

Answer

以下是关于提取视频文案的相关内容：

《AI 你·南京》AIGC 城市宣传 MV 全流程制作解析

在文案创作方面，一开始打算用旁白朗诵方式，类似《舌尖上的中国》，但直接让 GPT 写文案结果较平淡，因它不知前因后果和喜好风格。于是利用 360 浏览器字幕提取功能捕捉《爱我中华》视频文案，让 Kimi 和 ChatGPT 进行分析学习，写作时同时开两个窗口对比，发现 Kimi 对中文理解和写作能力更突出。做完文案分析后让 AI 按风格写作，整合两段并调整，如将“钟山风雨起苍黄，江南佳丽地，金粉六朝都”改为“钟山风雨起苍黄，古都烟云梦犹长”。整理完文案可让 AI 输出简单画面分镜。

DAY3 - 更热门的多模态交互案例带练，实操掌握 AI 应用开发

借助视频处理、理解和大语言模型串联能力，实现对视频指定要点的理解提取，按要求生成指定类型文案、提取标签、洞察分析。输入视频可集成文本描述和内容，让模型理解生成基于文本的摘要、描述或对内容的提取分析。在视觉语言分析和文本处理阶段，可通过自定义 prompt 执行抽取、写作、分析等任务，产出视频标签、总结或指定文体风格的文章等。上传视频后可根据不同场景生成文案描述，并查看效果。

Content generated by AI large model, please carefully verify (powered by aily)

References

白马：6000字超详细复盘！《AI你·南京》AIGC城市宣传MV全流程制作解析

一开始，我们打算用旁白朗诵的方式来做这条片子，类似《舌尖上的中国》的那种感觉，这就对文案会有比较高的要求。但是如果你直接要求GPT去写这段文案的话，它给的结果会比较平淡，因为它并不知道你要写这段文字的前因后果，也不清楚你的喜好和拍摄风格，所以想要得到好的结果，我们需要把需求提得更具体一些。于是，我利用360浏览器的字幕提取功能，捕捉了一下《爱我中华》的视频文案。接下来，分别让kimi和gpt进行分析和学习，这是让AI能按照我们的预期进行写作的一个好的方法。它并不是简单的模仿，而是去理解目标的写作风格，并融会贯通。KimiChatGPT我写文案的时候通常会同时开kimi和gpt两个窗口，来对比它们的结果，我发现在对中文的理解和写作能力上，kimi的表现还是要更突出一些。毕竟是国产大模型，本土化将是我们最大的优势。做完文案分析之后，我们就可以让AI按照此风格去写作了，这次创作的稿子就比一开始的要好很多。两个AI的作品各有千秋，我决定稍作调整，把这两段整合一下。KimiChatGPT在调整阶段，我们首先要让文案读起来更顺口，所以我挑选了一些语句让它单独修改。比如“钟山风雨起苍黄，江南佳丽地，金粉六朝都”这一句，我希望能更押韵一点，于是在我的提示下，kimi将其改为了“钟山风雨起苍黄，古都烟云梦犹长”，虽然有一些拼接的痕迹，但是我觉得对于AI来说，能完成到这样也是不错的了。毕竟对于不是作家不是诗人的普通人，要如此快完成这种水准的输出还是很难的。文案整理完之后，就可以让AI输出简单的画面分镜了，这样能让我们看到一个比较直观的构想。很多时候，从1到2比从0到1要轻松很多。Kimi

DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

借助视频处理、视频理解、大语言模型的串联能力，实现对视频里指定要点的理解和提取，并按要求生成指定类型的文案、提取标签、洞察分析。输入一段视频，可集成文本描述和视频内容，使模型能够理解并生成基于文本的摘要、描述或对视频内容的提取、分析。在视觉语言分析阶段，可通过自定义的prompt让大模型重点关注和提取视频中的某些特征，或者按要求做视频筛选；在文本处理阶段，则可通过自由定义的prompt，执行基于上一阶段的抽取、写作、分析等任务，产出视频标签、视频分析总结，或指定文体、风格的各类文章等。测试视频数据：[测试视频.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RgiBbgoiroqFN5xoUgJcJPCHnPb?allow_redirect=1)我们上传视频后，可以根据不同的场景去生成文案描述，我们可以使用刚才通义万相里面生成的视频，看看是什么效果！可以看到针对这个视频，多模态模型应用理解后生成的文案效果。[a487322677804f818e3e61bd8ea31f4e.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RlW9b1qhKo5jz9xtBkQcKspJnCc?allow_redirect=1)