Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

利用deepseek写脚本短视频

Answer

以下是关于利用 DeepSeek 写脚本短视频的相关信息:

  • 基于其他博主开源的视频生成工作流进行了功能优化,实现了视频全自动创建,并写了教程供参考。
  • 功能方面,通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。
  • 涉及工具包括 Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。
  • 大体路径为:通过 Coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 Coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。

此外,人们使用 DeepSeek 做了很多事情,例如脑爆活动方案、出会议纪要方案、本地搭超级 AI 助手、处理客户评论、分析总结复盘内容、生成专业软件使用过程、写小说框架、改简历、写论文、写小红书笔记、写周报、做设计头脑风暴、做网站等。

还有案例是让 DeepSeek 给海螺更大胆的想法,如特定的 Prompt 描述,结合海螺 AI 灵动自如的镜头运动,制作游戏恢弘场景,无需昂贵设备和团队,现在编剧“DeepSeek”+导演“你”+创作顾问“海螺 AI”,想象力是唯一边界。

Content generated by AI large model, please carefully verify (powered by aily)

References

输入观点一键生成文案短视频

基于其它博主开源的视频生成工作流,做了一些功能优化,实现视频全自动创建。感谢开源的力量,现在也自己写一篇教程供大家参考。[heading2]先看效果[content][2月18日.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Oe7ib8NfNolVf1xQMRCcJnb0n2e?allow_redirect=1)[heading2]功能:[content]通过表单,输入主题观点,提交后,自动创建文案短视频,创建完成后推送视频链接到飞书消息。视频创建结果通知:[https://agent.mathmind.cn/minimalist/api/video/files/57e1b73f-dafd-49bc-852e-87b1c9a084bc.mp4](https://agent.mathmind.cn/minimalist/api/video/files/57e1b73f-dafd-49bc-852e-87b1c9a084bc.mp4)[heading2]涉及工具:[content]1、Coze平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)2、飞书(消息)3、飞书多维表格(字段捷径、自动化流程)[heading2]大体路径:[content]1、通过coze创建智能体创建工作流,使用DeepSeek R1根据用户观点创建文案,再创建视频。2、发布coze智能体到飞书多维表格。3、在多维表格中使用字段捷径,引用该智能体。4、在多维表格中创建自动化流程,推送消息给指定飞书用户。

一起做个互动调研你用DeepSeek干了什么

|帮我脑爆活动方案(AJ杭州)|会议纪要给它出方案思考非常到位,稍加修改就可以呈现高质量的会议总结|本地搭超级AI助手(陈星北京)|DS+飞书批量处理客户评论Lily温州|:-分析总结复盘内容|生成专业专用软件详细使用过程,非常正确(兰州)|辰|李意儿用|||-|-|-|-|-|-|-|-|-||变现当然|Candice代码编写|帮我写小说框架和||让ds给出拓展市场的梳理角度和咨询梳理|写党员的用自我批评用古诗改简历苏州<br>学长刚蝈<br>探索外太空|大创苏州a文案胡泽华改简历|园子<br>写文案|||Forget,之前用过deepseek分析过我的感情问题,补充了我对于心理学的一些空缺,了解了更多|Ecfa苏州一晚三个营销方案<br>Deepseek一晚,干了之前一个月的活|Yvonne写论文<br>AI中医+心理咨询师|AI育儿,生图AI撰写提示词辅食<br>北京,赵赵|帮我o|帮我生帮<br>短视频脚本。当百度用|写方案,做图|用a帮我|||南京得一写小红书笔记,八字算命,|8<br>写周报用|帮我做设计头脑风暴🧠🧠🧠🧠🧠🧠🧠🧠|上海BaoBig粒||Guigui北京<br>算命🔮<br>分析<br>^_^|柯柯武汉做网站葉用<br>投喂大量的deepseek|||

海螺超级创作者|DeepSeek + 海螺AI,AI视频迈入“空间理解”新阶段

Prompt:[右侧移动,左侧平移,跟踪拍摄]黄昏的天空下,一位孤独的旅行者漫步在浩瀚如玻璃般的海洋上。在透明的海水下,数百万颗星星闪烁,鲸鱼脉动,仿佛整个宇宙都被淹没了。一只巨大的发光蝴蝶从水面上飞起,带着发光的波纹。每一步都在宇宙深处荡漾,扭曲的星系和星云就像无穷无尽的液体倒影。[摇臂向下]Jason Lee用DeepSeek富有想象力的脚本在组合海螺AI灵动自如的镜头运动后要制作游戏这类恢弘的场景再也无需昂贵的斯坦尼康镜头,大摇臂也无需会操作无人机和一整个摄影团队沟通Jason说道:“现在,编剧「DeepSeek」+导演「你」+创作顾问「海螺AI」”你的想象力,是唯一的边界[heading2]

Others are asking
如何能用到满血deepseek
以下是使用满血 DeepSeek 的方法: 1. 阿里云百炼满血版 DeepSeek: 开通满血版 R1 模型:在模型广场找到 DeepSeekR1 并授权。页面上有免费的 100 万额度及已使用量,每人免费送 100 万额度,过期浪费。此模型是阿里云自主部署且经推理优化,性能强于多数市面上的满血版本地部署。对比 DeepSeek 官网的 API,在同样价格下提供更稳定的模型服务。用完还有免费的蒸馏版 R1 模型,也是 100 万 token。这些模型可在“首页”或“直接体验”直接使用,也可进行模型效果对比或用 API 调用,如 chatbox 直接使用。 百炼应用开发:新增模板,可从模板学习应用搭建。 联网搜索:像知识库检索一样简单方便,直接配置可用,结合 Deepseekr1 更强大,如搜索天气时会多方验证。 新鲜的动态 few shot:小技巧,可用于对模型某些做不好、易出幻觉的任务通过 prompt training 强行修正。 工作流:用工作流让不同模型在同一任务创作。 阿里云百炼地址:https://bailian.console.aliyun.com/ 2. 字节火山 DeepSeek: 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台。https://zjsms.com/iP5QRuGW/ (火山引擎是字节跳动旗下的云服务平台) 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。若有提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通。若无提示则直接到第 5 步点击确认接入。 确认无误后点击“确认接入”按钮。 自动返回创建页面,复制接入点的 ID 保存。 点击【API 调用】按钮,复制 API Key 并保存。若没有 API key 则点击【创建 API key】。 火山引擎的优势:价格感人,默认提供高达 500 万 TPM 的初始限流,推理速度处于第一梯队。结合相关教程可打造专属 AI 助理。
2025-03-04
用deepseek打造个人知识库
以下是关于用 DeepSeek 打造个人知识库的相关信息: 可以先将文本拆分成若干小文本块(chunk),通过 embeddings API 将其转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块作为问答的知识库。当用户提出问题时,将问题也转换成向量,与储存库中的向量比对,提取关联度高的文本块,与问题组合成新的 prompt 发送给 GPT API,从而提高回答的准确性和相关性。例如对于“此文作者是谁?”的问题,可以直观或通过比较 embeddings 向量找到关联度最高的文本块,如“本文作者:越山。xxxx。”。 在 RAGFlow 中,可配置本地部署的 DeepSeek 模型。选择 Ollama 并配置相关信息,导入嵌入模型用于文本向量化。设置系统模型后,可创建知识库,导入文件(可设置文件夹)并解析,解析速度取决于本机 GPU 性能。解析完成后进行检索测试,没问题即可进入聊天界面,还可自行设置助理。 此外,AI 编程与炼金术中也涉及 DeepSeek 的相关知识,如在不同章节中的应用,包括给老外起中文名、驱动 Life Coach 等,具体内容可通过相关链接进一步查看。
2025-03-04
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 生成小红书爆款单词视频:输入单词主题、图片风格、单词数量,选择 deepseekr1 模型生成单词数组。角色为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容并以数组形式呈现。 Deepseek 时代提示词的关键诉求:完整的长提示词可能不如片段有效甚至干扰模型思考,在 deepseek 时代或模型有深度思考能力时,用户只需在关键点引导,采用“关键诉求直通车”模式,如像对聪明助理打暗号。 让 DeepSeek 生成相机运动轨迹的提示词:以往提示词是场景、构图等的组合,现在可以把这些提示词以“相机运动轨迹”的方式描述给 DeepSeek,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。
2025-03-04
deepseek如何在wps中使用
在 WPS 中使用 DeepSeek 可以参考以下步骤: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek。 3. 认真阅读开场白之后,正式开始对话。 另外,还可以通过以下多种方法和途径使用: 1. 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 2. 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 3. 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 4. 添加“DeepSeekR1”模型。 5. 可以愉快玩耍,无需担心“服务器繁忙”了,打开联网功能,还可以支持联网搜索使用 R1。
2025-03-04
claude 3.7和deepseek r1比,能力怎么样
Claude 3.7 在多个方面表现出色。相较于 DeepSeek R1,除了数学方面,带有扩展思考模式的 Claude 3.7 在任务指令跟随、通用推理、多模态能力和自主编程方面表现出色,拿下最高分。在多项基准测试中,“扩展思考”模式加持下的 Claude 3.7 在数学、物理、指令执行、编程等方面刷新了 SOTA,编码能力暴涨 10%以上,几乎完全碾压 o3mini 和 DeepSeek R1,与 Grok 3 不相上下。宾夕法尼亚大学沃顿商学院的教授 Ethan Mollick 对 Claude 3.7 进行了测试,对其能力既惊叹不已又感到一丝不安。例如,Claude 3.7 能通过自然对话或文档获得可运行的程序,还能对需求进行预判和采用新方法思考,生成超出要求的成果。参考资料:https://www.anthropic.com/news/claude37sonnet https://x.com/alexalbert__/status/1894093648121532546 https://x.com/AnthropicAI/status/1894092430560965029 https://www.oneusefulthing.org/p/anewgenerationofaisclaude37
2025-03-04
我想完全本地化部署deepseek,然后,将我的文档,文本,图片等内容丢给它训练,微调。我要完全本地化,因为我的文档设计隐私。我要免费开源流程。如何实现,
要完全本地化部署 DeepSeek 并使用您的文档、文本、图片等内容进行训练和微调,以下是一些相关的信息和步骤: 1. 模型训练与平台服务: 模型复现与微调:1:1 复现通常没问题,但理解细节并自行制作需要基础知识。有手把手教程、数据集等可帮助 1:1 复现,微调在特定领域可降低幻觉,参数量不变但权重变化。 训练模型的学习方法:先会用再学会训,从训的过程中倒推学习参数调整,这是以用导学的学习方法。 模型回答效果对比:微调后的模型在回答排列组合等问题时,思考前几乎无反馈,答案多为英文且格式稳定,但仍可能答错。 2. 平台服务介绍: 阿里云提供多种解决方案。 百炼是提供多种模型服务的 Maas 平台。 派平台是提供云服务的 PaaS 平台,二者在定位、服务内容和核心差异上有所不同。 3. 关于模型训练与数据集相关问题: 数据资源情况:默认提供公共数据训练集,百派平台能匹配模型和数据,通义开源了不少数据集。 多模态训练:多模态有自身标注方式,如视频拉框标注。 参数量变化:通常训练模型参数量固定,若想改变需改模型层,但可能要从头调。 本地微调框架:可使用 llama factory 等框架,需搭建并部署。 开源数据下载:可在 GitHub、hugging face、Mo Model Scope 等平台获取。 数据集转化:将文档资料转成数据集可先手动形成 SOP,再逐步自动化,初期需大量人力。 4. 本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。 5. 免费额度说明:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 6. 平台服务差异:介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 7. 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 R1 模型的强化学习:通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。 R1 模型的蒸馏与微调:用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。 R1 与其他模型的差别:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。 模型的相互帮助:Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 请注意,在进行本地化部署和训练微调时,需要具备一定的技术知识和经验,并且要遵循相关的法律法规和道德规范。
2025-03-04
如果我想基于一条视频的视频风格,结合我自己的视频内容创作需求,生成一条新的demo视频,怎么使用AI更加高效和达到我想要的效果?
要基于一条视频的风格结合自己的需求生成新的 demo 视频,您可以参考以下步骤,更高效地达到想要的效果: 1. 准备内容 先准备一段视频中播放的内容文字,比如产品介绍、课程讲解、游戏攻略等。您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容,这将为数字人提供语音播放的内容以及生成与文字内容相对应的口型。 另外,如果您想用 AI 把小说做成视频,可以按照以下流程: 1. 小说内容分析 使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述 根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成 使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作 将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作 利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成 使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理 对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整 观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享 完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-04
视频生成
视频生成是当前 AIGC 领域的一个重要方面,以下是关于视频生成的详细介绍: 一、AIGC 概述中的视频生成分类 以生成方式划分,当前视频生成可分为文生视频、图生视频与视频生视频。视频生成涉及深度学习技术,如 GANs 和 Video Diffusion,现在的主流生成模型为扩散模型(Diffusion model)。视频生成可用于娱乐、体育分析和自动驾驶等各种领域。 二、与语音生成的结合 视频生成经常与语音生成一起使用。用于语音生成的模型可以由 Transformers 提供,可用于文本到语音的转换、虚拟助手和语音克隆等。这类 Generative AI 用于生成音频信号,常用的技术包括循环神经网络(RNNs)、长短时记忆网络(LSTMs)、WaveNet 等。 三、具有代表性的海外项目 1. Sora(OpenAI):以扩散 Transformer 模型为核心,能够生成长达一分钟的高保真视频。支持文本生成视频、视频生成视频、图像生成视频,被定位为世界模拟器,在文本理解方面有出色表现,还能在单个生成的视频中创建多个镜头,保留角色和视觉风格。 2. Genie(Google):采用 STtransformer 架构,包括三个关键组件即潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数,被定位为基础世界模型,可通过单张图像提示生成交互式环境。 3. WaveNet(DeepMind):一种生成模型,可以生成非常逼真的人类语音。 4. MuseNet(OpenAI):一种生成音乐的 AI 模型,可以在多种风格和乐器之间进行组合。 5. Multilingual v2(ElevenLabs):一种语音生成模型,支持 28 种语言的语音合成服务。 四、生成带有文本提示和图像的视频 在 Advanced 部分,您可以使用 Seed 选项添加种子编号,以帮助启动流程并控制 AI 创建的内容的随机性。如果使用相同的种子、提示和控制设置,则可以重新生成类似的视频剪辑。然后选择 Generate 生成。 五、PixVerse V2 的使用教程 1. 输入提示词。 2. 上传图片(如无图片上传,可忽略此步骤)。 3. 选择视频时长,支持 5s 和 8s 的视频生成,选择后,每个 Scene 的时长都会保持这个长度。 4. 添加新片段: 点击“Scene 1”旁边的“+”,为视频添加第二个片段。 在 Scene 2 中,您可以为 Scene2 输入不同于 Scene 1 的提示词,其它操作与之前相同。 5. 生成视频:点击图标生成视频。该模式下,每次生成需要花费 30Credits,且默认将所有片段拼接在一起,不支持单片段下载。 6. 编辑生成的视频:点击视频进入编辑页面。 视频下方分别为:角色,环境,动作。如生成的视频不满意,您可从相应的下拉选项中选择想要的效果。 上方为进度条,通过点击切换 Scene,可一次性对多个 Scene 进行编辑后一起生成。 对所有 Scene 编辑完成后,点击“Create”,可重新生成视频。未修改的 Scene,再次生成时也会改变,不会与之前生成的视频保持一致。
2025-03-04
如何综合使用各种ai工具,生成视频?
综合使用各种 AI 工具生成视频的步骤如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 在实际操作中,不同工具对画面的处理能力不同,可以根据具体情况组合使用。例如: Pixverse 擅长物体滑行运动,可用于生成相关内容,若有部分不理想,可放到 Pika 里面去局部重绘。 有手部特殊运动的画面,可用 Runway 来辅助完成。 需要人物表情比较自然的画面可使用 Pika 来生成。 以下是一些根据视频脚本生成短视频的 AI 工具: ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频所需要素并生成素材和文本框架。 PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 Runway:能够将文本转化为风格化的视频内容。 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-04
写短视频口播文案,用哪个AI效果最好
以下是为您提供的关于写短视频口播文案的 AI 工具相关信息: 在营销板块,有智能营销矩阵平台,其在图文内容生产方面为企业提供选题生成、文案创作等定制化服务。 目前一些相关的 AI 工具包括: 1. 美趣 AI:具有图片生成功能,是原生的写作软件。 2. 说得相机提词器:功能型写作软件。 3. AI 智能写作:原生的写作软件。 此外,TecCreative 创意工具箱中也有一些相关功能,如数字人口播配音,只需输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。 需要注意的是,不同的 AI 工具可能具有不同的特点和优势,您可以根据自己的需求和使用习惯进行选择。
2025-03-04
写短视频口播最好用的AI是哪个
目前市场上有多种适用于短视频口播创作的 AI 工具,以下为您列举部分: 美趣 AI:具有原生的图片生成功能,是一款 AI 绘画、视频和写作生成神器。 说得相机提词器:功能型写作软件,适用于口播短视频的文案生成及美颜拍摄。 AI 智能写作:原生的写作软件。 创客贴 AI:具有平面设计功能。 360AI 搜索:功能型的智慧搜索工具。 图趣 AI:原生的图片生成工具。 Molica AI:原生的图片生成工具。 文案宝:原生的个人助理,具有 AI Bot 智能生成器和一键 AI 识图功能。 需要注意的是,选择最适合的 AI 工具取决于您的具体需求和使用习惯。
2025-03-04
我想要获得短视频脚本创作到视频剪辑的解决方案
以下是从短视频脚本创作到视频剪辑的全面解决方案: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 将帮助生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 案例参考: 桂大羊提供了保姆级教程,基于大语言模型和绘图模型,探索了文生图到图生视频的创作实践。例如,在一带一路背景下丝绸之路这个角度的创作中,选择了大语言模型 chatgpt、kimi 进行剧本分镜设定,文生图 midjourney 生成视觉画面,图生视频选择即梦 dreamina 制作动态画面,suno 音乐编曲,ondoku 主角台词配音,视频剪辑使用剪映,部分音效在网上无版权下载或使用剪映自带音效。同时确立了时长(1 分钟左右的 AI 生成画面,加上闭幕不超过 2 分钟)和风格(大致定义为中国风)。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-04
有没有短视频的脚本prompt
以下是为您提供的一些短视频脚本 prompt 相关内容: 1. 使用 GPT 的视觉功能和 TTS API 处理和讲述视频:可以用大卫·阿滕伯勒的风格为视频制作画外音,使用相同的视频帧提示 GPT 给出简短脚本。 2. 编剧提示词 01——剧本创作:对于短视频,在提交创作偏好时需标注片长,比如明确这是个 3 分钟的短视频。其输出是分阶段的,几个来回就能搞定剧本。 3. 潘峰:Prompt 5 大通用方法中的扩写与改写法:自己要给出开头,让 AI 理解语言逻辑从而撰写下半部并包含必要内容。可以将生成的内容用不同写作技巧转换风格,多滚动几次能写出多样版本与风格,降低初稿修改时间。此外,还有反问法,比如让 AI 问您问题,能发现它思考更仔细,也能了解其逻辑并修正。示例中还包括让 AI 引导您完成能表现个人品牌专业度或创造社群话题的短视频脚本。
2025-03-03
一个智能脚本的智能体提示词应该怎么写
以下是关于智能体提示词的相关内容: 对于儿童寓意故事创作者智能体,比如“此地无银三百两”的故事,描述了张三藏银并留下纸条,被隔壁王二发现并偷走银子的情节。 又如“熟能生巧”的故事,讲述了山海关题字中店小二用独特方式写出绝妙“一”字的经过。 在创建 Coze 智能体时,工作流中的每个节点有不同的细节。“开始”节点有 4 个输入变量,分别为 idea_txt(主题观点)、left_to_txt(画面左上角的文字)、right_to_txt(画面右上角的文字)、img_prmpot(画面中间图片生成提示词),且变量名称要与智能体中提示词的变量对应一致。“大模型”节点使用 DeepSeek R1 模型,提示词要求不复杂,说出需求即可。“文本”节点是为了将文案分句,可按“句号”分句,具体根据文案格式选择不同方式。“图像生成”节点使用官方插件,模型选“LOGO 设计”,若生成全景图,此插件效果可能不佳,建议选其他插件。“抠图节点”用于对上一节点生成的图片进行抠图。 总之,写智能体提示词要根据具体的应用场景和需求来确定,明确输入变量和模型要求等。
2025-02-27
AI编写自动化框架的脚本能实现吗?可以选用哪些工作来支持?框架选用需要进行指定吗?
AI 编写自动化框架的脚本是可以实现的。以下是一些可选用的工作和支持工具: 1. 基于规则的测试生成: 测试用例生成工具: Randoop:基于代码路径和规则生成测试用例,适用于 Java 应用程序。 Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试,适用于.NET 应用。 模式识别: Clang Static Analyzer:利用静态分析技术识别代码模式和潜在缺陷,生成相应的测试用例。 Infer:Facebook 开发的静态分析工具,自动生成测试用例,帮助发现和修复潜在错误。 2. 基于机器学习的测试生成: 深度学习模型: DeepTest:利用深度学习模型生成自动驾驶系统的测试用例,模拟不同驾驶场景,评估系统性能。 DiffTest:基于对抗生成网络(GAN)生成测试用例,检测系统的脆弱性。 强化学习: RLTest:利用强化学习生成测试用例,通过与环境交互学习最优测试策略,提高测试效率和覆盖率。 A3C:基于强化学习的测试生成工具,通过策略梯度方法生成高质量测试用例。 3. 基于自然语言处理(NLP)的测试生成: 文档驱动测试生成: Testim:AI 驱动的测试平台,通过分析文档和用户故事自动生成测试用例,减少人工编写时间。 Test.ai:利用 NLP 技术从需求文档中提取测试用例,确保测试覆盖业务需求。 自动化测试脚本生成: Selenium IDE + NLP:结合 NLP 技术扩展 Selenium IDE,从自然语言描述中生成自动化测试脚本。 Cucumber:使用 Gherkin 语言编写的行为驱动开发(BDD)框架,通过解析自然语言描述生成测试用例。 至于框架选用是否需要进行指定,这取决于具体的项目需求和技术环境。在选择框架时,需要综合考虑多种因素,如项目的规模、技术栈、开发团队的技能水平等。
2025-02-26
ai为我写一个视频脚本的提示词
以下是为您生成的关于让 AI 写视频脚本的提示词的相关内容: 要让 AI 写视频脚本,提示词的结构包括: 1. 明确要做什么样的视频,比如要做 30 秒时长的广告宣传片脚本、做一个孩子们喜欢的儿童绘本脚本等。 2. 指出视频要包含的关键元素,重点把产品的特性或者您想要的广告风格说出来,例如奔驰高端商务、豪华舒适的特性,苹果香脆多汁、红润饱满的特点。 3. 说明对脚本的输出要求,比如按照一定的格式输出,推荐使用 Markdown 格式输出,方便后续操作。 在选择大模型时,有多种选择,如 Kimi、Claude、Chatgpt 等,效果都能满足要求,可按需选择。对于科学上网困难的小伙伴,优先选择免费好用的 kimi(https://kimi.moonshot.cn/),有条件的话选择老牌的功能更强大的 chatgpt(https://chatgpt.com/)也可以。本作品用的是 Claude(https://claude.ai/new),Claude 在脚本创作方面有优势。 和大模型对话就像和老朋友聊天一样轻松。 例如,完整的让 Claude 写脚本的提示词可以是:“我要做一个 30 秒时长的奔驰汽车广告宣传片脚本,视频要突出奔驰高端商务、豪华舒适的品牌特性,画面要有高级感,简单大气。请按照 Markdown 格式输出。”
2025-01-19
ai写拜年视频拍摄脚本
以下是为您生成的拜年视频拍摄脚本的相关内容: 创作思路: 讲述一个外出打工的人春节回家过年的故事,按照回家过年的时间线,从启程回家到家人团圆。 营造过年场景,展现春节的喜庆吉祥,制作成贺岁的 MV。 引起情感共鸣,突出贺岁、欢度新春的氛围,展现热闹的新年场景,强调满满的年味儿。 视频风格:电影感、真实感。 视频时长:35 秒以上。 视频构思:从启程回家到家人团圆,展现不同的春节场景,以贺岁的 MV 形式呈现,满满的过年喜庆感,最后加入自己的数字人分身拜年结尾。 视频比例:16:9 使用工具: Midjourney Stable diffusion Runway PixVerse heygen 剪映 使用 ChatGPT 列出大纲:可作为思维框架激发创意,每个镜头内容可根据自身想法创意编写提示词出图。 主角形象设计(18 岁左右): 外观特征:男性,约 18 岁,充满青春活力和冒险精神。发型为时髦的短发,可能有亮银色或电光蓝等潮流染色。面容有明亮且充满好奇的眼神。 服装:结合未来科技感和青年流行元素,主要色调为活泼的颜色如蓝色、绿色或银色,与黑色或灰色相搭配,材质为轻便的高科技材料。 装备:智能手表具有通讯、导航和游戏功能,多功能背包内含必要的探险工具和个人物品,特殊眼镜有增强现实功能。 性格特征:充满好奇心和创造力,冒险且自信,友好且乐于交流。 背景故事简介:对科技和神秘传说感兴趣,因网络上关于《山海经》神兽的线索决定踏上寻找真相的旅程。 节目单: 数字人及互动类: AI 还你真正假期:数字游民 AI 生活 Vlog。包括真实 vlog 记录、生活感想分享、AIGC 如何改变了自己。 亲情节目:送给家人的节目。包含亲情脚本、共情,一年工作辛苦相关内容,以及互动留言、表白墙。 结尾祝福与展望:新春快乐的祝福。 图片: 观众互动海报生成:实时生成祝福海报。包括文字变文字图片、图片变祝福、预录的 10 条祝福、毛笔字。 观众头像生成:实时互动制作头像。包括预生成图片、Lora、有限制的提示词。
2025-01-19
普通人 怎么利用ai赚钱
以下是一些普通人利用 AI 赚钱的方式: 1. 电商:婴儿的四维彩超 AI 预测 思路和玩法:通过 AI 工具将宝宝的四维彩超还原出现实模样进行变现。孕妇妈妈在孕期 22 26 周会进行四维彩超检查,很多准爸爸妈妈期待宝宝模样,从而衍生出市场需求。在小红书、抖音等公域平台发布相关笔记吸引咨询。 操作流程:客户提供四维彩超图原图,在 Midjourney 里进行垫图和特定描述词,整个流程不超 10 分钟出图。 变现方式:在抖音、快手、视频号、小红书上批量发布相关视频或图文,将客户引到私域接单变现。但要注意平台引流需隐蔽,避免被检测限流或封号。 2. AI 产业中的应用层 基础设施层:布局投入确定性强,但资金和资源门槛高,普通人若无强资源应谨慎入局,可考虑“合作生态”切入机会。 技术层:技术迭代快,小规模团队或个人需慎重考虑技术迭代风险,基础通用大模型不建议普通个体和小团队考虑。 应用层:是时代赋予的广阔蓝海,当前针对行业/细分领域的成熟应用产品不多,对于普通个体和小团队有超级机会和巨大发展空间。
2025-03-04
怎么利用大模型训练自己的机器人
利用大模型训练自己的机器人可以参考以下内容: OpenAI 通用人工智能(AGI)的计划显示,在互联网上所有的图像和视频数据上训练一个与人类大脑大小相当的 AI 模型,将足以处理复杂的机器人学任务。常识推理隐藏在视频和文本数据中,专注于文本的 GPT4 在常识推理上表现出色。Google 最近的例子展示了机器人学能力可从大型视觉/语言模型中学习,在语言和视觉训练基础上,只需最少的机器人学数据,视觉和文本任务的知识就能转移到机器人学任务上。特斯拉训练的“Optimus”通过人类示范学习抓取物体,若人类示范是先进机器人学性能所需的一切,在互联网上所有视频上训练的大模型肯定能实现惊人的机器人学性能。 梦飞提供了在自己的电脑上部署 COW 微信机器人项目的教程,程序在本地运行,若关掉窗口进程结束,想持续使用需保持窗口打开和运行。以 Windows10 系统为例,注册大模型可参考百炼首页:https://bailian.console.aliyun.com/ ,需更改"model"和添加"dashscope_api_key",获取 key 可参考视频教程。 张梦飞提供了从 LLM 大语言模型、知识库到微信机器人的全本地部署教程,部署大语言模型包括下载并安装 Ollama,根据电脑系统下载:https://ollama.com/download ,安装完成后将下方地址复制进浏览器中确认安装完成:http://127.0.0.1:11434/ 。下载 qwen2:0.5b 模型,Windows 电脑按 win+R 输入 cmd 回车,Mac 电脑通过 Command(⌘)+Space 键打开 Spotlight 搜索输入“Terminal”或“终端”,复制命令行粘贴回车等待下载完成。
2025-03-03
如何利用AI技术挣钱
利用 AI 技术挣钱的方式主要有以下几种: 1. 从 GPTs/GLMs 角度: 作为 AI 产品经理,以最俗气的“钱”的角度复盘 2023 年的所见所闻所感来探讨 AI 赚钱(应用落地)这件事。 参考 BeBeGPTs 收录的 GPTs 数据,但要注意数据可能存在少量错误和不完整。 2. 写作方面: 项目启动:确定目标客户群体,如大学生、职场人士、自媒体从业者等,并选择合适的 AI 写作工具。 准备阶段:学习并实践 AI 写作技术,构建团队。 商业模式构建:确定服务内容,如提供论文、报告、文案等直接写作服务,制定质量控制标准。 运营与推广:在淘宝等电商平台开设店铺,建立写作培训社群,通过社交媒体和线下活动进行品牌和社群建设,与其他团队合作。 项目优化与发展:持续关注 AI 技术进展,根据市场需求拓展新服务和产品,收集客户反馈优化服务。 3. 韦恩的“AI 应用”进阶: 变现方式:在公司给自己贴 AI 大神标签,在社交网络进行分享扩大影响力,承接项目开发。 二创方向:增加画板节点,结合公司 Logo 生成一系列公司主题的产品邮票,承接类似需求扩充工作流,修改提示词调整生图内容方向。 总之,技术很关键,创意更重要,好技术加上好创意才能成就好产品,祝您在 AI 应用之路越走越远,增加自己的收入。
2025-03-03
利用AI打造个人知识库
利用 AI 打造个人知识库可以通过以下方式实现: 1. 使用 GPT 打造个人知识库: 将大文本拆分成若干小文本块(chunk),通过 embeddings API 将小文本块转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块作为问答的知识库。 当用户提出问题时,将问题转换成向量,与向量储存库中的向量比对,提取距离最小的几个向量对应的文本块,与问题组合成新的 prompt 发送给 GPT API。 例如对于“此文作者是谁?”的问题,可直观或通过比较 embeddings 向量得出关联度最高的文本块,如“本文作者:越山。xxxx。”“《反脆弱》作者塔勒布xxxx。”,最后发送给 GPT API 的问题类似于“此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。” 2. 搭建基于 GPT API 的定制化知识库: 涉及给 GPT 输入定制化知识,但 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。 Embeddings 是浮点数字的向量,两个向量之间的距离衡量关联性,小距离表示高关联度,大距离表示低关联度。 向量是用一串数字表示的量,在计算机科学中常用列表表示,向量间距离有多种计算方式,如欧几里得距离。 3. 小七姐提出的 AI 时代知识管理体系构建: 包括读书时看到有触动的文本作为书摘。 对书摘整理归纳、标记重点、打赏标签放入笔记系统,准备深度思考和实践。 基于笔记提到的 AI 对人的赋能模式展开深度实践,如通过 AI 信息杠杆迅速掌握相关知识。 基于实践生成自己的观点和决策,并打造成体系化的内容产品实现价值。 最终把碎片化知识在知识库中流转,从书摘变成体系化内容,把“别人说的话”变成“自己的智慧”。 希望以上内容能帮助您打造个人知识库。
2025-03-01
我想利用ai写一篇本科毕业论文,我该怎样使用?或者说有什么对ai的指令吗?
利用 AI 写本科毕业论文时,以下是一些相关的信息和示例供您参考: 有示例表明,如果向 LLM 提供关于个人背景的信息和指令,比如“根据以下关于我的信息,写一篇四段的大学申请论文:我来自西班牙巴塞罗那。尽管我的童年经历了一些创伤性事件,比如我 6 岁时父亲去世,但我仍然认为我有一个相当快乐的童年。在我的童年时期,我经常换学校,从公立学校到非常宗教的私立学校。我做过的最‘异国情调’的事情之一是在爱达荷州的双子瀑布与我的大家庭一起度过六年级。我很早就开始工作了。我的第一份工作是 13 岁时的英语老师。在那之后,以及在我的学习过程中,我做过老师、服务员,甚至建筑工人。”,LLM 可以为您生成论文。但需要注意的是,这并非提倡这种方式是道德的使用方式。 在教育领域也有相关例子,比如一位历史老师让 GPT 参与教学。通过不同的提示方式,GPT4 能产生差异较大的结果。例如,让 ChatGPT 扮演“一个经过训练、熟悉获奖研究生和本科生论文的高级语言模型”,并要求其从自我反思和大纲开始,生成的内容质量会更好。但随着学生在优化提示方面变得更擅长,在家完成写作作业时作弊会变得更容易。不过,让 LLM 进行角色扮演也使其成为有趣的教育工具,特别是作为历史模拟器。 需要强调的是,使用 AI 辅助撰写论文时,不能完全依赖其生成的内容,应遵守学术道德和规范,确保论文的原创性和学术诚信。
2025-02-28
利用大模型构建系统的工具
以下是关于利用大模型构建系统的工具的相关内容: 大模型的发展历程: 2017 年发布的 Attention Is All You Need 论文是起源。 2018 年,Google 提出 BERT,其创新性地采用双向预训练并行获取上下文语义信息和掩码语言建模,开创了预训练语言表示范式,参数规模为 110M 到 340M。 2018 年,OpenAI 提出 GPT,开创了仅使用自回归语言建模作为预训练目标而无需额外监督信号,展示了强大的语言生成能力,参数规模达 1750 亿。 2021 年,Meta 提出 Large LAnguage Model Approach(LLAMA),这是首个开源模型,为构建更大规模、更通用的语言模型提供了系统化的方法与工具,参数规模为十亿到千亿。 Inhai:Agentic Workflow:AI 重塑了我的工作流: 以 Kimi Chat 为例,它利用「网页搜索」工具在互联网上检索相关内容,并基于检索结果进行总结分析,给出结论。同时,PPT 中介绍了众多不同领域类型的工具,为大模型在获取、处理、呈现信息上做额外补充。 Planning:Agent 通过自行规划任务执行的工作流路径,面向简单或线性流程的运行。例如,先识别男孩姿势,再使用相关模型合成女孩图像,接着使用图像理解文本模型,最后语音合成输出。 Multiagent Collaboration:吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色相互协作,共同开发应用或复杂程序。 AI Agent 基本框架:OpenAI 的研究主管 Lilian Weng 提出“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型 LLM 扮演 Agent 的“大脑”。规划包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标处理复杂的任务,反思和改进指对过去行动进行自我批评和自我反思,从错误中学习并改进未来步骤,提高最终结果质量。记忆用于存储信息。 开发:LangChain 应用开发指南 大模型的知识外挂 RAG: LangChain 是专注于大模型应用开发的平台,提供一系列组件和工具构建 RAG 应用: 数据加载器:从数据源加载数据并转换为文档对象,包含 page_content 和 metadata 属性。 文本分割器:将文档对象分割成多个较小的文档对象,方便后续检索和生成。 文本嵌入器:将文本转换为嵌入,用于衡量文本相似度实现检索。 向量存储器:存储和查询嵌入,通常使用索引技术加速检索。 检索器:根据文本查询返回相关文档对象,常见实现是向量存储器检索器。 聊天模型:基于大模型生成输出消息。 使用 LangChain 构建 RAG 应用的一般流程如下:(具体流程未给出)
2025-02-28