Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

在短视频制作领域,有哪些AI软件可供使用?可以提供哪些帮助?有没有很好的案例参考?

Answer

在短视频制作领域,以下是一些可供使用的 AI 软件及其所能提供的帮助和相关案例参考:

  1. ChatGPT + 剪映:ChatGPT 可生成视频脚本,剪映能依据脚本自动分析所需场景、角色、镜头等要素并生成素材和文本框架,实现从文字到画面的快速转化,节省时间和精力。
  2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。
  3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述即可生成相应内容。
  4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划视频内容。
  5. Runway:AI 视频创作工具,能将文本转化为风格化的视频内容,适用于多种场景,但存在爱变色、光影不稳定的问题。
  6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,可根据文本脚本生成视频。

案例参考:在制作 AI 短片时,会根据不同工具对画面的处理能力进行组合使用。例如,Pixverse 擅长物体滑行运动,有手部特殊运动的画面会用 Runway 来辅助完成,需要人物表情自然的画面会用 Pika 来生成。在声音方面,使用 11labs 进行对白制作,但存在 AI 声音没有情绪和情感的问题。在剪辑方面,先进行粗剪确定画面逻辑,再进行定剪调整和替换画面素材。音效和音乐方面,剪映中有简单音效库,复杂音效可能需另外制作,商用音乐要注意版权。特效方面,剪映可添加一些光影效果。包装方面,剪映智能匹配字幕较为方便。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:根据视频脚本生成短视频的工具

根据视频脚本生成短视频的AI工具有多种,它们能够帮助用户将文字脚本转化为具有视觉吸引力的视频内容。以下是一些工具:1.[ChatGPT](https://chat.openai.com/)+[剪映](https://www.capcut.cn/):ChatGPT可以生成视频小说脚本,而剪映则可以根据这些脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。这种方法可以快速实现从文字到画面的转化,节省大量时间和精力。2.[PixVerse AI](https://pixverse.ai/):在线AI视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。3.[Pictory](https://pictory.ai/):这是一个AI视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户可以提供文本描述,Pictory将帮助生成相应的视频内容。4.[VEED.IO](https://www.veed.io/):提供了AI图像生成器和AI脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。5.[Runway](https://runwayml.com/)[](https://runwayml.com/):这是一个AI视频创作工具,它能够将文本转化为风格化的视频内容,适用于多种应用场景。6.[艺映AI](https://www.artink.art/):专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。内容由AI大模型生成,请仔细甄别。

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

Runway在真实影像方面质感是最好的,战争片全景的镜头处理得最好,以及Runway的控件确实目前体验感也比较好,但Runway就是特别爱变色,光影非常不稳定;SVD整体真的略拉垮……唯一能打的就是在风景片的测试,那条测试他是跑得最好的,其他方面就真的还很一般……我在做视频的时候,其实是会根据不同工具对画面的处理能力进行组合使用。举个栗子:Pixverse擅长物体滑行运动,我们就会用Pixverse生成,但这个视频里前面有一部分的飞机变形了,我们就会把Pixverse里生成的视频再放到Pika里面去局部重绘。有手部特殊运动的画面,我们就会用Runway来辅助完成。需要人物表情比较自然的画面我们就会用Pika来生成。总之就是,办法总比困难多,想尽一切招数,解决问题。这里本来可以对应介绍一些视听语言的书,但篇幅实在太长了目前,下次再推荐!第四步,AI声音这次我们尝试使用了一些简短对话的制作。通常在传统影视制作流程里,声音部分的制作会分为现场录音、后期配音、音效音乐制作等多个部分。这里用AI声音来制作对话相当于是后期配音的部分。我们会把中文台词谷歌翻译成英文,但我英语比较拉垮,所以找了非常专业的Azura Ge葛女士进行英文字幕校对与台词润色,形成配音稿。接着使用AI声音软件11labs(官网:https://elevenlabs.io/)进行对白制作,11labs的英文效果比较好,但我们仍然非常头疼地遇到了AI声音没有情绪和情感的问题。

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

声音的运用在影像制作中是非常重要的部分,好的声音制作可以为影片增加非常多的优势。视频粗剪:剪辑比较高效的方式,可以先确定好画面逻辑,声音有部分参考,但最好等画面确定了再去制作和精调。粗剪的画面不需要非常精美,而是先让你快速对片子的全貌有一个整体的把握,把素材先放上去,再去看哪个部分需要细节调整和画面替换。视频定剪:将画面素材调整和替换到满意的效果为止。粗剪和定剪部分涉及到的视听语言内容太多了,篇幅限制,有机会再单独写。音效/音乐:以剪映为例,剪映中有简单的音效库,制作简单的短片可用,但涉及到更为复杂和真实的音效,可能还是需要另外制作。音乐的使用如果涉及到商用,请注意购买版权或使用无版权音乐。特效:以剪映为例,我不会加太多特效,但有些光的效果我会加,因为AI视频生成经常会吃掉一些光影,为了让效果更好,会使用一些光影效果。包装(如字幕):字幕最后上,剪映比较方便的一点就是可以智能匹配字幕再修改。传统字幕制作要用PS做完再去PR里面对时间线,确实挺痛苦的……一些剪辑相关的书推荐给大家:万万没想到,文章写着写着就这么长了,最开心的还是终于把和阿叔有关的故事视听化了。内容有点多,讲了一个故事,写了一个流程,做了一个测评,过分杂糅的一篇文章,希望你喜欢~如果觉得还不错的话,点赞转发在看一键三连,阿里嘎多!视频制作:尾鳍Vicky&Zoik英文字幕校对:Azura Ge海报:Zoik撰文:尾鳍Vicky

Others are asking
有哪些A股AI交易助手可供使用?
以下是一些与交易相关的 AI 工具: 1. Salesforce 爱因斯坦:来自 Salesforce 的 AI 工具,能通过分析大量数据集识别潜在客户,生成预测性潜在客户评分,还具有自动化功能,可执行日常或耗时任务,让销售团队专注关键方面。 2. Clari:专门从事智能收入运营的软件,以创建高度准确的收入预测能力闻名,能统一数据并以易理解方式呈现,简化财务预测过程。 3. Hightime:销售团队的 AI 助手,可处理重复性任务和耗时研究。 4. MeetRecord:专注于销售通话记录和辅导的软件公司,利用人工智能技术为高绩效销售团队提供强大的对话智能解决方案。其核心功能包括 AI 驱动的笔记记录、个性化辅导计划、交易智能和推荐、CRM 自动化、多语言支持等。适用于需要高效管理和分析会议内容的企业,在 2024 年 6 月完成了 PreA 轮融资。体验链接:https://www.meetrecord.com 。 此外,还有将交易与 AIGC 相结合,打造私人高级交易顾问的摊位,如“AI+交易:来定制专属于你的私人高级交易顾问吧!”但目前关于 A 股的特定 AI 交易助手,上述信息未明确提及。
2024-12-17
小白如何用ai开始学习图片设计
对于小白如何用 AI 开始学习图片设计,以下是一些建议: 1. 图像流搭建 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。为 bot 加入图像流时,要设定图像流名称以及描述(名称只能是英文)。 了解图像流节点的意义:图像流编辑界面左侧的工具栏集合了所有可能用到的功能,大致可分为智能处理工具(如“智能生成”“智能抠图”“画质提升”等)、基础编辑工具(如画板、裁剪、调整、添加文字等)和风格处理类工具(如风格迁移、背景替换等)。从基础编辑工具开始尝试,熟悉后再探索其他功能。右侧类似画布,可拖拽左侧工具或点击“+”拖放各种工具模块,工具之间可连接形成工作流程。 根据需求进行图像流设计:例如生成海报功能,在总结故事后,将完整的故事作为输入,对输入的故事进行一轮提示词优化,从自然语言转变为更符合文生图大模型的提示词,将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报。 测试图像流。 2. 利用即梦 AI 生成海报 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。 实操教程: 打开即梦 AI:https://jimeng.jianying.com/aitool/home 。 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 3. 进阶技巧和关键词 图片内容一般分为二维插画以及三维立体两种主要表现形式。 主题描述:可以描述场景、故事、元素、物体或人物细节、搭配等。描述场景中的人物时,最好独立描述,不要用一长串文字,否则 AI 可能识别不到。 设计风格:可找风格类关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。对于某些材质的描述,关键词的运用有很多门道,需要针对某一种风格单独进行“咒语测试”。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
文生营销图AI
以下是关于文生营销图 AI 的相关教程: Liblibai 简易上手教程: 1. 定主题:确定您需要生成的图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 7. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 10. 尺寸:根据喜好和需求选择。 11. 生成批次:默认 1 批。 Tusiart 简易上手教程: 1. 定主题:确定图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:用于控制图片中特定的图像,如人物姿态等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 那一串。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 8. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 11. 尺寸:根据喜好和需求选择。 关于【SD】文生图提示词: 1. 避免使用太大的数值,如 1920x1080,可能导致奇怪构图,可使用高清修复放大图像倍率,记住高宽比主要控制画面比例。 2. 调整好参数后生成图片,若质感不足,可添加标准化提示词,如:,绘图,画笔等,让画面更趋近于固定标准。
2025-02-26
AI LOGO工具
以下是一些生成 Logo 的 AI 产品: 1. Looka:这是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器利用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户能拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 这些 AI 产品让无设计背景的用户也能轻松创建专业 Logo。使用时,用户可根据品牌理念和视觉偏好,通过简单交互获得系列方案,并进一步定制优化至满意。 此外,您还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。 在第六期“一起做个 LOGO 吧”活动中,活动时间为 2024 年 6 月 9 日至 2024 年 6 月 16 日。活动目标包括探索制作 LOGO 方法、创造独特生成技巧、制作代表学习成果的作品。参与方式为使用 SD 等 AI 工具出图并将作品发送至 SD 学社微信群。会创建在线文档收集作品,6 月 16 日举行群内投票选出前三名,注意事项包括确保设计原创、允许作品公开展示以及在截止日期前提交。 在 AI 制作游戏 PV《追光者》中,故事背景创作阶段结合 chatGPT 发散制作游戏世界观,引导 ChatGPT 用分镜形式描述,使用 new bing 共创细致的故事分镜。生图阶段利用 ChatGPt 制作 midjourney 提示词工具,进入 midjourney 绘图包括制作 logo。还统一了 MJ 风格描述词,建立 AI 描述词模板,运用 midjourney 尝试制作不同风格 logo,最后用 PS 合成。
2025-02-26
我想知道ai学习路径
以下是为您提供的 AI 学习路径: 一、了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,涵盖图像、音乐、视频等。您可以根据自身兴趣选择特定模块深入学习,比如掌握提示词的技巧,这上手容易且实用。 四、实践和尝试 理论学习后,实践是巩固知识的关键。您可以尝试使用各种产品进行创作,知识库中也有很多实践后的作品和文章分享,欢迎您在实践后进行分享。 五、体验 AI 产品 与现有的 AI 产品互动,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验。 六、技术研究方向 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 七、应用方向 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 希望以上内容对您有所帮助。
2025-02-26
AI 自动化和工作流编排有什么好的工具和方案
以下是一些关于 AI 自动化和工作流编排的工具和方案: 1. RPA 软件:很早就出现在工作流编排领域,目标是使基于桌面的业务流程和工作流程实现自动化,现在越来越多的 RPA 软件带上了 LLM。 2. ComfyUI:将开源绘画模型 Stable Diffusion 进行工作流化操作模式,用户在流程编辑器中配置 pipeline,通过不同节点和连线完成模型操作和图片生成,其 DSL 配置文件支持导出导入,提高了流程的可复用性,降低了时间成本。 3. Dify.AI:工作流设计语言与 ComfyUI 有相似之处,定义了一套标准化的 DSL 语言,方便使用导入导出功能进行工作流复用。 4. Large Action Model:采用“通过演示进行模仿”的技术,检查人们与界面的互动并模仿操作,从用户提供的示例中学习。 5. Auto GPT/Agent/Baby AGI:基于 GPT4 语言模型的开源应用程序,用户输入目标后可自主执行任务、递归地开发和调试代码。能用于自动化任务、创建自主的 AI 代理、完成各种任务等,访问地址为: 。 此外,在工作流编排中还涉及到一些概念和技术: 1. 短期记忆和长期记忆:短期记忆将所有的上下文学习看成是利用模型的短期记忆来学习;长期记忆通过外部的向量存储和快速检索来存储和召回信息。 2. 工具:学会调用外部不同类型 API 来获取模型缺少的额外信息、代码执行能力、访问专有信息源等。 3. 动作:大模型结合问句、上下文的规划、各类工具,最终决策出需要执行的动作。 4. Agentic Workflow 可以从提升效率、提高质量、节省时间的角度思考,通过将复杂任务分解成较小步骤,融入更多人类参与到流程中的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 但需要注意的是,Agentic Workflow 虽然美好,但使用的用户目前较少,可能是出现周期、工作流使用的上手难度等因素导致,并且在复杂流程上的开发并不是那么稳定可靠。
2025-02-26
视频拍摄中如何用更准确的提示词
在视频拍摄中,以下是一些更准确的提示词使用技巧: 1. 清晰定义动作:如果想让视频中包含角色的动作,用具体的动词和副词来描述,如奔跑、飞翔、游泳或跳舞,并包含动作的速度,如缓慢、快速或逐渐。示例提示词:“一只狗欢快地在海滩上冲刺,跃起接住空中的球。” 2. 使用描述性形容词:准确传达视频的氛围至关重要,使用能唤起想要传达的感觉的形容词,如宁静、神秘或充满活力。示例提示词:“海滩上一个宁静、雾蒙蒙的早晨,柔和的阳光透过沙滩椅洒下。” 3. 提供背景故事或上下文:对于更复杂的视频项目,融入特定的情节元素或角色,提供背景或上下文有助于生成连贯且引人入胜的视频序列。 4. 使用相机角度和运动:Firefly 通常可以模拟真实世界的摄像工作,通过指定希望相机采用的角度或运动,如推镜头、拉镜头、平移、倾斜、固定镜头,为视频增添个性化的触感。 不同的视频模型和工具在提示词方面也有各自的特点: 1. Vidu 模型:其 Prompt 基本构成包括主体/场景、场景描述、环境描述、艺术风格/媒介。要调整句式和语序,避免主体物过多/复杂、主体物分散的句式描述,避免模糊的术语表达,使用更加流畅准确的口语化措辞,丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。 2. 星流一站式 AI 设计工具:在其 prompt 输入框中可以输入提示词、使用图生图功能辅助创作。提示词用于描绘想要的画面,输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言,基础模型 1.5 使用单个词组,支持中英文输入。写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。还可以调整负面提示词,利用“加权重”功能让 AI 明白重点内容,使用辅助功能如翻译、删除所有提示词、会员加速等。
2025-02-26
有没有制作机器人的详细视频?
以下为您提供一些制作机器人相关的视频资源: Adobe MAX 2024 全球创意大会:一个可爱的机器人举着一颗红色发光心形,电影般逼真的详细镜头。灯光绚丽,阳光明媚,机器人脸上有斑驳的灯光,背光强烈。逼真的细节和纹理。色彩等级梦幻、阳光、温暖的色调。浅景深。胶片颗粒。用 35 毫米胶片拍摄。阳光透过窗户轻轻地照进来,营造出一种微妙而空灵的氛围。前景中失焦的绿色植物。慢动作,轻柔的动作。相机静止且锁定。 扣子案例合集 社区内容分享: 【Agent 共学第二期】制作一个新闻鉴别相关的 bot:https://www.bilibili.com/video/BV1QJ4m1M7ti/ 用 Coze 搭建智能机器人并挖掘销售线索:https://wap.peopleapp.com/video/rmh41227880/rmh41227880 coze 实战系列(一)| 天天小管家:https://www.bilibili.com/video/BV1nRMQexER7/ 毕业加速器:如何用 AI 爆肝论文?:https://www.bilibili.com/video/BV12z421m7YV 不写代码,如何用 Coze 做专属的对话机器人:https://www.bilibili.com/video/av1603694358 用 coze 一键生成朋友圈文案:https://www.xiaohongshu.com/explore/65c1d0ae000000001100d442 COZE:中小企业均可 0 门槛创建业务 agent,支持接入微信公众号、微信客服、discord、tele 等各种终端,实现公司 AI 客服、销售机器人等触达客户:https://www.bilibili.com/video/BV1DA4m1w72p/ 【Agent 共学第二期】许键分享|拆解“离谱村捏剧本”coze bot 思路:https://www.bilibili.com/video/BV1Cx4y1n7yU/ 【Agent 共学第二期】银海分享|用 AI 重塑我的工作流:https://www.bilibili.com/video/BV1sr421L7Hj/ 【Agent 共学第二期】大家一起捏 Bot,Coze 作品分享会:https://www.bilibili.com/video/BV1hT421v7YD/ 工具教程:morphstudio Morphstudio 官方 discord 使用教程 MorphVideo 机器人的使用: 文生视频:提示词指令:/video。举例:/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒 Morph 机器人的使用: 图生视频:提示词指令:/animate 参数说明: ar(只针对 MorphVideo 机器人):这个参数用来设置视频的画面比例(比如 16:9,4:3,1:1,3:4,9:16)。 motion:这个参数用来调整视频中的运动强度。数值越低,运动越微妙,数值越高,运动越夸张。 camera:这个参数用来控制摄像头移动。Zoom:镜头拉近/拉远;Pan:摄像机向上/向下/向左/向右移动;Rotate:相机顺时针旋转或逆时针旋转;Static:相机静态。 fps:视频的帧率是指每秒钟播放的图片帧数。默认的帧率是每秒 24 帧。 s(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 提示:使用更加详细和描述性的提示可能会导致您生成的视频效果更好。可以试着调整不同的设置来达到想要的效果!
2025-02-26
国内的AI做视频工具
以下是一些国内的 AI 做视频工具: 1. Hidreamai(国内,有免费额度) 网址:https://hidreamai.com//AiVideo 支持文生视频、图生视频。 提示词使用中文、英文都可以。 文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,有时空理解。 3. Dreamina(国内内测,有免费额度) 网址:https://jimeng.jianying.com/aitool/video/generate 支持文生视频、图生视频,视频生视频。 支持图生视频首尾帧功能。 提示词使用中文、英文都可以。 文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸。 图生视频、视频生视频除尺寸不可选外,其他与文生视频基本相同。默认生成 3s 的视频。 4. 可灵(免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除不可运镜控制外,其他与文生视频基本相同。默认生成 5s 的视频。 此外,在视频制作方面,国内还可以使用出门问问的魔音工坊来调节声音情绪。在剪辑方面,对于 1 3 分钟的短片,剪映比较方便,因其有人性化设计及简单的音效库/小特效;但对于更长篇幅或追求更好效果的视频,可能需要使用 PR/FCP/达芬奇等传统剪辑软件。剪辑流程通常为:视频粗剪 视频定剪 音效/音乐 特效 包装(如字幕)。
2025-02-26
免费的图生视频软件
以下为一些免费的图生视频软件: Runway:可将图片拖进去生成 4 秒视频,但它是收费的,您也可以在闲鱼或淘宝找号。进入官网首页点击“start with image”,直接拖图片进来,动画幅度用 3,5 有时会乱跑,无需等进度条转完可继续放图。 Haiper:有免费额度,网址为 https://haiper.ai/ 。能生成文生视频、图生视频、素描生视频、扩展视频,还能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值,图生视频只能写提示词、秒数(2s 和 4s)、种子值。 DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,可生成 2 秒图生视频,还能做短视频拼长视频。 此外,还有一些相关模型的特点供您参考: |排序(从高到低)|模型|特点(优缺)| |||| |1|pd 2.0 pro|生成的画面有点颗粒感,p2.0 模型很能打,适合做一些二次元动漫特效,理解能力更强,更适合连续运镜| |2|luma 1.6|画面质量挺好,但太贵| |3|可灵 1.6 高品质|YYDS!| |4|海螺01live|文生视频比图生视频更有创意,图生也还可以,但大幅度动作下手部会出现模糊的情况,整体素质不错,就是太贵| |5|runway|画面质量不算差,适合做一些超现实主义的特效、经特殊就容镜头| |6|智谱 2.0|做的一些画面特效挺出圈,适合整过,但是整体镜头素质还差点,好处就是便宜,量大,管饱,还能给视频加音效| |7|vidu1.5|二维平面动画的快乐老家,适合做特效类镜头,单镜头很惊艳,大范围运镜首尾帧 yyds! 就是太贵| |8|seaweed 2.0 pro|适合动态相对小的,更适合环绕旋转运镜动作小的| |9|pixverse v3 高品质|首尾帧能打,就是画面美学风格还有待提升| |10|sora|不好用,文生视频挺强,但图生视频抽象镜头太多,半成品都算不上,不建议使用|
2025-02-26
什么工具可以帮忙总结课程视频的知识点
以下是一些可以帮忙总结课程视频知识点的工具: 1. 剪映:只需提供文案,能够自动配图配音,帮助优化线上课程,为微课总结内容和知识点。 2. BibiGPT:支持小红书、B 站等网站视频的归纳总结,还可以提问互动,答案会附上对应的视频节点,是融合课程备课的好助手,网址为 https://bibigpt.co/ 。 3. 飞书妙记:可以先从视频网站上提取出视频的音频部分,利用其免费语音转文字功能将音频转换成文本,下载文本后上传至其他工具进行总结。 此外,可汗学院出品的 AI Tutor Khanmigo 也具有一定的辅助作用,它可以为学生总结视频内容,并以苏格拉底式教学法引导学生思考和学习。
2025-02-26
怎么用comfyUI中的视频IC-light
使用 ComfyUI 中的视频 IClight 的步骤如下: 1. 在管理器中的节点管理中搜索 ComfyUIICLight 进行安装,安装后重启 ComfyUI。 2. 模型可以在网盘里下载,然后放入 ComfyUI/models/unet 文件夹。 3. IC Light 用于处理原视频和新背景之间的光影效果。 4. 辅助工具 ICLight 的打光方式有两种: 文本方式:上传 1 张前景图片,自动抠图,填写详细文本提示词,并在几种给定的光源方向选择。 背景+前景方式:上传 1 张背景图+1 张前景图,自动融合,填写简单文本提示词,并在几种给定的光源方向选择。 需要注意的是,IC Light 处理过的图片可能会颜色发黄偏色,不是处理过的就是好的,有时可能会负优化。另外,在进行背景替换时,不同图片合并要考虑光线、色调、边缘细节等问题。
2025-02-26
model endpoint ID是什么东西?请用文字、数据、案例、比喻等形式进行教学
很抱歉,目前没有关于“model endpoint ID”的相关内容。但一般来说,“model endpoint ID”可以理解为模型服务端点的标识符。 打个比方,就像每个房间都有一个独特的门牌号,“model endpoint ID”就是模型服务这个“房间”的门牌号,通过它可以准确地找到和调用特定的模型服务。 在实际的数据处理中,它可能类似于一个唯一的编码,比如“MEID12345”,用于区分不同的模型服务端点,以便系统能够准确地将请求路由到对应的模型服务进行处理。 希望这样的解释能对您有所帮助,如果您还有其他疑问,请随时向我提问。
2025-02-26
TPM 限制是什么意思?请用文字、数据、案例、比喻等形式进行教学
TPM 限制指的是每分钟处理的事务数(Transactions Per Minute)的限制。 以字节火山引擎为例,它默认提供了高达 500 万 TPM 的初始限流。这对于像一次工作流测试就消耗 3000 多万 tokens 的用户来说,限流的设置具有重要意义。 打个比喻,TPM 限制就好像是一条道路上设置的通行车辆数量限制,如果超过这个限制,就可能导致交通拥堵或者无法正常通行。在 AI 领域,超过 TPM 限制可能会影响服务的性能和稳定性。 比如,当有大量的请求同时发送到系统,如果没有 TPM 限制,可能会导致系统响应变慢甚至崩溃;而有了合理的 TPM 限制,就能保证系统有序地处理请求,为用户提供稳定可靠的服务。
2025-02-26
deepseek 落地案例
以下是关于 DeepSeek 的落地案例: 1. 华尔街分析师认为 DeepSeek 以小成本实现媲美领先 AI 产品的性能,并在全球主要市场 App Store 登顶。高盛认为其或改变科技格局,降低 AI 行业的进入门槛。详情:https://www.xiaohu.ai/c/xiaohuai/deepseek 2. DeepSeek 在中文场景表现优秀,日常写作和表达习惯贴近人类,但专业论文总结略弱。数学能力不错,编程能力逊于 GPT。采用 GRPO 算法替代传统 PPO,提升语言评价灵活性与训练速度。更多信息:https://x.com/imxiaohu/status/1883843200756170873 ,GRPO 详情:https://www.xiaohu.ai/c/ai/grpodeepseekr18c6cff0cdeb84937a4197066af987e43 3. 举办了全国 23 城近 4000 人玩转 DeepSeek 的活动,如郑州场展示搭建的无敌工作流,深圳场分享 DeepSeek+出海的落地方案,北京场玩起 AR+机械汪,广州场探讨如何使用 DeepSeek 辅助速通吃“霸王餐”,福州场有最年轻的分享者展示玩转 DS 的示例。同时,活动展示了飞书多维表格和 DeepSeek 的结合的强大之处,且 DeepSeek R1 大模型全面融入飞书多维表格、飞书智能伙伴创建平台等多款产品。详情:https://waytoagi.feishu.cn/wiki/KRtwwVqKKiB7PKkgzu3chsX6nzF 4. 在芯片行业,如存储芯片负责人考虑与 DeepSeek 谈 HBM4 定制合作,台积电研发中心因对方技术调整产能,ASML 总部针对对方算法调整策略,中芯国际因 DeepSeek 证明的技术提高产线利用率并获得追加投资。
2025-02-24
AI案例
以下是一些 AI 在不同领域的应用案例: 活动策划方面: 1. 活动主题及内容生成:根据活动目标、参与者背景等信息,AI 可以生成合适的活动主题和内容框架建议,例如通过对话生成模型提出活动主题和议程草案。 2. 邀请函和宣传文案生成:AI 可以基于活动信息生成吸引人的邀请函和宣传文案,增强宣传效果。例如微软在 Build 大会上,使用 AI 生成了 8000 多份个性化的邀请函。 3. 现场活动管理:利用计算机视觉、语音识别等,AI 可以辅助管理活动现场的人流、秩序等。例如基于人群密度的通道引导、实时翻译等。 4. 虚拟助手:AI 对话系统可以作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务。例如,Replika 提供了智能的虚拟活动助手应用。 5. 活动反馈分析:AI 可以自动分析活动反馈(文字、语音等),总结关键观点和改进建议。例如飞书和钉钉的会议总结功能。 6. 活动营销优化:基于参与者行为数据,AI 可以优化营销策略,实现个性化营销。例如,针对目标受众的定向广告投放等。 其他领域: 1. 客户服务聊天机器人中的自然语言处理:具有适应性,能根据大量数据集训练对实时客户消息做出响应,并可能随着系统学习而增加个性化;具有自主性,基于客户文本输入生成类似人类的输出,回答查询、帮助客户查找产品和服务或发送有针对性的更新,操作时几乎不需要人工监督或干预。但可能存在无意包含不准确或误导信息等监管问题。 2. 医疗保健分诊系统的自动化:具有适应性,能根据医疗数据集、患者记录和实时健康数据分析预测患者病情;具有自主性,为医疗专业人员或直接为患者生成有关患者症状可能原因的信息,并推荐潜在的干预措施和治疗方法。 扣子案例: 1. 2. 3. 4. 5. 6. 7. 8. 9.
2025-02-22
如何权构建个人AI知识库,请提供详尽的方案,并提供相关工具应用案例。
以下是构建个人 AI 知识库的详尽方案及相关工具应用案例: 方案: 1. 知识收集:学习如何有效地收集、整理和检索信息,例如分新闻、观点、访谈、论文翻译来进行提炼。 2. 知识管理:通过实际操作,体验工具在知识管理方面的应用。 3. 数据处理:使用工具对数据进行转换、提取和呈现,如从图像和图形中提取数据。 4. 内容总结:总结视频内容、翻译和改换风格等。 工具应用案例: 1. 知识收集与整理: 通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 本机跑大语言模型工具:https://ollama.com 选词翻译、解读、拓展:https://snapbox.app 与各种 AI 机器人聊天:https://opencat.app 、https://chathub.gg/ 、https://www.elmo.chat/ 定义提示语,根据不同类型提取有用信息:https://memo.ac/zh/ 2. 数据获取与处理: 下载视频:Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 开源免费屏幕录制工具 OBS:https://obsproject.com/ 用 losslessCut 快速切块 3. 构建知识库: 将文本转换成向量(如使用 embeddings API),先把大文本拆分成若干小文本块(chunk),将小文本块转换成 embeddings 向量并在向量储存库中保存,当用户提问时,通过比对向量提取关联度最高的文本块与问题组合成新的 prompt 发送给 GPT API。 例如对于一篇包含多个文本块的文章,如“文本块 1:本文作者:越山。xxxx。”“文本块 2:公众号越山集的介绍:传播效率方法,分享 AI 应用,陪伴彼此在成长路上,共同前行。”等,当提问“此文作者是谁?”时,可通过比较 embeddings 向量找出关联度最高的文本块。 4. 工具入门: 提示词:现成好用的 Prompt: AI Agent:Agent 工具 小白的 Coze 之旅: AI Pic:现在主流的 AI 绘图工具网站:
2025-02-22
PATHON+AI 如何应用到实际工作中,你这边有没有实际案例教学
以下是一个关于 Python + AI 在实际工作中的应用案例: 在自动驾驶车辆领域,对于 AI 系统的可解释性需求程度高度取决于具体情境,包括应用的安全关键程度。例如,设计自动驾驶车辆的技术专家需要理解系统的决策能力以进行测试、评估和改进;普通用户可能仅需了解决策过程以安全使用车辆;若车辆发生故障并导致有害结果,监管机构可能需要有关系统如何运作的信息以分配责任。尽管 AI 可解释性仍是技术挑战和活跃的研究领域,但监管机构已在开展相关工作以解决此问题。如 2021 年,ICO 和艾伦图灵研究所共同发布了关于用 AI 解释决策的指导,为组织提供了实用建议,以帮助向受其影响的个人解释由 AI 交付或协助的流程、服务和决策。
2025-02-22