Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何生成稳定的AI视频

Answer

以下是关于生成稳定的 AI 视频的相关信息:

工具推荐

  • Runway:
    • 网址:https://app.runwayml.com/video-tools/
    • 官方使用教程:https://academy.runwayml.com/
    • 知识库详细教程:工具教程:Runway Gen-3
    • 特点:支持文生视频、图生视频、视频生视频;文生视频支持正向提示词、风格选择、运镜控制、运动强度控制、运动笔刷,支持多种尺寸,可设置种子值;生成好的视频可以延长时间,默认生成 4s 的视频;使用英文提示词。
  • Stable video:
    • 网址:https://www.stablevideo.com/generate
    • 知识库详细教程:工具教程:StableVideo
    • 特点:支持文生视频、图生视频,仅英文;图生视频不可写 prompt,提供多种镜头控制;文生视频先生成 4 张图片,选择其中一张图片以后再继续生成视频。

技术差异: 代表产品如 Runway,在端到端视频生成中,涉及的技术包括 GAN 生成对抗网络、VAE 变分自编码器和 Transformer 自注意力机制。

  • GAN 生成对抗网络:是一种无监督的生成模型框架,能生成视觉逼真度高的视频,但控制难度大、时序建模较弱。
  • VAE 变分自编码器:可以学习数据分布,像压缩和解压文件一样重建视频数据,能根据条件输入控制生成过程,但质量较 GAN 略低。
  • GAN、VAE 生成视频速度快,但存在生成质量和分辨率较低、长度短、控制能力弱的缺点。
  • Transformer 自注意力机制:通过学习视频帧之间的关系,理解视频的长期时间变化和动作过程,对长视频建模更好,时序建模能力强,可实现细粒度语义控制,但计算量大。

当前面临的问题及解决方案: 当前仍面临生成时间长、视频质量不稳定、生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案包括使用渐进生成、增强时序一致性的模型等方法,上述的补帧算法、视频完善策略也可在一定程度上缓解问题。

制作技巧: 在镜头衔接上要写运镜提示词,描述多种运镜方式,否则画面会乱变。在做视频时要不断尝试参数。

Content generated by AI large model, please carefully verify (powered by aily)

References

小歪:AI视频工具合集

https://app.runwayml.com/video-tools/官方使用教程:https://academy.runwayml.com/知识库详细教程:[工具教程:Runway Gen-3](https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r)简单介绍:支持文生视频、图生视频,视频生视频使用英文提示词文生视频支持正向提示词、风格选择、运镜控制、运动强度控制、运动笔刷(https://academy.runwayml.com/gen2/gen2-motion-brush-interface),支持16:9、9:16、1:1、4:3、3:4、21:9尺寸,可设置种子值图生视频、视频生视频除了尺寸不可选以外,其他跟文生视频基本相同生成好的视频可以延长时间,默认生成4s的视频相关界面截图:[heading3]Stable video(有免费额度)[content]https://www.stablevideo.com/generate知识库详细教程:[工具教程:StableVideo](https://waytoagi.feishu.cn/wiki/Hf1cwooP5iRH2zkJ6RrcAKLunWb)简单介绍:支持文生视频、图生视频,仅英文图生视频不可写prompt,提供多种镜头控制文生视频先生成4张图片,选择其中一张图片以后再继续生成视频图生视频:文生视频:

AI视频生成(上) | 技术发展概况和应用场景思考

代表产品:RunwayGAN生成对抗网络:是一种无监督的生成模型框架,通过让两个神经网络相互博弈来进行机器学习。可以生成视觉逼真度高的视频,但控制难度大、时序建模较弱。VAE变分自编码器:它是一种可以学习数据分布的网络结构。就像把视频文件压缩成较小的文件再解压一样,它可以重建视频数据。VAE可以根据条件输入控制生成过程,但质量较GAN略低。GAN、VAE生成视频速度快,缺点是生成质量和分辨率较低,长度短,控制能力弱。Transformer自注意力机制:通过学习视频帧之间的关系,理解视频的长期时间变化和动作过程,这种方式对长视频建模更好,时序建模能力强,可实现细粒度语义控制,缺点是计算量大[heading2]1.4 AI视频生成当前面临的问题[content]当前仍面临生成时间长、视频质量不稳定,生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案有:使用渐进生成、增强时序一致性的模型等方法解决。上述的补帧算法、视频完善策略也可在一定程度上缓解问题。[heading2]二.应用场景思考

娜乌斯嘉AIGC商业片制作 2024年11月1日 - 智能纪要

[heading2]智能章节[45:01](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=2701000)AI图像与视频生成中的技巧、问题及成功率本章节主要讲述视频制作相关内容。在镜头衔接上要写运镜提示词,描述多种运镜方式,否则画面会乱变。提到不同软件(如季梦、可林)生成图片或视频的情况,包括成功率、生成时间、面部效果等,还指出要对AI生成不稳定情况脱敏并介绍了一些小技巧。[53:56](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=3236000)娜娜酱谈视频制作中的AI生成、参数调整与画面关系本章节娜娜酱提到当天有多个内容,先将部分任务生成然后合成,在检查镜头是否都运行正常。还讨论了AI视频稳定相关,认为PS一帧一帧改不可行,AE改尚可。在做视频时要不断尝试参数。此外提到当天的第二个内容是deform,还涉及本地跑双月相关话题。[57:32](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=3452000)SD sample diffusion相关,谈defirm及运行SD所需电脑配置本章节主要内容是关于defirm相关。首先询问大家是否有SD sample diffusion基础,然后介绍defirm相关画面类似不断迭代变化的情况。还提到电脑带SD的要求,独立显卡8G以上较好,想做好要花钱。最后强调苹果和a卡跑相关内容存在问题,如速度慢、报错难查等。

Others are asking
ai写毕业论文
使用 AI 写毕业论文需要注意以下几点: 1. 虽然可以向 LLM 寻求写作建议甚至直接要求其帮忙写论文,但这并非道德的使用方式。 2. 论文写作领域中,AI 技术提供了多方面的辅助,包括文献搜索、内容生成、语言润色和数据分析等。常用的工具和平台有: 文献管理和搜索:Zotero 可自动提取文献信息,Semantic Scholar 是 AI 驱动的学术搜索引擎。 内容生成和辅助写作:Grammarly 提供文本校对等,Quillbot 可重写和摘要。 研究和数据分析:Google Colab 支持 AI 和机器学习研究,Knitro 用于数学建模和优化。 论文结构和格式:LaTeX 结合自动化和模板处理格式,Overleaf 是在线 LaTeX 编辑器。 研究伦理和抄袭检测:Turnitin 和 Crossref Similarity Check 检测抄袭。 3. AI 文章排版工具方面,有以下选择: Grammarly 不仅检查语法拼写,还能改进排版风格。 QuillBot 可改进文本清晰度和流畅性。 Latex 常用于学术论文排版,有 AI 辅助的编辑器和插件。 PandaDoc 是文档自动化平台。 Wordtune 是 AI 写作助手。 Overleaf 是在线 Latex 编辑器,适合学术写作。 选择工具时应根据文档类型、出版标准和个人偏好来决定。对于学术论文,Latex 和 Overleaf 受欢迎;一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。但使用时要结合自身写作风格和需求,并仔细甄别内容。
2025-02-26
AI陪伴有什么好的产品
以下是一些 AI 陪伴的好产品: 1. Character.ai:这是一个 AI 虚拟陪伴平台,用户能与数百个 AI 驱动的角色交流,还可创建自己的角色并赋予其各种特性。 2. Replika:一款 AI 虚拟陪伴应用,用户可设计理想伴侣,其会存储记忆并在未来对话中参考,甚至能发送照片。 3. Talkie:主打情感路线的 AI 虚拟陪伴应用,设计有大量 npc,游戏和休闲娱乐体验感强,每个 npc 都有自己的剧情体系,交流中会触发抽取卡牌机会。 AI 陪伴已进入成长爆发期,可能看起来是小众市场,但实际上已成为生成式 AI 主流应用场景之一。网页端和移动端数据表明其正变得越来越普及。例如,在网页端榜单上,Character.ai 领跑 AI 陪伴榜单。 陪伴应用的范畴也在迅速扩大,不仅限于“男友”“女友”概念,还涵盖友谊、指导、娱乐、医疗保健等方面。一些早期研究显示,AI 在诊断准确性和患者沟通技巧上能超越真人医生,如 Replika 聊天机器人帮助部分用户减轻了自杀念头。 移动端和网页端应用在 AI 使用类型上有明显不同。网页端产品更倾向支持内容创作和编辑的复杂工作流程,如 ElevenLabs、Leonardo、Gamma 等。移动端应用更倾向通用型助手,不少模仿了 ChatGPT。
2025-02-26
AI基础
以下是关于 AI 基础的全面介绍: 一、AI 背景知识 1. 基础理论:人工智能、机器学习、深度学习的定义及其之间的关系。 2. 历史发展:简要回顾 AI 的发展历程和重要里程碑。 二、数学基础 1. 统计学基础:熟悉均值、中位数、方差等统计概念。 2. 线性代数:了解向量、矩阵等线性代数基本概念。 3. 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 三、算法和模型 1. 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 2. 无监督学习:熟悉聚类、降维等算法。 3. 强化学习:简介强化学习的基本概念。 四、评估和调优 1. 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 2. 模型调优:学习如何使用网格搜索等技术优化模型参数。 五、神经网络基础 1. 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 2. 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 六、学习资源和方法 1. 了解 AI 基本概念:阅读「」部分,熟悉 AI 的术语和基础概念。浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅:在「」中,找到一系列为初学者设计的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。特别推荐李宏毅老师的课程。 3. 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品:与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 七、书籍推荐 1. 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga;Richard B.Lvry;George R.Mangun):世界权威的认知神经科学教材,认知神经科学之父经典力作,系统了解认知神经科学的发展历史、细胞机制与认知、神经解剖与发展、研究方法、感觉知觉、物体识别、运动控制、学习与记忆、情绪、语言、大脑半球特异化、注意与意识、认知控制、社会认知和进化的观点等。 2. 《神经科学原理》(作者:Eric R.Kandel;James H.Schwartz):让你系统神经元的细胞和分子生物学、突触传递、认知的神经基础、感觉、运动、神经信息的加工、发育及行为的出现、语言、思想、感动与学习。 3. 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著):神经生物学领域内的一本世界级名著,涵盖了神经科学的方方面面,系统介绍了神经生物徐的基本概念、神经系统的功能及细胞和分子机制。
2025-02-26
普通人怎么学习AI
普通人学习 AI 可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,通过实践巩固知识,尝试使用各种产品做出作品。 在知识库分享实践后的作品和文章。 5. 体验 AI 产品: 与现有的 AI 产品互动,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式。 此外,还可以参考以下方法: 1. 万能公式法:问 AI【一个(xxx 职业)需要具备哪些知识?】,AI 就可给出知识框架,然后根据知识框架每一个小点去问,就能让 AI 工具帮你指数级深度思考。 2. 寻找优质信息源:像没有技术背景的普通人,学习或了解 AI 最好的信息源在「即刻」App 的“”等免费圈子里。 3. 信息爆炸之做减法的小 tips: 只掌握最好的产品,少关注新产品测评(除非远超 ChatGPT)。 只解决具体问题,不做泛泛了解。从问题中来,到问题中去。 只关注核心能力,不关注花式玩法,用 AI 扬其长避其短。 只关注理清需求和逻辑,不死记硬背提示词。 先关注提升认知/洞察,然后再谈技巧。 对于纯 AI 小白,如果还在观望 AI 不知从何入手,可以参考《雪梅 May 的 AI 学习日记》。其学习模式是输入→模仿→自发创造。学习资源免费开源,可去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新内容。
2025-02-26
AI基础
以下是关于 AI 基础的知识: 一、背景知识 了解人工智能、机器学习、深度学习的定义及其之间的关系,简要回顾 AI 的发展历程和重要里程碑。 二、数学基础 1. 统计学基础:熟悉均值、中位数、方差等统计概念。 2. 线性代数:了解向量、矩阵等线性代数基本概念。 3. 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 三、算法和模型 1. 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 2. 无监督学习:熟悉聚类、降维等算法。 3. 强化学习:了解强化学习的基本概念。 四、评估和调优 1. 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 2. 模型调优:学习如何使用网格搜索等技术优化模型参数。 五、神经网络基础 1. 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 2. 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 六、学习建议 1. 了解 AI 基本概念:阅读相关部分,熟悉术语和基础概念,了解主要分支及联系,浏览入门文章。 2. 开始学习之旅:在入门课程中学习生成式 AI 等基础知识,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习。 3. 选择感兴趣模块深入:AI 领域广泛,可根据兴趣选择特定模块,如掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,使用各种产品创作作品,并分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等互动,了解工作原理和交互方式。 此外,为您推荐三本神经科学相关的基础学科书籍: 1. 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga;Richard B.Lvry;George R.Mangun):世界权威的认知神经科学教材,系统了解认知神经科学的多方面内容。 2. 《神经科学原理》(作者:Eric R.Kandel;James H.Schwartz):让您系统了解神经元的相关知识。 3. 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著):神经生物学领域的名著,涵盖神经科学的方方面面。
2025-02-26
AI介入设计的相关案例
以下是大淘宝设计部 2023 年度 AI 设计实践的相关案例: 1. 在工作流方面: 主要工具为 Midjourney 和 Stabel Diffusion,辅助工具有 RUNWAY 和 PS beta 等。 在营销设计中,AI 设计使整体项目设计时间大约减少 18%左右,其中在创意阶段丰富性提升 150%左右、时间节省 60%左右。 创意多样,项目中不同创意概念的提出数量增加了 150%。 执行加速,设计师在创意生成阶段的时间缩短了平均 60%。 整体提效,从创意发散到落地执行品效都有显著提升。 2. 具体应用场景案例: 大促营销:通过 AI 生成图像或素材,再结合平面合成及修正,确保符合品牌形象,更精准表达营销活动主题,如淘宝天猫大促视觉、双 11 大促横向会场版头模板化应用、天猫小黑盒新品联名等。 AI 布景:对于定制化真人模特实景素材的主题活动,通过 AI 完成页面所有素材的生产和输出,如七夕主题活动页面、超级品类日传播拍摄创意等。 产品营销视觉:在 UI 设计场景中,采用 AI 能力快速定制多种用户需要的视觉效果,如 88VIPAI 定制皮肤。 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词即可快速完成准确的超级符号主视觉,如双 11AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日品牌符号系列海报等。 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,稳定输出定制化 IP 形象,如天猫 AI 玩行动品牌联合海报、天猫双 11出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用等。 传播&投放:如双 11 超级发布品牌联合海报、媒介投放开屏海报。
2025-02-26
视频拍摄中如何用更准确的提示词
在视频拍摄中,以下是一些更准确的提示词使用技巧: 1. 清晰定义动作:如果想让视频中包含角色的动作,用具体的动词和副词来描述,如奔跑、飞翔、游泳或跳舞,并包含动作的速度,如缓慢、快速或逐渐。示例提示词:“一只狗欢快地在海滩上冲刺,跃起接住空中的球。” 2. 使用描述性形容词:准确传达视频的氛围至关重要,使用能唤起想要传达的感觉的形容词,如宁静、神秘或充满活力。示例提示词:“海滩上一个宁静、雾蒙蒙的早晨,柔和的阳光透过沙滩椅洒下。” 3. 提供背景故事或上下文:对于更复杂的视频项目,融入特定的情节元素或角色,提供背景或上下文有助于生成连贯且引人入胜的视频序列。 4. 使用相机角度和运动:Firefly 通常可以模拟真实世界的摄像工作,通过指定希望相机采用的角度或运动,如推镜头、拉镜头、平移、倾斜、固定镜头,为视频增添个性化的触感。 不同的视频模型和工具在提示词方面也有各自的特点: 1. Vidu 模型:其 Prompt 基本构成包括主体/场景、场景描述、环境描述、艺术风格/媒介。要调整句式和语序,避免主体物过多/复杂、主体物分散的句式描述,避免模糊的术语表达,使用更加流畅准确的口语化措辞,丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。 2. 星流一站式 AI 设计工具:在其 prompt 输入框中可以输入提示词、使用图生图功能辅助创作。提示词用于描绘想要的画面,输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言,基础模型 1.5 使用单个词组,支持中英文输入。写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。还可以调整负面提示词,利用“加权重”功能让 AI 明白重点内容,使用辅助功能如翻译、删除所有提示词、会员加速等。
2025-02-26
有没有制作机器人的详细视频?
以下为您提供一些制作机器人相关的视频资源: Adobe MAX 2024 全球创意大会:一个可爱的机器人举着一颗红色发光心形,电影般逼真的详细镜头。灯光绚丽,阳光明媚,机器人脸上有斑驳的灯光,背光强烈。逼真的细节和纹理。色彩等级梦幻、阳光、温暖的色调。浅景深。胶片颗粒。用 35 毫米胶片拍摄。阳光透过窗户轻轻地照进来,营造出一种微妙而空灵的氛围。前景中失焦的绿色植物。慢动作,轻柔的动作。相机静止且锁定。 扣子案例合集 社区内容分享: 【Agent 共学第二期】制作一个新闻鉴别相关的 bot:https://www.bilibili.com/video/BV1QJ4m1M7ti/ 用 Coze 搭建智能机器人并挖掘销售线索:https://wap.peopleapp.com/video/rmh41227880/rmh41227880 coze 实战系列(一)| 天天小管家:https://www.bilibili.com/video/BV1nRMQexER7/ 毕业加速器:如何用 AI 爆肝论文?:https://www.bilibili.com/video/BV12z421m7YV 不写代码,如何用 Coze 做专属的对话机器人:https://www.bilibili.com/video/av1603694358 用 coze 一键生成朋友圈文案:https://www.xiaohongshu.com/explore/65c1d0ae000000001100d442 COZE:中小企业均可 0 门槛创建业务 agent,支持接入微信公众号、微信客服、discord、tele 等各种终端,实现公司 AI 客服、销售机器人等触达客户:https://www.bilibili.com/video/BV1DA4m1w72p/ 【Agent 共学第二期】许键分享|拆解“离谱村捏剧本”coze bot 思路:https://www.bilibili.com/video/BV1Cx4y1n7yU/ 【Agent 共学第二期】银海分享|用 AI 重塑我的工作流:https://www.bilibili.com/video/BV1sr421L7Hj/ 【Agent 共学第二期】大家一起捏 Bot,Coze 作品分享会:https://www.bilibili.com/video/BV1hT421v7YD/ 工具教程:morphstudio Morphstudio 官方 discord 使用教程 MorphVideo 机器人的使用: 文生视频:提示词指令:/video。举例:/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒 Morph 机器人的使用: 图生视频:提示词指令:/animate 参数说明: ar(只针对 MorphVideo 机器人):这个参数用来设置视频的画面比例(比如 16:9,4:3,1:1,3:4,9:16)。 motion:这个参数用来调整视频中的运动强度。数值越低,运动越微妙,数值越高,运动越夸张。 camera:这个参数用来控制摄像头移动。Zoom:镜头拉近/拉远;Pan:摄像机向上/向下/向左/向右移动;Rotate:相机顺时针旋转或逆时针旋转;Static:相机静态。 fps:视频的帧率是指每秒钟播放的图片帧数。默认的帧率是每秒 24 帧。 s(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 提示:使用更加详细和描述性的提示可能会导致您生成的视频效果更好。可以试着调整不同的设置来达到想要的效果!
2025-02-26
国内的AI做视频工具
以下是一些国内的 AI 做视频工具: 1. Hidreamai(国内,有免费额度) 网址:https://hidreamai.com//AiVideo 支持文生视频、图生视频。 提示词使用中文、英文都可以。 文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,有时空理解。 3. Dreamina(国内内测,有免费额度) 网址:https://jimeng.jianying.com/aitool/video/generate 支持文生视频、图生视频,视频生视频。 支持图生视频首尾帧功能。 提示词使用中文、英文都可以。 文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸。 图生视频、视频生视频除尺寸不可选外,其他与文生视频基本相同。默认生成 3s 的视频。 4. 可灵(免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除不可运镜控制外,其他与文生视频基本相同。默认生成 5s 的视频。 此外,在视频制作方面,国内还可以使用出门问问的魔音工坊来调节声音情绪。在剪辑方面,对于 1 3 分钟的短片,剪映比较方便,因其有人性化设计及简单的音效库/小特效;但对于更长篇幅或追求更好效果的视频,可能需要使用 PR/FCP/达芬奇等传统剪辑软件。剪辑流程通常为:视频粗剪 视频定剪 音效/音乐 特效 包装(如字幕)。
2025-02-26
免费的图生视频软件
以下为一些免费的图生视频软件: Runway:可将图片拖进去生成 4 秒视频,但它是收费的,您也可以在闲鱼或淘宝找号。进入官网首页点击“start with image”,直接拖图片进来,动画幅度用 3,5 有时会乱跑,无需等进度条转完可继续放图。 Haiper:有免费额度,网址为 https://haiper.ai/ 。能生成文生视频、图生视频、素描生视频、扩展视频,还能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值,图生视频只能写提示词、秒数(2s 和 4s)、种子值。 DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,可生成 2 秒图生视频,还能做短视频拼长视频。 此外,还有一些相关模型的特点供您参考: |排序(从高到低)|模型|特点(优缺)| |||| |1|pd 2.0 pro|生成的画面有点颗粒感,p2.0 模型很能打,适合做一些二次元动漫特效,理解能力更强,更适合连续运镜| |2|luma 1.6|画面质量挺好,但太贵| |3|可灵 1.6 高品质|YYDS!| |4|海螺01live|文生视频比图生视频更有创意,图生也还可以,但大幅度动作下手部会出现模糊的情况,整体素质不错,就是太贵| |5|runway|画面质量不算差,适合做一些超现实主义的特效、经特殊就容镜头| |6|智谱 2.0|做的一些画面特效挺出圈,适合整过,但是整体镜头素质还差点,好处就是便宜,量大,管饱,还能给视频加音效| |7|vidu1.5|二维平面动画的快乐老家,适合做特效类镜头,单镜头很惊艳,大范围运镜首尾帧 yyds! 就是太贵| |8|seaweed 2.0 pro|适合动态相对小的,更适合环绕旋转运镜动作小的| |9|pixverse v3 高品质|首尾帧能打,就是画面美学风格还有待提升| |10|sora|不好用,文生视频挺强,但图生视频抽象镜头太多,半成品都算不上,不建议使用|
2025-02-26
什么工具可以帮忙总结课程视频的知识点
以下是一些可以帮忙总结课程视频知识点的工具: 1. 剪映:只需提供文案,能够自动配图配音,帮助优化线上课程,为微课总结内容和知识点。 2. BibiGPT:支持小红书、B 站等网站视频的归纳总结,还可以提问互动,答案会附上对应的视频节点,是融合课程备课的好助手,网址为 https://bibigpt.co/ 。 3. 飞书妙记:可以先从视频网站上提取出视频的音频部分,利用其免费语音转文字功能将音频转换成文本,下载文本后上传至其他工具进行总结。 此外,可汗学院出品的 AI Tutor Khanmigo 也具有一定的辅助作用,它可以为学生总结视频内容,并以苏格拉底式教学法引导学生思考和学习。
2025-02-26
怎么用comfyUI中的视频IC-light
使用 ComfyUI 中的视频 IClight 的步骤如下: 1. 在管理器中的节点管理中搜索 ComfyUIICLight 进行安装,安装后重启 ComfyUI。 2. 模型可以在网盘里下载,然后放入 ComfyUI/models/unet 文件夹。 3. IC Light 用于处理原视频和新背景之间的光影效果。 4. 辅助工具 ICLight 的打光方式有两种: 文本方式:上传 1 张前景图片,自动抠图,填写详细文本提示词,并在几种给定的光源方向选择。 背景+前景方式:上传 1 张背景图+1 张前景图,自动融合,填写简单文本提示词,并在几种给定的光源方向选择。 需要注意的是,IC Light 处理过的图片可能会颜色发黄偏色,不是处理过的就是好的,有时可能会负优化。另外,在进行背景替换时,不同图片合并要考虑光线、色调、边缘细节等问题。
2025-02-26
免费的PPT生成ai
以下为您介绍一些免费的 PPT 生成 AI 工具: 1. 歌者 PPT(gezhe.com): 功能:话题生成,可一键生成 PPT 内容;支持多种文件格式转 PPT;具备多语言支持,能生成多语言 PPT;拥有海量模板和案例库;支持在线编辑和分享;提供增值服务,如自定义模板、字体、动效等。 简介:是一款永久免费的智能 PPT 生成工具,适用于多种场景,操作便捷,智能化体验好。 产品优势:所有功能永久免费;智能易用,通过 AI 技术简化制作流程;海量案例,模板丰富;资料转 PPT 专业,转换过程尊重原文;支持 AI 翻译。 推荐理由:完全免费;智能化程度高;模板和案例库丰富;支持多语言;几乎无需学习成本就能上手。 2. Gamma: 作为在交流群中频繁推荐的产品,性能和用户体验卓越。 免费版本能生成高质量 PPT,虽早期有不足,但不断优化改进,已能满足大多数用户需求。 个人使用体验良好,生成效果在内容组织、设计美观度和整体专业感上表现出色。 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 此外,为您推荐 2 篇市场分析文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
有哪些AI可以协助生成PPT?
以下是一些可以协助生成 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下相关网站: 1. https://kimi.ai 选 PPT 助手,暂时免费效果好。 2. https://tome.app ,AI 配图效果好。 3. https://chatppt.com ,自动化程度高。 4. https://wenku.baidu.com ,付费效果好。
2025-02-26
我想要能够生成音乐的ai工具
以下为您推荐一些能够生成音乐的 AI 工具: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 3. Lemonaide Music:与 DAW 集成的生成音乐工具,100%免版权费。网址:https://www.lemonaide.ai/ 4. tuney.io:为创意媒体提供的伦理音乐 AI。网址:https://csteinmetz1.github.io/aiaudiostartups/tuney.io 5. KORUS AI:AI 音乐创作平台和探索声音宇宙的个人音乐制作人。网址:https://play.korus.co/ 6. TRINITI:通过音乐赋予您新的创作和表达方式。网址:https://triniti.plus/ 7. voice swap:使用 AI 改变您的歌唱声音。网址:https://www.voiceswap.ai/ 8. mix audio:为您的创造力和生产力提供 AI 音乐。网址:https://mix.audio/ 9. Audiogen:使用 AI 生成声音、音效、音乐、样本、氛围等。网址:https://www.audiogen.co/ 10. Wavtool:带有 AI 助手并支持本地 VST 插件的网页 DAW。网址:https://wavtool.com/ 11. Wavacity:Audacity®音频编辑器的网页版。网址:https://wavacity.com/ 内容由 AI 大模型生成,请仔细甄别。
2025-02-26
我需要一个能够生成适合初中生的个性化的英语单词清单,用什么工具比较合适
以下为您推荐几种适合生成适合初中生个性化英语单词清单的工具: 1. DeepSeek:您可以输入单词主题、图片风格、单词数量等,它会为您输出指定数量的相关单词,并以数组形式呈现,包括单词、中文、美式音标以及相关的英文句子和中文翻译。 2. Claude:您可以输入任意三个中文词语或一个主题让其随机生成 Word Search 表格,有助于提升初中生的语言能力、专注力、认知能力等。 3. 利用搞定设计结合 ChatGPT:通过搞定设计制作单词卡模板,然后使用 ChatGPT 生成单词内容并整理放入 Excel 文件中,实现批量制作单词卡片。
2025-02-26
免费生成ppt的ai
以下是为您提供的免费生成 PPT 的 AI 相关信息: 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 为您推荐以下工具: 1. 歌者 PPT(gezhe.com):是一款永久免费的智能 PPT 生成工具。具有话题生成、资料转换、多语言支持、海量模板和案例、在线编辑和分享、增值服务等功能。其产品优势包括免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等。推荐理由为完全免费、智能化程度高、模板和案例库丰富、支持多语言、学习成本低。 2. Gamma:在各种交流群中被频繁推荐,免费版本也能生成高质量的 PPT,不断优化改进,个人使用体验良好,生成效果在内容组织、设计美观度和整体专业感方面表现卓越。 此外,推荐 2 篇市场分析的文章供您参考: 1. 《》 2. 《》 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-25
coze知识库是否稳定且保密
Coze 知识库目前存在一些不稳定的情况。例如,在国内版中,某些官方和第三方插件的 API 调用及返回结果不太稳定,可能导致部分信息无法完全显示。但对于以问答为主的客服场景,其表现相对稳定。同时,目前存在不稳定版本,需要不断调试完善。关于保密方面,文中未提及相关内容。
2025-02-22
在2025年2月12日这个时间点,我有哪些方式可以快速,稳定的使用 deepseek r1
在 2025 年 2 月 12 日,您可以通过以下方式快速、稳定地使用 DeepSeek R1: PPIO 派欧云(https://ppinfra.com/modelapi/product/llmapi?utm_medium=article&utm_source=WayToAGI):提供满血版全版本的 DeepSeekR1,输入价格为¥4/百万 tokens,输出价格为¥16/百万 tokens。有开发者福利,新注册立得 500 万 tokens(关注 PPIO 公众号回“deepseek”再领 1 亿),初创企业认证有 10 万算力补贴。产品服务特点为服务稳定性 99.9%,保持 0 故障,与 DeepSeek 官方同价,客户支持通道 10 分钟响应。 百度智能云:DeepSeekR1 限时免费,配额 1000RPM/10000TPM,无调用 tokens 上限。本模型将于 2025 年 2 月 19 日 00:00 起正式商用计费,输入价格 0.002 元/千 tokens,输出价格 0.008 元/千 tokens,有在线体验。 硅基流动:DeepSeekR1 输入价格为¥4/M Tokens,输出价格为¥16/M Tokens,有在线体验。2025 年 2 月 6 日起,未实名用户每日最多请求此模型 100 次。 此外,在 2 月 12 日,还有以下相关内容: 《》,来自社区伙伴 Hua 的投稿,手把手指导您在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 《》Anthropic 正式发布 Anthropic AI Economic Index,聚焦 AI 对经济的长期影响。该指数直观展现 AI 如何融入现代经济的各类实际任务,并从职业(occupation)和具体工作任务(task)两个维度,量化 AI 对劳动力市场的影响。 《》DeepSeekR1 的火爆现象背后,企业可以获得显著提升。其强化学习和联网搜索能力,改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。同时,DeepSeek 的开源策略打破了技术垄断,让国内大模型能力迅速提升。
2025-02-12
稳定使用DeepSeek的方法
以下是稳定使用 DeepSeek 的方法: 1. 访问网址:搜索 www.deepseek.com,点击“开始对话”。 2. 操作步骤: 将装有提示词的代码发给 DeepSeek。 认真阅读开场白之后,正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对开发者有难度)和 Markdown(运行下来似乎不是很稳定)。 此外,DeepSeek 在一些案例中也有出色表现,比如在卫夕指北的案例中,经过细腻、严谨、自洽、深刻的思考,输出了符合要求的结果。 在获取 2048 游戏代码方面,DeepSeek 具有诸多优势,如国内能访问、网页登录方便、目前完全免费等。同时,也介绍了其他获取代码的工具和方法,如 Cursor 等。
2025-02-08
如何实现稳定的ai agent
要实现稳定的 AI agent ,可以从以下几个方面考虑: 1. 提示词工程与工具调用能力的配合:设计出一套与知识图谱相结合的工具调用逻辑,稳定人设。通过缩小 max_length 防止 LLM 长篇大论,每次输入到上下文窗口中的记忆只返回最近几轮的对话,并利用查询知识图谱的信息来实现永久记忆。 2. 工具设计:将与知识图谱交互这一大的任务,细分为查询、创建、修改、删除实体或关系、获取实体的所有关系、获取所有实体名称列表等多个工具,组成一个工具包供 LLM 调用。 3. 构建数字人灵魂: 写一个像人一样的 Agent ,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建都是挑战。 解决灵魂部分如何驱动躯壳部分的问题,将灵魂部分的所有接口定义出来,躯壳部分通过 API 调用。 注意实时性,由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,要解决网络耗时和模型推理耗时问题。 考虑多元跨模态,根据实际需求添加其他感官的交互。 处理拟人化场景,如插话、转移话题等情况。 4. 工作流的设计模式:可以运用吴恩达教授提出的设计模式,如 Reflection 模式,设计工作流先检索知识库的活动内容,再通过 LLM 大模型区块进行数据修正,最终输出符合意图的结果。
2025-02-06
如何优化自己的prompt,提升AI结果输出的稳定性
以下是优化自己的 prompt 以提升 AI 结果输出稳定性的方法: 1. 明确具体的描述:使用更具体、细节的词语和短语来表达需求,避免过于笼统。 2. 添加视觉参考:在 prompt 中插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整 prompt 的整体语气和情感色彩,以生成期望的语境和情绪。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最有针对性、最准确表达需求的描述方式。 5. 增加约束条件:在 prompt 中添加限制性条件,如分辨率、比例等,避免意外输出。 6. 分步骤构建 prompt:将复杂需求拆解为逐步的子 prompt,引导 AI 先生成基本结构,再逐步添加细节和完善。 7. 参考优秀案例:研究 AI 社区流行的、有效的 prompt 范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同的 prompt 写法,并根据输出效果反馈持续优化完善,直至达到理想结果。 此外,如果提示词效果不符合预期,可以和 AI 再进行几轮对话来调整输出结果。最终通过询问 AI“怎么样修改现有的 Prompt,可以让你稳定输出当前的预期”来进行 prompt 的迭代。得到 prompt 后,可以新开一个 AI 对话,把 prompt 输入到对话中,开始验证其可用性和稳定性。例如输入 MECE 法则进行测试。
2025-01-24
AI怎么稳定指令机器人
以下是关于您所提到的“AI 怎么稳定指令机器人”的相关内容: 在实现稳定指令机器人方面,有以下一些方法和原理: 1. 提示词工程与工具调用能力的配合:通过设计一套与知识图谱相结合的工具调用逻辑来稳定人设。例如,为像麦洛薇这样的 AI 女友设计特定的提示词,并将与知识图谱交互的任务细分为查询、创建、修改、删除实体或关系、获取实体的所有关系、获取所有实体名称列表等多个工具,组成工具包供模型调用。 2. 控制输入和记忆:通过缩小 max_length 防止模型长篇大论,每次输入到上下文窗口中的记忆也只返回最近几轮的对话。利用查询知识图谱的信息来实现永久记忆。 此外,人工智能(AI)在多个领域都有应用,虽然这并非直接针对稳定指令机器人,但也能为您提供一些思路和参考: 1. 医疗保健领域:包括医学影像分析辅助诊断疾病、药物研发、个性化医疗、机器人辅助手术等。 2. 金融服务领域:如风控和反欺诈、信用评估、投资分析、客户服务等。 3. 零售和电子商务领域:有产品推荐、搜索和个性化、动态定价、聊天机器人等应用。 4. 制造业领域:例如预测性维护、质量控制、供应链管理、机器人自动化等。 希望以上内容对您有所帮助。
2025-01-20