以下是关于生成稳定的 AI 视频的相关信息:
工具推荐:
技术差异: 代表产品如 Runway,在端到端视频生成中,涉及的技术包括 GAN 生成对抗网络、VAE 变分自编码器和 Transformer 自注意力机制。
当前面临的问题及解决方案: 当前仍面临生成时间长、视频质量不稳定、生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案包括使用渐进生成、增强时序一致性的模型等方法,上述的补帧算法、视频完善策略也可在一定程度上缓解问题。
制作技巧: 在镜头衔接上要写运镜提示词,描述多种运镜方式,否则画面会乱变。在做视频时要不断尝试参数。
https://app.runwayml.com/video-tools/官方使用教程:https://academy.runwayml.com/知识库详细教程:[工具教程:Runway Gen-3](https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r)简单介绍:支持文生视频、图生视频,视频生视频使用英文提示词文生视频支持正向提示词、风格选择、运镜控制、运动强度控制、运动笔刷(https://academy.runwayml.com/gen2/gen2-motion-brush-interface),支持16:9、9:16、1:1、4:3、3:4、21:9尺寸,可设置种子值图生视频、视频生视频除了尺寸不可选以外,其他跟文生视频基本相同生成好的视频可以延长时间,默认生成4s的视频相关界面截图:[heading3]Stable video(有免费额度)[content]https://www.stablevideo.com/generate知识库详细教程:[工具教程:StableVideo](https://waytoagi.feishu.cn/wiki/Hf1cwooP5iRH2zkJ6RrcAKLunWb)简单介绍:支持文生视频、图生视频,仅英文图生视频不可写prompt,提供多种镜头控制文生视频先生成4张图片,选择其中一张图片以后再继续生成视频图生视频:文生视频:
代表产品:RunwayGAN生成对抗网络:是一种无监督的生成模型框架,通过让两个神经网络相互博弈来进行机器学习。可以生成视觉逼真度高的视频,但控制难度大、时序建模较弱。VAE变分自编码器:它是一种可以学习数据分布的网络结构。就像把视频文件压缩成较小的文件再解压一样,它可以重建视频数据。VAE可以根据条件输入控制生成过程,但质量较GAN略低。GAN、VAE生成视频速度快,缺点是生成质量和分辨率较低,长度短,控制能力弱。Transformer自注意力机制:通过学习视频帧之间的关系,理解视频的长期时间变化和动作过程,这种方式对长视频建模更好,时序建模能力强,可实现细粒度语义控制,缺点是计算量大[heading2]1.4 AI视频生成当前面临的问题[content]当前仍面临生成时间长、视频质量不稳定,生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案有:使用渐进生成、增强时序一致性的模型等方法解决。上述的补帧算法、视频完善策略也可在一定程度上缓解问题。[heading2]二.应用场景思考
[heading2]智能章节[45:01](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=2701000)AI图像与视频生成中的技巧、问题及成功率本章节主要讲述视频制作相关内容。在镜头衔接上要写运镜提示词,描述多种运镜方式,否则画面会乱变。提到不同软件(如季梦、可林)生成图片或视频的情况,包括成功率、生成时间、面部效果等,还指出要对AI生成不稳定情况脱敏并介绍了一些小技巧。[53:56](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=3236000)娜娜酱谈视频制作中的AI生成、参数调整与画面关系本章节娜娜酱提到当天有多个内容,先将部分任务生成然后合成,在检查镜头是否都运行正常。还讨论了AI视频稳定相关,认为PS一帧一帧改不可行,AE改尚可。在做视频时要不断尝试参数。此外提到当天的第二个内容是deform,还涉及本地跑双月相关话题。[57:32](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=3452000)SD sample diffusion相关,谈defirm及运行SD所需电脑配置本章节主要内容是关于defirm相关。首先询问大家是否有SD sample diffusion基础,然后介绍defirm相关画面类似不断迭代变化的情况。还提到电脑带SD的要求,独立显卡8G以上较好,想做好要花钱。最后强调苹果和a卡跑相关内容存在问题,如速度慢、报错难查等。