Chat with Wiki - 目前我已经有了一个可以文生视频或者图生视频的模型但是只能6秒，我要如何利用agent自动流实现这个模型可以生成更长，更可靠质量的视频呢

Answer

要利用 agent 自动流实现生成更长、更可靠质量的视频，您可以参考以下几种模型和方法：

PixVerse V2 模型：
- 8 秒的视频生成需要花费 30 Credits，5 秒的视频生成需要花费 15 Credits，且只能使用 PixVerse V2 模型，生成时请注意模型选择。
- 目前仅支持 16:9 画面比例的视频生成。
- 文生视频：点击“Text to Video”，在“Model”选择“PixVerse V2”，视频时长。PixVerse V2 支持多风格的视频生成，您可以通过在提示词中加入“Anime”，“Realistic”等词语做到这点。
- 图生视频：点击“Image to Video”，在“Model”选择“PixVerse V2”，视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能，如需要使用上述功能，请将模型切换至“PixVerse V1”。
Meta Movie Gen 模型：
- Movie Gen 由视频生成和音频生成两个模型组成。
- Movie Gen Video：30B 参数 Transformer 模型，可以从单个文本提示生成 16 秒、16 帧每秒的高清视频，相当于 73K 个视频 tokens。对于精确视频编辑，它可以执行添加、删除或替换元素，或背景替换、样式更改等全局修改。对于个性化视频，它在保持角色身份一致性和运动自然性方面取得 SOTA 性能。
- Movie Gen Audio：13B 参数 Transformer 模型，可以接受视频输入以及可选的文本提示，生成与视频同步的高保真音频。
- Movie Gen Video 通过预训练-微调范式完成，在骨干网络架构上，它沿用了 Transformer，特别是 Llama3 的许多设计。预训练阶段在海量的视频-文本和图像-文本数据集上进行联合训练，学习对视觉世界的理解。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调，以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果，模型还引入了流匹配（Flow Matching）作为训练目标，这使得视频生成的效果在精度和细节表现上优于扩散模型。
Sora 模型：
- 文生视频，图生视频，视频生视频，支持多种视频定制选项，如分辨率（从 480p 到 1080p）、视频长度（从 5 秒到更长时间）和视频风格。用户可以浏览社区共享的视频，获取灵感和学习技巧（直接抄别人 prompt）。
- 故事板：允许用户通过时间线指导视频中的多个动作，创建更加复杂的视频序列。
- 混音和编辑：提供视频混音功能，允许用户将视频转换成新的风格。支持视频的延伸和剪辑，以及创建循环视频。
- 高级功能：包括混合功能，可以将两个视频场景合并成一个新的场景。
- 对于已经拥有 OpenAI Plus 或 Pro 账户的用户，Sora 的使用是包含在现有订阅中的，无需额外支付费用。OpenAI Plus 订阅每月 50 次视频生成次数；OpenAI Pro 订阅无限次慢速队列生成，500 次正常速度的视频生成次数。用户可以根据需要选择更高分辨率的视频生成，但这可能会减少每月的使用次数。Sora 的发布初期，对于某些地区（如欧洲和英国）可能会有延迟。

Content generated by AI large model, please carefully verify (powered by aily)

References

8s的视频生成需要花费30Credits，5s的视频生成需要花费15Credits，且只能使用PixVerse V2模型，生成时请注意模型选择。目前仅支持16:9画面比例的视频生成。[heading2]文生视频[content]点击“Text to Video”，在“Model”选择“PixVerse V2”，视频时长。PixVerse V2支持多风格的视频生成，您可以通过在提示词中加入“Anime”，“Realistic”等词语做到这点。[heading2]图生视频[content]点击“Image to Video”，在“Model”选择“PixVerse V2”，视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能，如需要使用上述功能，请将模型切换至“PixVerse V1”。

新王登基-Meta发布Meta Movie Gen文生视频模型

具体来说Movie Gen由视频生成和音频生成两个模型组成。Movie Gen Video：30B参数Transformer模型，可以从单个文本提示生成16秒、16帧每秒的高清视频，相当于73K个视频tokens。对于精确视频编辑，它可以执行添加、删除或替换元素，或背景替换、样式更改等全局修改。对于个性化视频，它在保持角色身份一致性和运动自然性方面取得SOTA性能。Movie Gen Audio：13B参数Transformer模型，可以接受视频输入以及可选的文本提示，生成与视频同步的高保真音频。Movie Gen Video通过预训练-微调范式完成，在骨干网络架构上，它沿用了Transformer，特别是Llama3的许多设计。预训练阶段在海量的视频-文本和图像-文本数据集上进行联合训练，学习对视觉世界的理解。这个阶段的训练数据规模达到了O(100)M视频和O(1)B图像，用以学习运动、场景、物理、几何、音频等概念。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调，以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果，模型还引入了流匹配（Flow Matching）作为训练目标，这使得视频生成的效果在精度和细节表现上优于扩散模型。扩散模型通过从数据分布逐渐加入噪声，然后在推理时通过逆过程去除噪声来生成样本，用大量的迭代步数逐步逼近目标分布。流匹配则是通过直接学习样本从噪声向目标数据分布转化的速度，模型只需通过估计如何在每个时间步中演化样本，即可生成高质量的结果。

视频模型：Sora

最新消息sora.com域名已经部署好[Sora实测案例](https://waytoagi.feishu.cn/wiki/MKgKw9hg8iZZp1kKYQ4c0B6unWg)2点直播链接：https://www.youtube.com/watch?v=2jKVx2vyZOY有博主已经做了提前测试This Video is AI Generated!SORA Reviewhttps://www.youtube.com/watch?v=OY2x0TyKzIQ12月10日已上线[heading2]Sora功能：[content]文生视频，图生视频，视频生视频1.视频生成：文生视频，图生视频，视频生视频支持多种视频定制选项，如分辨率（从480p到1080p）、视频长度（从5秒到更长时间）和视频风格。用户可以浏览社区共享的视频，获取灵感和学习技巧（直接抄别人prompt）2.故事板：允许用户通过时间线指导视频中的多个动作，创建更加复杂的视频序列。3.混音和编辑：提供视频混音功能，允许用户将视频转换成新的风格。支持视频的延伸和剪辑，以及创建循环视频。4.高级功能：包括混合功能，可以将两个视频场景合并成一个新的场景。[heading2]费用和订阅套餐：[content]对于已经拥有OpenAI Plus或Pro账户的用户，Sora的使用是包含在现有订阅中的，无需额外支付费用。OpenAI Plus订阅：每月50次视频生成次数。OpenAI Pro订阅：无限次慢速队列生成。500次正常速度的视频生成次数。额外信息：用户可以根据需要选择更高分辨率的视频生成，但这可能会减少每月的使用次数。Sora的发布初期，对于某些地区（如欧洲和英国）可能会有延迟。