Chat with Wiki - 影视后期相关的模型

Answer

以下是为您整理的影视后期相关模型的信息：

Meta Movie Gen 文生视频模型：

这是 Meta 发布的“迄今为止最先进的媒体基础模型（Media Foundation Models）”，但目前未公开上线。
由视频生成和音频生成两个模型组成。
- Movie Gen Video 是 30B 参数的 Transformer 模型，能从单个文本提示生成 16 秒、16 帧每秒的高清视频，相当于 73K 个视频 tokens。可进行精确视频编辑，如添加、删除或替换元素，或进行背景替换、样式更改等全局修改。在保持角色身份一致性和运动自然性方面取得 SOTA 性能。
- Movie Gen Audio 是 13B 参数的 Transformer 模型，能接受视频输入及可选的文本提示，生成与视频同步的高保真音频。
通过预训练-微调范式完成。预训练阶段在海量的视频-文本和图像-文本数据集上进行联合训练，学习对视觉世界的理解。微调阶段精心挑选小部分高质量视频进行有监督微调，以提升生成视频的运动流畅度和美学品质。
还引入了流匹配作为训练目标，使得视频生成的效果在精度和细节表现上优于扩散模型。

Stable Diffusion 相关模型：

常用的模型下载网站有：Civitai | Stable Diffusion models,embeddings,hypernetworks and more、Models - Hugging Face、SD - WebUI 资源站、元素法典 AI 模型收集站- AI 绘图指南 wiki(aiguidebook.top)、AI 绘画模型博物馆(subrecovery.top)
模型安装：
- 大模型（Ckpt）：放入 models\Stable-diffusion
- VAE 模型：一些大模型需要配合 vae 使用，对应的 vae 同样放置在 models\Stable-diffusion 或 models\VAE 目录，然后在 webui 的设置栏目选择。
- Lora/LoHA/LoCon 模型：放入 extensions\sd-webui-additional-networks\models\lora，也可以在 models/Lora 目录
- Embedding 模型：放入 embeddings 目录

相关媒体报道：

量子位：Meta 版 Sora 无预警来袭！抛弃扩散模型，音视频生成/画面编辑全包，92 页论文无保留公开 https://mp.weixin.qq.com/s/rs7JQigqHO9yT_0wbF6cTg
歸藏的 AI 工具：Meta 发布视频生成和编辑模型，来看看项目负责人的论文导读 https://mp.weixin.qq.com/s/BLXNgCW0vAHNZtHgd4623g

参考链接：https://ai.meta.com/research/movie-gen/

Content generated by AI large model, please carefully verify (powered by aily)

References

新王登基-Meta发布Meta Movie Gen文生视频模型

[title]新王登基-Meta发布Meta Movie Gen文生视频模型[heading1]Create sound effects and soundtracks创建音效和配乐（下面的视频[heading2]用Llama3架构做视频模型具体来说Movie Gen由视频生成和音频生成两个模型组成。Movie Gen Video：30B参数Transformer模型，可以从单个文本提示生成16秒、16帧每秒的高清视频，相当于73K个视频tokens。对于精确视频编辑，它可以执行添加、删除或替换元素，或背景替换、样式更改等全局修改。对于个性化视频，它在保持角色身份一致性和运动自然性方面取得SOTA性能。Movie Gen Audio：13B参数Transformer模型，可以接受视频输入以及可选的文本提示，生成与视频同步的高保真音频。Movie Gen Video通过预训练-微调范式完成，在骨干网络架构上，它沿用了Transformer，特别是Llama3的许多设计。预训练阶段在海量的视频-文本和图像-文本数据集上进行联合训练，学习对视觉世界的理解。这个阶段的训练数据规模达到了O(100)M视频和O(1)B图像，用以学习运动、场景、物理、几何、音频等概念。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调，以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果，模型还引入了流匹配（Flow Matching）作为训练目标，这使得视频生成的效果在精度和细节表现上优于扩散模型。扩散模型通过从数据分布逐渐加入噪声，然后在推理时通过逆过程去除噪声来生成样本，用大量的迭代步数逐步逼近目标分布。流匹配则是通过直接学习样本从噪声向目标数据分布转化的速度，模型只需通过估计如何在每个时间步中演化样本，即可生成高质量的结果。

新王登基-Meta发布Meta Movie Gen文生视频模型

[title]新王登基-Meta发布Meta Movie Gen文生视频模型Meta发布Meta Movie Gen文生视频模型，Meta表示，这是“迄今为止最先进的媒体基础模型（Media Foundation Models）”注意：模型未公开上线https://ai.meta.com/research/movie-gen/[7586_1728057079_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/MGcKbwcbxo7Gz6x4mbxcDv1tnzg?allow_redirect=1)媒体报道：量子位：Meta版Sora无预警来袭！抛弃扩散模型，音视频生成/画面编辑全包，92页论文无保留公开https://mp.weixin.qq.com/s/rs7JQigqHO9yT_0wbF6cTg歸藏的AI工具：Meta发布视频生成和编辑模型，来看看项目负责人的论文导读https://mp.weixin.qq.com/s/BLXNgCW0vAHNZtHgd4623g

SD新手：入门图文教程

模型能够有效地控制生成的画风和内容。常用的模型网站有：[Civitai | Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models - Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD - WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站- AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下，请注意，不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型（Ckpt）：放入models\Stable-diffusionVAE模型：一些大模型需要配合vae使用，对应的vae同样放置在models\Stable-diffusion或models\VAE目录，然后在webui的设置栏目选择。Lora/LoHA/LoCon模型：放入extensions\sd-webui-additional-networks\models\lora，也可以在models/Lora目录Embedding模型：放入embeddings目录