以下是关于图生视频的相关内容:
什么是图生视频: 输入一张图片+相应的提示词,清影大模型将根据提示将图片转变为视频画面。您也可以只输入一张图片,清影大模型将自行发挥想象力,把图片扩展为一段有故事的视频。
图生视频的两个小技巧:
在其他场景中的应用:
输入一张图片+相应的提示词,清影大模型将根据提示将图片转变为视频画面。您也可以只输入一张图片,清影大模型将自行发挥想象力,把图片扩展为一段有故事的视频。[heading3]👍两个小技巧[content]⚠️技巧1:选用尽可能清晰的图片,上传图片比例最好为3:2(横版),清影支持上传png和jpeg图像如果原图不够清晰,会影响模型对图片的识别,可以采用分辨率提升工具将图片变清晰。⚠️技巧2:提示词要【简单清晰】1️⃣可以选择不写prompt,直接让模型自己操控图片动起来。2️⃣明确你想动起来的【主体】并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词(一定要有主体,不然可能会出现AI狂乱景象)如果你不明确大模型如何理解你的图片,推荐将照片发送到清言对话框进行识图,明确你的【主体】该如何描述。
图片是用Midjourney生产,AI离谱村黄社长的业务水平很高,也很高产,其他小伙伴打辅助欢迎关注小红书:AI离谱社,寻找更多离谱灵感[heading2]图生视频[content]每张图片转视频都进行了大量的尝试。各种工具轮番上场pika,runway,Pixverse经常会抽到离谱的又符合离谱村的卡[_seed4262149903300367.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/ExUzbkev8oo8UTxoMoFcpQaNnZb?allow_redirect=1)中间还找了ZHO来做技术指导,他帮忙用SVD1.1出来几个精美的视频,甚至还上了stablevideo.com的首页官方推荐。今天已经公测了,大家打开首页就可以看到这个视频[19_1707280129(原视频).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/O5aKbZ6PEof6tUx0ZaqcSXX0ncc?allow_redirect=1)[heading2]配音部分[content]其中的配音都是用Audiobox捏出来的,每个人物角色都有自己的专属声音。会把捏好的声音管理起来,大家一起选最合适的那个作为正式配音。为了离谱熊声线的一致性,用了GPT-sovits对离谱熊的声音做了专属的训练。
在图生视频中,生成视频的比例取决于您上传图片的比例,提示词也遵循[上述规则](https://waytoagi.feishu.cn/docx/JNFVddVUWoOqvrxA3QicU0pcnMf#doxcnJ3BJslnq3fPXZ8yPCcc5ty),在此不再详述。接下来为您展示几个示例,帮助您拓展创意。[heading3]示例[content]The camera wraps around to the left and the girl turns,with a blur of fast moving people in the background and the girl relatively still.镜头向左旋转,女孩转身,背景中快速移动的人模糊不清,而女孩相对静止。The monkey wear sunglasses and have a cigar while pointing forward with a confident gesture.猴子戴上墨镜,叼着雪茄,以自信的姿态指向前方。[heading2]风格化[content]Style为您提供了4种风格,且支持文生和图生的风格选择和转换。为保证最佳效果,不推荐风格化与其他功能混用。以下为图生视频的实例:原图动画风格(Anime)3D风格(3D Animation)粘土风格(Clay)现实风格(Realistic)