与知识库对话 - 图生图，如何保持生物形象一致性

回答

在图生图中保持生物形象一致性，有以下几种方法：

对于人物和场景一致性问题，可以采用生成动物的方式，动物相对容易保持一致性。
选择特定的名人或具有特殊属性的人物。
确定好影片风格，如皮克斯动画风格。
先确定好人物形象，如明确角色的发型、穿着等特征。
使用 Midjourney 的新功能 Cref，在需要出现主角人物的地方，保持发型、人脸、衣服等特征。但需要注意的是，Midjourney 对亚洲人脸的 Cref 一致性效果相对较差，尤其对于亚洲老人，而且 Cref 在画面的审美和构图上有一定破坏性，原则上能不用则不用。例如只有背影时，简单描述特征即可。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

更多写剧本的方法、小技巧、格式还有软件，希望后面有时间可以多写一些。照例，先放上我写的分镜，这是非常粗糙且不规范的分镜，正常的分镜是要更仔细的，所以大家凑活看。与上一次制作不同的是，因为更了解AI生图的局限，所以我这次写的分镜，有百分之八十都用上了。也算提高了效率，但还是写得太粗糙了，下次尽量按照正规格式写得准确一些，如果我的肝还好的话（主要是就只有我和Zoik看就有点偷懒了）……给大家推荐一些编剧相关的书，虽然我觉得写短片看这些书还是太多了，但基本涵盖了常见的剧作书，供参考吧~其实也不用看这么多书，只不过我看到同类型的书就想买来对比，没时间的话，看《救猫咪》或《电影剧本写作基础》的第一册就行。主要还是练习，写。第二步，生图这次生图，我明显感觉到Midjourney的语义理解比之前好了很多。很多人在生图上都遇到了人物和场景一致性的问题。有两个取巧的方式，一个是像我上个视频一样生成动物，动物会比较容易保持一致性，另一个方式是特定的名人/或者有特殊属性的人物。这次我们用的是第二种方式。首先，先确定好影片风格，这次用的是皮克斯动画风格。真的不是我们不做其他题材，是因为这个故事比较适合用动画呈现，后面的片子我们会多尝试别的题材风格。其次，先确定好人物形象。短片有两个主要角色，角色一：扎马尾、穿白色T恤、穿牛仔裤的14岁女孩；角色二：戴眼镜、灰色头发、穿灰色短衬衫的50岁男人。

卡兹克：我们花了10天时间，给CCTV6做了一部AI短片 - 5000字全流程复盘拆解

在图片生成上，我们依然用的是Midjourney，原因依然单纯的很简单：我要的电影感和审美，只有Midjourney可以做出来。很多人问，画面的电影感到底怎么做出来，为什么我的图总是一股子AI感。其实挺简单的，画面的电影感无非就是几个点：画幅，审美、色调、构图、光影、景深等等。我最喜欢用的画幅比例就是，21:9。画幅的比例是会影响生图的构图和光影的，21:9，是出电影感最好的比例。同时在Prompt里，也可以加电影的专用摄影机，比如RED Helium 8K等等。而我们的整体Prompt风格后缀：________.Shot on Sony Venice 2,muted color tones,green and dark gray,award-winning composition,cinematic scene--ar 21:9而在人物一致性上，在有了Midjourney的新功能Cref以后，其实就非常简单了。我们直接先跑了一张主角的定妆照。然后在需要出现主角人物的地方，扔进去Cref。保持发型、人脸、衣服。坦率的讲，Midjourney对亚洲人脸的Cref一致性，要比对欧美的人脸的一致性效果差太多太多了，年轻人还好点，亚洲老人简直惨不忍睹。而且Cref的效果，在画面的审美和构图上，其实是有一定的破坏性的，所以在原则上，是能不用Cref就不用Cref，比如只有背影的时候，写个短发男人黑卫衣就完事了。

开发：PIKA1.0上手评测 - 你就是传奇

能明显感受到，PIKA1.0是启用了一个全新的模型，甚至我感觉不是基于旧有的迭代，而是完全重新做的一个全新的模型。强非常非常多。3D和2D的动画效果更是吊炸天。所以他们的新模型，我会多花一些篇幅和笔墨，来展现一下。首先，文生视频的质量得到了大幅度的提升。我直接写了一段：Prompt：Cinematic,happy laughing girl in office,Pixar style瞬间，匹配皮克斯水平的镜头就出来了。要知道，我只花了1分钟。这效果，我说实话，太特么吓人了。。。。。。而且，这稳定性，这神情。。。爆杀市面上所有的AI视频。再来！A cat flying a plane,Cartoon style在文生图这块，PIKA1.0的新模型稳定的令人害怕。Cinematic,extreme close-up of cars on the road in a jungle,3D rendering不规则构图的汽车行驶在道路上，这个前进的镜头依然稳定的可怕，车上的光影更是表现的极好。无敌。真的无敌。同时，有两个小技巧是，右下角第三个设置里，负面提示（Negative prompt）可以常驻：blurry,out of focus,twisted,deformed。提示词相关性别设太高，可以5～15之间，自己实测下来效果最好。再来说图生视频。图生视频这块，效果也依旧棒。放几个case。（这里因为GIF图比较大所以只能放了每秒10帧的GIF，所以看起来可能有一些卡，这并不是PIKA的原因。）说实话，Runway原本剩的唯一优势就画质好+一致性强点了。。。但是你看看现在的PIKA1.0。。。。。。人的一致性已经逆天了，再加上它强到爆的语义理解，以及幅度巨大的动作。。。。咋比啊。。。这PIKA1.0新模型的质量，特别是它最擅长的3D和3D的动画的质量，真的让人激动到无以复加。

图生图， 如何保持生物形象一致性

回答

参考资料

图生图，如何保持生物形象一致性