表情生成在以下几个方面有相关应用和技术:
AI短剧极其需要同时对大脑和肢体完成精细的控制功能,这就需要同时把口型生成、表情生成、肢体生成等多个生成组合在一起。当前大家体验比较好的是口型生成,因为口型生成其实和音频信息之间具备更好的映射关系,因此它的精准度可以实现的更好,用户体验会更好。[DM_20250222015416_001.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/W25lb4POxoM16IxbGPuccQfankc?allow_redirect=1)而人物表演的细节和能力更是AI短剧生成效果优质与否的核心所在,为了大幅提升表情生成、肢体生成的可控表演效果,SkyReels-V1不仅针对表演细节做了打标,还对情绪、场景、表演诉求等进行处理,利用千万级别、高质量的好莱坞级别数据进行训练微调。团队针对人物微表情、人物表演细节、场景描述、光影、画面构图等做了更精细的技术升级,可以看到当前由SkyReels生成的视频中的人物已经存在更精准的表演细节,初步具备影帝级人物表演实力。SkyReels-V1可实现影视级人物微表情表演生成,支持33种细腻人物表情与400+种自然动作组合,高度还原真人情感表达。正如以下视频所示,SkyReels-V1支持生成大笑、怒吼、惊讶、哭泣等微表情,展现出人物情感丰沛的表演细节。即使有大幅度肢体动作,例如下面视频中,正在大口食用汉堡包的男士,SkyReels-V1生成的微表情也完美贴合人物肢体表演。
不同的人物表情可以传递出不同的情感和意境,对于人物表情,可以选择合适的表情来表达所想要的情感和意境。这里在「Midjourney关键词」表格中选取几个常用表情示例一下,其它的大家可以自己选择关键词进行AI生成。1.高兴的咒语关键词:Smiling生成思路:正视角下高兴的年轻女孩生成咒语:young girl,smiling,front view,--ar 16:9前面4张是使用Smiling生成出来的,可以看出来,只是在面部表情上有一些细微的变化,后面4张是使用happy生成出来的,可以看出来,结果除了面部表情还包含着一些动作上的变化。可以看出不同的咒语表达出来的结果也是不同的,所以有时候在没有达到我们想要的结果的时候,可以尝试换一个咒语。2.生气的咒语关键词:Angry生成思路:正视角下生气的年轻女孩生成咒语:young girl,angry,front view,--ar 16:93.哭泣的咒语关键词:Crying生成思路:正视角下哭泣的年轻女孩生成咒语:young girl,erying,front view,--ar 16:9从生成的结果上来看,只有少数结果中在哭泣的状态下有泪水的状态,说明这种表情还需要其它更多修饰性的咒语来辅助完成,才能达到一个理想的状态。当然除了以上这些常见的表情之外,还有像更多其它类型的表情,比如:害怕的(Afraid)、嫉妒的(Jealous)、困惑的(Confused)、自信的(Confident)、厌恶的(Disgust)、厌恶的(Surprise)等等一些面部情绪上的表达都可以使用,这些大家可以自行去探索。
下面我们开始演示如何利用GPT 4o能力制作自己的专属表情包其实使用非常简单我们只需自然语言沟通即可,不需要复杂的提示词我们只需要上传一张自己想要模仿的风格照片或者一张自己的自拍照就行例如↓我张图是我之前朋友帮我设计的表情包,由于是表情包所以我截图上传的,还是比较模糊的。我们看看它能不能捕捉到关键信息我们看到它表示捕捉到了信息,并给出了一些好玩表情包的描述,可以根据这个生成,可以一次生成一组,也可以一个一个生成。我们选择一个个生成,这还有效果好,而且也方面后面我们通过多轮沟通修改。我们让它开始生成↓生成了一张吃瓜的表情,可以看到形象特征什么的捕捉的还是非常到位的,一次成功,那我们就继续生成。生成的效果也是非常的炸裂和形象啊,完全符合之前的文字描述等下怎么胸牌文字错了没关系,这是正常现象,在生成中文的时候,会经常出现这种写错字的情况,之前是一个也写不对,现在升级后,能写对很多了,已经很大进步了。我们是可以局部编辑的,这个时候,我们点击图片,会弹出一个窗口点击右上角那个画笔的地方↓然后会弹出一个选择圈,我们只需要用这个圈,涂抹需要修改的地方然后告诉他如何修改即可然后有时候可能也不太工作,但是多尝试几次就能成功同时也可能会出现和之前风格不太一致的情况比如但是我也能接受哈哈哈哈