Kling 生成的视频可以带声音。在输入文本准备生成时,可以勾选下面的音频增强和降噪进行进一步处理,增强后的音频会更加清晰减少噪音,但会增加处理时长。当文本内容很多时,可以勾选文本切割来进行处理,默认为五十字符进行切割,还可以将音频片段合并为一整段音频。保存后的音频文件结构清晰,“concatenated Audio”是合成的一整段音频,“Enhanced Audio”是增强处理后的整段音频,“Audio clip”文件夹中是切分的音频片段,“Enhanced”开头的就是增强处理的音频片段,不带“Enhanced”就是生成的普通音频片段。该版本还增加了批量处理功能,勾选后可以上传一个 TXT 文本,TXT 文本需要按照每句换行的格式。此外,还可以通过点击随机按钮尝试不同的音色,找到满意的音色后,将设置和音色种子保存到配置文件中方便下次使用。但需要注意的是,即梦 AI 目前仅支持生成视频画面,无法生成声音效果,如果描述过多对声音的要求,可能会导致视频生成效果质量不佳。
首先试试增强音质,在我们输入文本准备生成时,可以勾选下面的音频增强和降噪进行进一步处理。增强后的音频会更加清晰减少的噪音,但会增加处理时长⏰其次,当文本内容很多时,可以勾选文本切割来进行处理,默认为五十字符进行切割,还可以将音频片段合并为一整段音频,切割的音频片段也支持增强处理保存后的音频文件结构相当清晰,concatenated Audio是合成的一整段音频,Enhanced Audio是增强处理后的整段音频Audio clip文件夹中是切分的音频片段。Enhanced开头的就是增强处理的音频片段,不带Enhanced就是生成的普通的音频片段。该个版本还增加了批量处理功能,勾选后可以上传一个TXT文本,TXT文本需要按照每句换行的格式。最后就是音色固定,前面提到这个项目不同的音频种子生成的人物说话音色会不一样。我们可以点击随机按钮,多尝试几次,找到自己满意的音色后,可以将设置和音色种子保存到配置文件中,方便下次使用。ChatTTS刚放出来的时候,我很惊讶于它的效果,随后就重新思考,基于目前只能随机音色的情况,它在AI配音领域会有什么样的应用呢?本来是打算等到它后面提供微调版本,再给大家出一篇教程来复刻名人声音。
[title]UDIO官方FAQ[heading1]How do I make music with Udio? 如何使用 Udio 制作音乐?[heading2]Basics 基本[content]Note that Udio doesn't generate songs using artists' voices and under the hood the style reference is replaced with a set of relevant tags.请注意,Udio不会使用艺术家的声音生成歌曲,并且在幕后,风格参考会被一组相关标签替换。To help you with prompting,beneath the text input you’ll find two types of suggested tags that you can click on to add to your prompt:为了帮助您进行提示,在文本输入下方,您将找到两种类型的建议标签,您可以单击将其添加到提示中:
“我很熟悉历史,历史快速转变”(产品OS:“我”是谁?历史要怎么表现?历史还可以快速转变?)“一朵花盛开,8K,超清镜头,你可以自由发挥”(产品OS:8K臣妾暂时做不到啊,“你”是谁?“可以自由发挥”是什么画面?“自由发挥”是什么?)❌【没有主语+抽象叠buff】:在文生视频中,没有主语的描述等同于没有主体的内容,或用词组的描述方式,可能会导致模型无法理解您输入的内容导致生成视频结果不达您的预期,例如:“生长,茂盛”(产品OS:什么生长?什么茂盛?我是谁?我在哪?我要干什么?)“生成一个火热招募的场景”(产品OS:“生成一个”是什么意思?“火热招募”什么?)“风,雨,摇动,一个女孩,爆炸,3D”(产品OS:我应该怎么做,怎么做,在线等,急~)❌【音效、声音的描述】:产品目前仅支持生成视频画面,无法生成声音效果;如果您描述过多对声音的要求,可能会导致:视频生成效果质量不佳;