以下是为您生成的关于语音合成和音乐生成的思维导图:
一、语音合成基础知识
二、语音合成和音乐生成应用场景
三、语音合成和音乐生成的常用工具
希望这个思维导图对您有所帮助!如果您还有其他需求,请随时告诉我。
链接:https://www.manglemoose.com/en/Manglemoose最近展示了由他们最新开发的音乐生成器制作的视频案例,该工具的名称尚未公布,期待下后续。据了解,Manglemoose集结了五位对媒体音乐和声音设计充满热情的音频技术专家,他们的合作基于各自不同的专业知识,相信这种多元化的才能结合能够将项目提升至新的高度。他们提供从单个配音演员到完整音频包的多种服务,包括现场录音、作曲、声音设计和混音。详情可点击上方链接查看。
需要人物表情比较自然的画面我们就会用Pika来生成。总之就是,办法总比困难多,想尽一切招数,解决问题。这里本来可以对应介绍一些视听语言的书,但篇幅实在太长了目前,下次再推荐!第四步,AI声音这次我们尝试使用了一些简短对话的制作。通常在传统影视制作流程里,声音部分的制作会分为现场录音、后期配音、音效音乐制作等多个部分。这里用AI声音来制作对话相当于是后期配音的部分。我们会把中文台词谷歌翻译成英文,但我英语比较拉垮,所以找了非常专业的Azura Ge葛女士进行英文字幕校对与台词润色,形成配音稿。接着使用AI声音软件11labs(官网:https://elevenlabs.io/)进行对白制作,11labs的英文效果比较好,但我们仍然非常头疼地遇到了AI声音没有情绪和情感的问题。跟视频制作类似,需要不断地抽卡(反复生成),因为11labs无法使用语速、情绪调节等控件,我们只能通过标点符号去改变语音效果,比如使用,、……。!等等标点符号,有时会叠加不同标点符号,去试它的语音效果。
🔗 https://x.com/xiaohuggg/status/1763819660779405331?s=204⃣️🎵OpenAI的音乐生成模型:Jukebox3年前推出,即将发布Jukebox 2基于1.2百万首歌曲的数据集训练能根据歌词、艺术家和流派信息生成音乐和人声歌曲🔗演示列表:https://soundcloud.com/openai_audio🔗项目地址:https://openai.com/research/jukebox🔗 https://x.com/xiaohuggg/status/1763775026040590531?s=205⃣️🎮@CSM_ai:文本、图像或草图转换为3D素材直接应用于游戏中,无需后期处理视频演示了在ROBLOX游戏中的应用🔗体验地址:https://cube.csm.ai🔗 https://x.com/xiaohuggg/status/1763758877999587757?s=206⃣️🌍Sailor:东南亚国家定制的语言模型基于Qwen 1.5,覆盖7种语言从0.5B到7B不同大小版本,适应不同需求在SEA语言的多种任务上表现出色🔗项目:https://sailorllm.github.io🔗 https://x.com/xiaohuggg/status/1763753689108627960?s=20