以下是一些国内的声音克隆相关软件和资源:
开源的声音克隆软件有:
商业的声音克隆产品有:
[title]境内深度合成服务算法备案清单(2023年6月)3年6月)供参考|序号|算法名称|角色|主体名称|应用产品|主要用途|备案编号|<br>|-|-|-|-|-|-|-|<br>|30|酷狗音乐语音克隆算法|服务提供者|广州酷狗计算机科技有限公司|酷狗音乐(APP)|应用于音频生成场景,基于用户录音数据,提取用户音色特征,生成与用户音色一致的音频信息。|网信算备440106592132901230019号|<br>|31|酷狗音乐歌声合成算法|服务提供者|广州酷狗计算机科技有限公司|酷狗音乐(APP)|应用于音频生成场景,基于用户歌唱录音数据,提取用户音色特征,制作歌曲。|网信算备440106592132901230027号|<br>|32|音书语音识别算法|服务提供者|广州音书科技有限公司|音书(APP)|应用于语音转文字场景,识别实时录音数据,生成识别后的文本信息。|网信算备440113773328701230015号|<br>|33|秀脸FacePlay人脸融合算法|服务提供者|深圳市鹏中科技有限公司|秀脸FacePlay(APP)|应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合后的人脸图像、视频。|网信算备440304083805101230015号|<br>|34|腾讯云人脸融合算法|服务技术支持者|深圳市腾讯计算机系统有限公司|--|应用于人脸图像、视频生成场景,服务于图像、视频编辑类的企业端客户,通过API提供用户面部特征融合功能。|网信算备440305295988701230013号|文件格式:
来自倪小末开源:1.GPT-SoVITS:https://github.com/RVC-Boss/GPT-SoVITS对中、英、日语言支持良好,需要10分钟左右干素材,瞬时clone功能未开放。1.OpenVoice:https://github.com/myshell-ai/OpenVoice对中文支持较好,主打瞬时clone,发展势头良好,一个月前测试时中文声音clone有英语味道。[heading2]商业的产品:[content]1.ElevenLab:https://elevenlabs.io支持最多语言种类,支持瞬时clone,综合效果最好,本人是22$每月的订阅用户,已用于内部配音产品。1.Reecho:https://reecho.ai中国团队,支持长音频和瞬时声音clone,据说与火山引擎的声音clone技术同源。1.自得语音:https://zideai.com中国团队,支持瞬时声音clone和声音定制,尚未测试。1.DiD:[heading2]刚刚有小伙伴说希望有个语音训练的交流,建了一个方便交流[heading2]欢迎补充内容,可以提交在评论区
[title]GPT-SoVITS实现声音克隆GPT-SoVITS:只需1分钟语音即可训练一个自己的TTS模型。GPT-SoVITS是一个声音克隆和文本到语音转换的开源Python RAG框架。5秒数据就能模仿你,1分钟的声音数据就能训练出一个高质量的TTS模型,完美克隆你的声音!根据演示来看完美适配中文,应该是目前中文支持比较好的模型。界面也易用。主要特点:1、零样本TTS:输入5秒的声音样本即可体验即时的文本到语音转换。2、少量样本训练:只需1分钟的训练数据即可微调模型,提高声音相似度和真实感。模仿出来的声音会更加接近原声,听起来更自然。跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。3、易于使用的界面:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具,帮助初学者更容易地创建训练数据集和GPT/SoVITS模型。4、适用于不同操作系统:项目可以在不同的操作系统上安装和运行,包括Windows。5、预训练模型:项目提供了一些已经训练好的模型,你可以直接下载使用。GitHub:[https://github.com/RVC-Boss/GPT-SoVITS](https://t.co/BpHX4SlsO3)[…](https://t.co/BpHX4SlsO3)视频教程:[https://bilibili.com/video/BV12g4y1m7Uw/](https://t.co/Uo7WtSSUGO)[…](https://t.co/Uo7WtSSUGO)file:[twi]@小互(@_twi(1).mp4使用: