如何克隆自己的声音-WayToAGI

回答

要克隆自己的声音，以下是一些常见的方法和相关信息：

使用 GPT-SoVITS：

前置数据获取处理：选择音频，开启切割；有噪音时进行降噪处理，降噪处理完成后开启离线 ASR。
GPT-Sowits-TTS：训练集格式化，包括一键三连和耐心等待；进行微调训练，开启 SoVITS 训练和 GPT 训练；进行推理，开始推理、刷新模型、选择微调后的模型。
成功标志：出现新的 URL 说明自己的声音微调完毕。

微软发布的 Personal Voice：

只需提供 1 分钟的语音样本，几秒钟内即可克隆该样本语音。
生成的 AI 语音支持中文、西班牙语、德语等多达 100 种不同语言的语音输出。
使用设备端机器学习技术，确保用户信息私密安全，与 LiveSpeech 无缝集成。
微软在生成的 AI 语音中增加了水印安全和认证措施，一种特殊的水印被添加到生成的语音中，以便用户和客户识别。
该功能将在西欧、美国东部和东南亚地区率先上线，并于 12 月 1 日上线公共预览版。

相关资源：

GPT-SoVITS 的 GitHub：https://github.com/RVC-Boss/GPT-SoVITS
视频教程：https://bilibili.com/video/BV12g4y1m7Uw/

希望以上内容对您有所帮助。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

GPT-SoVITS-实现 AIyoyo 声音克隆

1.[heading4]微调训练[content]1.开启SoVITS训练，&开启GPT训练[heading4]推理[content]1.开始推理-刷新模型-选择微调后的模型-yoyo[heading4]成功[content]出现新的URL，说明你自己的声音微调完毕，然后可以进行啦[heading3]四、声音复刻[heading4]开启声音复刻之旅吧[content]1.实现跨多语种语言的声音，不是梦[heading4]实践的样本[content]AIyoyo普通话-满江红[满江红普通话。wav](https://drive.weixin.qq.com/s?k=AJMA1Qc4AAwbkbzYu0AQ8AbQYrAGo)AIyoyo粤语版-满江红[满江红粤语。wav](https://drive.weixin.qq.com/s?k=AJMA1Qc4AAwsRaRfHrAQ8AbQYrAGo)[heading2]五、关于我[content]大家好～我是yoyo 🐱🐈坐标北京，铲屎官一枚🫡 AIGC的小白，持续进阶成长，致力于打造一个自己的智能体☕️以上期待能够给到各位一点启发感谢家属带我在“[通往AGI之路](https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e)”打开新世界，接触有趣的事情，结识有趣的人

GPT-SoVITS实现声音克隆

GPT-SoVITS：只需1分钟语音即可训练一个自己的TTS模型。GPT-SoVITS是一个声音克隆和文本到语音转换的开源Python RAG框架。5秒数据就能模仿你，1分钟的声音数据就能训练出一个高质量的TTS模型，完美克隆你的声音！根据演示来看完美适配中文，应该是目前中文支持比较好的模型。界面也易用。主要特点：1、零样本TTS：输入5秒的声音样本即可体验即时的文本到语音转换。2、少量样本训练：只需1分钟的训练数据即可微调模型，提高声音相似度和真实感。模仿出来的声音会更加接近原声，听起来更自然。跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语和中文。3、易于使用的界面：集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具，帮助初学者更容易地创建训练数据集和GPT/SoVITS模型。4、适用于不同操作系统：项目可以在不同的操作系统上安装和运行，包括Windows。5、预训练模型：项目提供了一些已经训练好的模型，你可以直接下载使用。GitHub：[https://github.com/RVC-Boss/GPT-SoVITS](https://t.co/BpHX4SlsO3)[…](https://t.co/BpHX4SlsO3)视频教程：[https://bilibili.com/video/BV12g4y1m7Uw/](https://t.co/Uo7WtSSUGO)[…](https://t.co/Uo7WtSSUGO)[[twi]@小互(@_twi(1).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RymsbKdweody4Cxwtsqc7Yuenxd?allow_redirect=1)使用：

Han：基于现有能力项目应用的思考

|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间||-|-|-|-|-|-|-|-|-|-|-|-|-|-||微软发布Personal Voice：你可以克隆自己的声音说任何语言。|一直觉得百度地图里用户设定自己专属导航语音和现在AI拟声非常像， 百度地图用的是Meitron，用户只需在百度地图App上录制20句话、20分钟左右即可生成个人完整语音包。|语音|你只需要提供1分钟的语音样本，它就可以在几秒钟内克隆该样本语音，复制出一模一样的AI语音。 生成的AI语音支持中文、西班牙语、德语等多达100种不同语言的语音输出。 Personal Voice使用设备端机器学习技术，确保用户信息私密安全，同时与LiveSpeech无缝集成，让用户可以在与其他人交流时使用Personal Voice AI语音说话。 微软在生成的AI语音中增加了水印安全和认证措施。 一种特殊的水印被添加到生成的语音中，以便用户和客户可以识别出语音是使用Azure AI Speech合成的，以及具体使用了哪种语音。 该功能将在西欧、美国东部和东南亚地区率先上线，并于12月1日上线公共预览版。|||||[https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/azure-ai-speech-launches-personal-voice-in-preview/ba-p/3982957](https://t.co/5U4OK58Etn)|||||2023/12/26|