Chat with Wiki - 开源音频质量检测模型有哪些？

Answer

以下为一些开源音频质量检测模型：

此外，还有：

VALL-EX：一个开源的多语言文本到语音合成与语音克隆模型。它支持多种语言（英语、中文和日语）和零样本语音克隆，具有语音情感控制和口音控制等高级功能。
智谱·AI 自 2019 年成立以来推出并开源的多款模型，具体可参考智谱·AI 开源模型列表。但请注意，Token 数代表了模型支持的总 Token 数量，包括了输入+输出的所有 token，且一个 token 约等于 1.8 个汉字。

Content generated by AI large model, please carefully verify (powered by aily)

References

[title]模型（Models）[heading2]概述我们还发布了开源模型，包括[Point-E](https://github.com/openai/point-e)，[Whisper](https://github.com/openai/whisper)，[Jukebox](https://github.com/openai/jukebox)和[CLIP。](https://github.com/openai/CLIP)访问[供研究人员的模型索引](https://platform.openai.com/docs/model-index-for-researchers)详细了解我们的研究论文中介绍了哪些模型以及InstructGPT和GPT-3.5等模型系列之间的差异。

Han：基于现有能力项目应用的思考

[title]Han：基于现有能力项目应用的思考|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间| |-|-|-|-|-|-|-|-|-|-|-|-|-|-| |VALL-EX：一个开源的多语言文本到语音合成与语音克隆模型。|这个和19年百度地图发布的语音定制功能使用的meitron模型很像。这个功能现在依然在百度地图提供的功能里，用户只需在百度地图App上录制20句话、20分钟左右即可生成个人完整语音包。|语音|该模型支持多种语言（英语、中文和日语）和零样本语音克隆，你只需要提供一个人短短几秒钟的录音（3-10秒），就能模仿出那个人的声音。此外，它还具有语音情感控制和口音控制等高级功能。 同时相对于其他模型，它更轻量、更快速... VALL-EX最初由微软发布。但并未发布任何代码或预训练模型。作者认识到了这项技术的潜力和价值，复现并训练了一个开源可用的VALL-E X模型。|VALL-E X模型具有以下显著的功能特点： 1.多语言TTS（文本到语音合成）:支持英语、中文和日语，能进行自然和富有表现力的语音合成。 2.零样本语音克隆

智谱·AI 开源模型列表

[title]智谱·AI开源模型列表[智谱·AI开源模型列表](https://zhipu-ai.feishu.cn/wiki/YInmwPmyii67VRkzU3BchPNzncg)自2019年成立以来，智谱AI致力于大模型技术的研究和推广工作。在2023年，我们推出并开源了多款模型（如上图所示），它们具有不同的能力，开发者可以对这些模型进行使用和定制。本文档将列出相关模型及链接，方便开发者查阅。请注意：Token数代表了模型支持的总Token数量，包括了输入+输出的所有token。同时，Token数不代表用户输入字符的数量。在我们的模型中，一个token约等于1.8个汉字。