以下为一些开源音频质量检测模型:
此外,还有:
[title]模型(Models)[heading2]概述我们还发布了开源模型,包括[Point-E](https://github.com/openai/point-e),[Whisper](https://github.com/openai/whisper),[Jukebox](https://github.com/openai/jukebox)和[CLIP。](https://github.com/openai/CLIP)访问[供研究人员的模型索引](https://platform.openai.com/docs/model-index-for-researchers)详细了解我们的研究论文中介绍了哪些模型以及InstructGPT和GPT-3.5等模型系列之间的差异。
[title]Han:基于现有能力项目应用的思考|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间|<br>|-|-|-|-|-|-|-|-|-|-|-|-|-|-|<br>|VALL-EX:一个开源的多语言文本到语音合成与语音克隆模型。|这个和19年百度地图发布的语音定制功能使用的meitron模型很像。这个功能现在依然在百度地图提供的功能里,用户只需在百度地图App上录制20句话、20分钟左右即可生成个人完整语音包。|语音|该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。<br><br>同时相对于其他模型,它更轻量、更快速...<br><br>VALL-EX最初由微软发布。但并未发布任何代码或预训练模型。作者认识到了这项技术的潜力和价值,复现并训练了一个开源可用的VALL-E X模型。|VALL-E X模型具有以下显著的功能特点:<br>1.多语言TTS(文本到语音合成):支持英语、中文和日语,能进行自然和富有表现力的语音合成。<br>2.零样本语音克隆
[title]智谱·AI开源模型列表[智谱·AI开源模型列表](https://zhipu-ai.feishu.cn/wiki/YInmwPmyii67VRkzU3BchPNzncg)自2019年成立以来,智谱AI致力于大模型技术的研究和推广工作。在2023年,我们推出并开源了多款模型(如上图所示),它们具有不同的能力,开发者可以对这些模型进行使用和定制。本文档将列出相关模型及链接,方便开发者查阅。请注意:Token数代表了模型支持的总Token数量,包括了输入+输出的所有token。同时,Token数不代表用户输入字符的数量。在我们的模型中,一个token约等于1.8个汉字。