以下是一些语音转文字的 API 或应用:
语音转文本API提供了两个端点,即基于我们最先进的开源大型-v2 Whisper模型的转录和翻译。它们可以用于:将音频转录为任何语言。将音频翻译并转录成英语。目前文件上传限制为25 MB,并支持以下输入文件类型:mp3、mp4、mpeg、mpga、m4a、wav和webm。
语音转文字推荐OpenAI的wishperhttps://huggingface.co/openai/whisper-large-v2语音转文字:一分钟搞定的~ 23分钟的音频https://huggingface.co/spaces/sanchit-gandhi/whisper-jax这个项目在JAX上运行,后端支持TPU v4-8。与A100 GPU上的PyTorch相比,它要快70多倍,是目前最快的Whisper API。
1.接口描述接口请求域名:https://open.mobvoi.com/api/tts/v1接口请求频率限制:5次/秒出门问问语音合成技术(TTS)可以将任意文本转化为语音,实现让机器和应用张口说话。出门问问TTS技术可以应用到很多场景,例如,在视频APP中作为配音解说;小说App完成有声阅读,移动App语音播报新闻;智能设备语音提醒;车载导航语音合成的个性化语音播报等。出门问问TTS服务提供了普通话、台湾腔、粤语、四川话、东北话等多种方言,数百个发音人,上千种风格,满足客户在不同场景的选择需求。实时合成支持SSML,语法详见SSML标记语言。1.请求参数HTTP Method:支持POST请求调用参数及说明: