以下是关于方言识别的相关信息:
在 AI 术语库中,与语音相关的术语有“Speech Recognition(语音识别)”。
语音转文本(Speech to text)支持的语言包括:南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚文、保加利亚文、加泰罗尼亚文、中文、克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英语、加利西亞語、德國語、希臘語、希伯來語、印地語、匈牙利語、冰岛语、印度尼西亚语、意大利语、日本语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语、毛里求斯语、尼泊尔语、挪威语、波斯语、波苏尼语、塔加洛语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语。
在模型方面,Whisper 是一种通用的语音识别模型,在不同音频的大型数据集上进行训练,是多任务模型,可执行多语言语音识别、语音翻译和语言识别。目前可通过 API(模型名 whisper-1)使用 Whisper v2-large 模型。Whisper 的开源版本和通过 API 提供的版本目前无区别,但 API 提供了优化的推理过程,运行速度更快。更多技术细节可阅读论文(https://arxiv.org/abs/2212.04356)。
嵌入(Embedding)是文本的数字表示,可用于衡量两段文本之间的相关性。第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 种第一代嵌入模型,可用于搜索、聚类、推荐、异常检测和分类任务。更多信息可在公告博客文章(https://openai.com/blog/new-and-improved-embedding-model)中阅读。
|术语ID|原文|译文|领域|易混淆|缩写|不需要提醒||-|-|-|-|-|-|-||ROW()-1|Spectral Clustering|谱聚类|AI|1||||ROW()-1|Spectral Radius|谱半径|AI|1||||ROW()-1|Speech Recognition|语音识别|AI|1||||ROW()-1|Sphering|Sphering|AI|1||||ROW()-1|Spike And Slab|尖峰和平板|AI|||||ROW()-1|Spike And Slab RBM|尖峰和平板RBM|AI|||||ROW()-1|Spiking Neural Nets|脉冲神经网络|AI|1||||ROW()-1|Splitting Point|切分点|AI|1||||ROW()-1|Splitting Variable|切分变量|AI|1||||ROW()-1|Spurious Modes|虚假模态(Spurious Modes)|AI|1||||ROW()-1|Square|方阵|AI|1||||ROW()-1|Square Loss|平方损失|AI|1|||
南非荷兰语,阿拉伯语,亚美尼亚语,阿塞拜疆语,白俄罗斯语,波斯尼亚文,保加利亚文,加泰罗尼亚文,中文,克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英語,加利西亞語,德國語,希臘語,希伯來語,印地語,匈牙利語,冰島icelandic読音:[ˈaɪsləndɪk],印度尼西雅Indonesian読音:[indoneˈsia],意大利Italian読音:[iːtæljən],日本Japanese読音:[dʒæpəniːz],卡纳达Kannada読音:[kʌn'na:dʌ],哈萨克Kazakh読音:[kɑzɑx],韩国Korean读作:[hanguk],拉脫維Latvian读作:[lætvijan],立陶宛Lithuanian读作:[liθu'einjən],马其顿Macedonian读作:[mækidouniən],马来Malay读作:['meilei],馬拉地Marathi讀作:[ma'rathi],毛里求斯Maori讀作:[mauri],尼泊尔Nepali讀作:[ne'pa:l],挪威Norwegian讀作:['no:wijiən],波斯Persian讀做[persi'an],波蘇尼Serbian讀做sǎrbijǝTagalog讀做tӕgӕ'lɔg,坦米爾Tamil讀做'tæmil,泰Thai讀做[tai],土耳其Turkish讀健[turki'sh],烏Crainian(乌克兰)Ukrainian讀健[jukreinjǝn],烏Urdu(乌尔都)Urdu讓你[u:
Whisper是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。目前可通过我们的API(模型名whisper-1)使用Whisper v2-large模型。目前,[Whisper的开源版本](https://github.com/openai/whisper)和通过我们的API提供的版本之间没有区别。但是,通过我们的API,我们提供了一个优化的推理过程,这使得通过我们的API运行Whisper比通过其他方式运行要快得多。有关Whisper的更多技术细节,您可以[阅读论文](https://arxiv.org/abs/2212.04356)。[heading2]嵌入(Embedding)[content]嵌入(Embedding)是文本的数字表示,可用于衡量两段文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002旨在以一小部分成本取代之前的16种第一代嵌入(Embedding)模型。嵌入(Embedding)可用于搜索、聚类、推荐、异常检测和分类任务。您可以在[公告博客文章](https://openai.com/blog/new-and-improved-embedding-model)中阅读有关我们最新嵌入模型的更多信息。