Chat with Wiki - 在语音数据的标注中你有什么针对你行业（车载语音助手）的特殊标注规则

Answer

在车载语音助手这一行业的语音数据标注中，特殊标注规则如下：

音素覆盖：在录音开始前构建基础的文本前端，具备简单的文本转音素（G2P）系统。录音文本要保持多样性，音素或音素组合尽可能覆盖全，统计音素序列中的 N-Gram，避免某些音素或组合出现频次过高或过少。
场景定制：收集车载播报的常用话术、专业术语（如油量、胎压等）、音乐名或歌手名、地名和新闻播报。对业务有一定理解，并在一开始就和需求方紧密沟通。
文本正确性：确保录音文本拼写无误，内容正确，删除脏话、不符合宗教信仰或政治不正确的语句。

Content generated by AI large model, please carefully verify (powered by aily)

References

在一个语种的语音合成建设之初，就可以同步收集该语种对应的大文本。大文本不仅仅可以筛选录音文本，还可以从中提取词条、统计词频、制作词典、标注韵律、构建测试集等等。录音文本的选择一般遵循以下几个原则：1.音素覆盖。这就要求在录音开始之前，就需要构建起来一套基础的文本前端，最起码要有简单的文本转音素（G2P）系统。大部分语种的字符或者字符组合会有较为固定的发音，比如英语中的h总是会发[h]的音，o总是会发[eu]的音，如果找不到公开、即时可用的文本转音素系统，可以根据规则构建。用于录音的文本要保持多样性，音素或者音素组合要尽可能覆盖全，可以统计音素序列中的N-Gram，确保某些音素或者音素组合出现频次过高，而某些音素或音素组合又鲜少出现。2.场景定制。如果是通用语音合成，需要确保百科、新闻、对话、高频词、基数词和序数词等数字串、包含常用外来词（如包含英语单词）的句子要有所覆盖；如果是特定场景，比如车载领域，则可以收集车载播报的常用话术、专业术语（比如油量、胎压等）、音乐名或歌手名、地名和新闻播报，在特定场景下，需要对业务有一定的理解，并且在一开始就要和需求方紧密沟通。3.文本正确性。录音文本确保拼写无误，内容正确，比如需要删除脏话、不符合宗教信仰或政治不正确的语句等。