【meta-mms-tts+uroma encoding】Scaling Speech Technology to 1,000+ Languages
nvidia-NeMo包含TTS的模型,开源数据uroma转写工具介绍uroman转写工具N-to-Mmapping转写的规范,包含一些中文-拼音,拉丁文-读法的规则转换。字符串匹配规则下的查字典;将字母对应到发音单元转写规范转写过程尽量做到可逆映射;忽略变音符号,比如ou‘ou`ou‘和ououou,转写结果是一样的;不会对缺乏原音的文本进行元音化数字,除了0-9一一进行阿拉伯数字的对应,还会对