数据集说明文档

1. thu30–清华30h的中文测试数据

http://www.openslr.org/18/
数据集说明文档_第1张图片
30个中文说话者,识别数据集,包括22个女性说话者和8个男性说话者

male A5、A8、A9、A33、 A35、B8、B21、D8
female 其余的
2. VCTK

109个说话者,每个人大概400条句子,native english speaker,读报纸
所有记录都转换为16位,根据STPK下采样到48 kHz
http://homepages.inf.ed.ac.uk/jyamagis/page3/page58/page58.html

selected10–

female 229、240、248、249、253
male 241、245、246、251、255

数据集说明文档_第2张图片
数据集说明文档_第3张图片
共计male—46
female—62

3. arctic

数据集下载链接 http://festvox.org/cmu_arctic/packed/

male aew, ahw, aup, awb, ksp, rms, rxr,bdl
female axb, eey, ljm, slp, slt

其中aew/eey有麦克风的电流声,在频谱上可以看到稳定的背景噪声,尤其是在静音段

4.timit

来自美国的630人,来源于美国八个主要方言地区,因此带有不同的口音,每人说10句话,一共包含6300个句子。所有的句子都在音素级别(phone level)上进行了手动分割,标记。70%的说话人是男性;大多数说话者是成年白人。

5. libri-speech

下载目录http://www.openslr.org/12
为tts任务从librispeech中挑选的语音,信噪比基本在20db以上
数据集说明文档_第4张图片

6. AISHELL-1

340个说话人, male-161, female-179
成都

回声

https://www.openslr.org/28/

你可能感兴趣的:(语音预处理)