常用语音数据库

大多数语音识别数据集是专有的,因为这些数据对于创建该数据集的公司来说具有很大价值。因此,这部分的可用公开数据集多数比较陈旧。

【学术、陈旧】2000 HUB5 English:仅包含英语的语音数据集,百度最近的论文《深度语音:扩展端对端语音识别》使用的是这个数据集。
 

地址:https://catalog.ldc.upenn.edu/LDC2002T43
 

【学术】LibriSpeech:包含文本和语音的有声读物数据集,由近500小时的多人朗读的清晰音频组成,且包含书籍的章节结构。
 

地址:http://www.openslr.org/12/
 

【有用、学术】VoxForge:带口音的语音清洁数据集,对测试模型在不同重音或语调下的鲁棒性非常有用。
 

地址:http://www.voxforge.org/
 

【学术、经典、陈旧】TIMIT:英文语音识别数据集。
 

地址:https://catalog.ldc.upenn.edu/LDC93S1
 

【有用】CHIME:包含环境噪音的语音识别挑战赛数据集。该数据集包含真实、模拟和清洁的语音录音,具体来说,包括4个扬声器在4个有噪音环境下进行的将近9000次录音,模拟数据是将多个环境组合及在无噪音环境下记录的数据。
 

地址:http://spandh.dcs.shef.ac.uk/chime_challenge/data.html
 

TED-LIUM:TED Talk 的音频数据集,包含1495个TED演讲的录音及全文的文字稿。
 

地址:http://www-lium.univ-lemans.fr/en/content/ted-lium-corpus

你可能感兴趣的:(语音识别,ASR,语音识别,数据库)