librispeech 的train-clean-100--简单记录笔记

  1. LibriSpeech :
    1. 是一个阅读语音语料库,基于 LibriVox 的公共领域有声读物。 其目的是实现自动语音识别 (ASR) 系统的训练和测试
    2. 语料库被分成了一些子集,名称中带有“clean”的子集被认为比其他音频和美国英语口音更“干净”(至少平均而言)。 该分类是使用非常粗糙的自动化手段获得的,不应被认为是完全可靠的。 子集是不相交的,即每个说话者的音频都被分配给一个子集。
    3. 语料库的架构:
      * dev-clean, test-clean - 包含“干净”语音的开发和测试集。
      
      * train-clean-100 - 训练集,大约 100 小时的“干净”语音
      
      * train-clean-360 - 训练集,大约 360 小时的“干净”语音
      
      * dev-other, test-other - 开发和测试集,语音被自动选择为更具“挑战性”的识别
      
      * train-other-500 - 大约 500 小时的训练集,包含未被归类为“干净”的语音
      
      * intro - subset  仅包含一些读者的 LibriVox 介绍免责声明的子集
      
      * mp3  - 语料库所基于的原始 MP3 编码音频
      
      * texts - 语料库中音频所对应的文本
  2. train-clean-100的目录架构:

librispeech 的train-clean-100--简单记录笔记_第1张图片librispeech 的train-clean-100--简单记录笔记_第2张图片

  1. 19:说话人id
  2. 198:说话人阅读的文章章节
  3. *.flac:音频
  4. 19-198.trans.txt:包含来自相应章节的文本

你可能感兴趣的:(dataset,语音识别,人工智能)