Kaldi学习笔记:跑tidigits样例

1、语料库----TIDIGITS(LDC93S10)

这个语料库分为Adults和Chidlren两部分


里面均有TIDIGITS子目录


TIDIGITS子目录中有TEST和TRAIN数据


TEST和TRAIN目录下分别有按照性别和说话人分类的WAV文件,是我们需要的训练和测试数据。接下来要使用Kaldi下egs中的tidigits样例来处理这些数据。



2、跑样例

#=======# 第一个要注意的地方:脚本中test train tidigits这些目录名称全是小写字母,所以先把语料库中的那些大写的目录名称全修改为小写。

打开run.sh脚本,将此处改为语料库的路径


因为后面脚本的处理中,直接的下级目录是tidigits,所以路径要写到Adults这一层,也就是只处理Adults的数据,根据后面的脚本中定义的数据量8623,也证实了这个脚本只对Adults数据做处理。如果想要加上Children的数据一起处理,需要把Adults和Children的tidigits目录合并,然后修改脚本中定义的数据量为12549.

Kaldi学习笔记:跑tidigits样例_第1张图片

#=======# 之后还有个bad line的报错,需要把这里的-name改成-iname,或者将wav改为大写WAV


#=======# 正则表达式中也有很多大小写的问题需要修改,主要是Z、O、A、B、WAV


#=======# 接下来报错缺少topo.proto文件,这是一个定义state和transition cost的文件,可以去别的样例中拷贝一个到conf目录下(比如timit的s3中)。


#=======# 因为我是在本地跑的,不是在集群上跑的,所以还需要修改cmd.sh中的定义。

run.sh中输出结果的几行命令被注释掉了,去掉注释后可以去exp中查看结果,setence错误率有40%多。还是大小写的问题。

#=======# 可以去修改tidigits_prepare_lang.sh文件中的Z、O的大小写问题

这样最终的运行结果错误率在3%的样子,跟标准结果差不多,算是正确运行了一遍。


你可能感兴趣的:(Kaldi学习笔记:跑tidigits样例)