Unbuntu16.04+Kaldi本地运行thchs30语料(完整版)

之前已经写过如何源码安装Kaldi,在此不再赘述,直奔主题!


首先,准备清华语料

thchs30数据有两种,一种是HTK版,另一种就是Kaldi版。

Kaldi版下载地址 http://www.openslr.org/18/



然后,在Kaldi安装目录下,即/egs/thchs30/s5目录下修改脚本文件

(1)run.sh

第8行,修改n=20,此处根据自己的电脑cpu核数而定

第12行,修改thchs=/home/Michael/datasets/thchs30-openslr,此处根据自己语料数据所放位置而定

(2)cmd.sh

修改如下:

export train_cmd=run.pl
export decode_cmd=run.pl
export mkgraph_cmd=run.pl
export cuda_cmd=run.pl

此处表示本地运行

接着,就可以运行run.sh

对了,中间DNN模型部分需要GPU、CUDA,其安装方式请查看以前的博客。

最后,我的大概跑了一夜吧,反正第二天去看的时候已经跑完了。

有问题请指教。

你可能感兴趣的:(Unbuntu16.04+Kaldi本地运行thchs30语料(完整版))