Kaldi语音识别学习笔记(一)

        新开通的CSDN博客。对工作和学习中的一些东东和大家一起分享,欢迎指点。闲话不多说。

        之前搞了一段时间htk语音识别,现在流行kaldi,自己也开始学习一下,在分享的过程中,如果我的理解不对,请多多指教,谢过各位了。

        先提供一下kaldi开源代码路径 https://github.com/kaldi-asr/kaldi;相关文档 http://kaldi-asr.org/doc/。如果英语不是特别好的话,建议看下大牛的博客http://blog.csdn.net/wbgxx333,里面讲解的很透彻,可以简单跑个例子测试一下,体会一下kaldi的功能。

       2017年7月7日,由于忙其它事情,kaldi学习刚开始就被打断了。今天测试了timit实例,具体操作网上说明比较多,测试过程中出现了几个问题,感觉网上解释的不够清楚。

    问题1:

    总是报如下错(找不到测试数据):timit_data_prep.sh: Spot check ofcommand line argument failed Command line argument must beabsolute pathname to TIMIT directory

with name like /export/corpora5/LDC/LDC93S1/timit/TIMIT。

查询资料,网上给出的答案:

解决:修改run.sh 中的 timit=/export/corpora5/LDC/LDC93S1/timit/TIMIT,使他指向你的数据位置。问题没有描述清楚,实际是解压timit.rar后,数据存放的绝对位置路径(从根目录开始)。即:

#timit=/export/corpora5/LDC/LDC93S1/timit/TIMIT# @JHU

timit=/home/hlc/share/kaldi/egs/timit/data。

   问题2:

                   

   这个问题解决原创 http://blog.csdn.net/wujianhaoren123/article/details/51276203

怎么回事呢?因为这个例程建立语言模型是用irstlm工具建立的,但是在最新版本的kaldi里面,irstlm不是默认编译的。所以我们先得自行编译irstlm

首先进入kaldi目录下的tools/extras目录,执行install_irstlm.sh脚本。安装完成以后,目录下出现irstlim目录。由于timit例程里面的引用irstlm工具的路径是tools目录,所以把这个目录拷贝到tools/目录下。回到egs/timit/s5目录,执行./run.sh脚本,于是timit例程就跑起来了。

  特别注意的情况是:在tools/extras生成irstlm文件夹后,一定要将其拷贝到tools目录下,我之前就是没注意看,导致一直报错误,这样就可以运行timit实例了。


你可能感兴趣的:(语音识别)