将运行Kaldi上timit实例的一些注意事项及结果贴出来
win7+ubuntu12.10双系统
CPU: i7-2600
内存:8G
显卡:AMD Radeon HD6450
修改:path.sh: KALDI_ROOT=/home/cdj/kaldi-trunk
修改:cmd.sh: 使用c部分
修改run.sh的MMI+SGMM2阶段的参数: 将--zero-if-disjoint改为--drop-frames
在SGMM2以后需要的内存稍大,最好有8G以上,最好有GPU,这样能快一些。我从开始到MMI+SGMM2,一共耗时1小时40分钟,然后在DNN阶段耗时2小时,DNN+SGMM耗时20分钟,总共耗时差不多4小时左右,如果有GPU应该会快很多。下面贴出每阶段得到的识别结果。
/******************** Monophones ************************/
%WER 34.21 [ 2468 / 7215, 165 ins, 851 del, 1452 sub ] exp/mono/decode_test/wer_3
/******************** tri1 ************************/
%WER 30.33 [ 2188 / 7215, 322 ins, 552 del, 1314 sub ] exp/tri1/decode_test/wer_5
/******************** tri2 ************************/
%WER 27.32 [ 1971 / 7215, 254 ins, 573 del, 1144 sub ] exp/tri2/decode_test/wer_6
/******************** tri3 ************************/
%WER 25.47 [ 1838 / 7215, 259 ins, 540 del, 1039 sub ] exp/tri3/decode_test/wer_4
%WER 27.83 [ 2008 / 7215, 198 ins, 632 del, 1178 sub ] exp/tri3/decode_test.si/wer_7
/******************** SGMM2 ************************/
%WER 23.01 [ 1660 / 7215, 212 ins, 492 del, 956 sub ] exp/sgmm2_4/decode_test/wer_4
/******************** MMI+SGMM2 ************************/
%WER 22.83 [ 1647 / 7215, 211 ins, 477 del, 959 sub ] exp/sgmm2_4_mmi_b0.1/decode_test_it1/wer_6
%WER 22.73 [ 1640 / 7215, 171 ins, 543 del, 926 sub ] exp/sgmm2_4_mmi_b0.1/decode_test_it2/wer_9
%WER 22.61 [ 1631 / 7215, 303 ins, 371 del, 957 sub ] exp/sgmm2_4_mmi_b0.1/decode_test_it3/wer_5
%WER 22.48 [ 1622 / 7215, 310 ins, 360 del, 952 sub ] exp/sgmm2_4_mmi_b0.1/decode_test_it4/wer_5
/******************** DNN ************************/
%WER 24.21 [ 1747 / 7215, 146 ins, 621 del, 980 sub ] exp/tri4_nnet/decode_test/wer_4
/******************** DNN+SGMM ************************/
%WER 21.94 [ 1583 / 7215, 190 ins, 499 del, 894 sub ] exp/combine_2/decode_test_it1/wer_4
%WER 21.84 [ 1576 / 7215, 243 ins, 418 del, 915 sub ] exp/combine_2/decode_test_it2/wer_3
%WER 21.73 [ 1568 / 7215, 194 ins, 473 del, 901 sub ] exp/combine_2/decode_test_it3/wer_5
%WER 21.79 [ 1572 / 7215, 200 ins, 460 del, 912 sub ] exp/combine_2/decode_test_it4/wer_5
DNN+SGMM的效果还是不错的,后来又试了一下把DNN那步改为nnet2(原为nnet),但是效果稍微有点下降,可能是参数设置有问题,继续捣鼓吧。