Kaldi使用笔记

1 Kaldi安装

 git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
 cd kaldi-trunk
 cd tools/extras
 ./check_dependencies.sh
 ./install_irstlm.sh

2 Kaldi中的工具

特征提取

1.创建 lable_to_wav.scp

0 0.wav#格式为:[标签 /path/to/0.wav]

2.提取特征

compute-mfcc-feats --use-energy=false --sample-frequency=8000 scp:lable_to_wav.scp ark:myfeats.ark 
# ‘scp:’,‘ark:’分别用来告诉kaldi输入文件格式为.scp,输出文件格式为.ark 

上述命令输出LOG (compute-mfcc-feats:main():compute-mfcc-feats.cc:181) Done 1 out of 1 utterances.
,并生成包含特征的myfeats.ark 文件
3.将有myfeat.ark生成对应的feat.scp

copy-feats ark:myfeats.ark ark,scp:feat.ark,feat.scp
#注意写入是必须是同时写入.ark和.scp文件,因为.scp中存储的索引后面的内容是指向.ark文件的指针
 cmp myfeats.ark feat.ark
 #没有输出,说明两个文件是相同的,否则将输出文件内容不同的位置

注:feat/feature-functions.h 包含了kaldi mfcc特征的默认配置。
4.存成文本格式的命令为copy-feats ark:myfeat.ark ark,t:copy2.ark

你可能感兴趣的:(语音识别)