kaldi简单使用笔记***

参考:

http://blog.csdn.net/foolsnowman/article/details/51115204

http://blog.csdn.net/quhediegooo/article/details/70941455

1 Kaldi安装

 git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
 cd kaldi-trunk
 cd tools/extras
 ./check_dependencies.sh
 ./install_irstlm.sh
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

2 Kaldi中的工具

特征提取

1.创建 lable_to_wav.scp

0 0.wav#格式为:[标签 /path/to/0.wav]
  • 1

2.提取特征

compute-mfcc-feats --use-energy=false --sample-frequency=8000 scp:lable_to_wav.scp ark:myfeats.ark 
# ‘scp:’,‘ark:’分别用来告诉kaldi输入文件格式为.scp,输出文件格式为.ark 
  • 1
  • 2

上述命令输出LOG (compute-mfcc-feats:main():compute-mfcc-feats.cc:181) Done 1 out of 1 utterances. 
,并生成包含特征的myfeats.ark 文件 
3.将有myfeat.ark生成对应的feat.scp

copy-feats ark:myfeats.ark ark,scp:feat.ark,feat.scp
#注意写入是必须是同时写入.ark和.scp文件,因为.scp中存储的索引后面的内容是指向.ark文件的指针
 cmp myfeats.ark feat.ark
 #没有输出,说明两个文件是相同的,否则将输出文件内容不同的位置
  • 1
  • 2
  • 3
  • 4

注:feat/feature-functions.h 包含了kaldi mfcc特征的默认配置。 
4.存成文本格式的命令为copy-feats ark:myfeat.ark ark,t:copy2.ark


你可能感兴趣的:(语音)