群里的@卡丁王一直想用kaldi提自己想要的特征,但是他老是出现错误。我自己试验下,下面是具体流程,希望你有所收获。
首先,确保你的s5文件夹有conf local step utils文件夹。然后你把你的数据保存为test文件夹,比如test文件夹里有test1.wav test2.wav test3.wav。
然后,新建个data文件夹,data文件夹新建个test文件夹,这个test文件夹里需要三个文件:wav.scp utt2spk spk2utt。
Wav.scp可以这么写:
test1 test/test1.wav
test2 test/test2.wav
test3 test/test3.wav
Utt2spk可以这么写:
test1 global
test2 global
test3 global
Spk2utt可以这么写:
global test1 test2 test3
至此,都准备好了。
然后改下脚本。Run1.sh的内容为:
#!/bin/bash
train_cmd="utils/run.pl"
decode_cmd="utils/run.pl"
# Feature extraction
for x in test ; do
steps/make_mfcc.sh --nj 1 data/$x exp/make_mfcc/$x mfcc
done
最后运行脚本run1.sh即可。
最后你就得到你想要的特征了。怎么样,简单吧。let us continue……
此外,kaldi里的mfcc如何与htk里的mfcc转换?
在kaldi中,kaldi支持了copy-feats-to-htk来把kaldi里的mfcc转换为htk的mfcc。
至于,htk怎么转换为kaldi的?等待其他人公开吧。