[Kaldi] 查看不同文件

20190108 qzd


1. ark,scp文件

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark,t:-|head

ark存的试二进制文件,scp可以直接用cat命令看。

2. fst文件

~/kaldi/tools/openfst-1.6.2/bin/fstprint L.fst | head -n 10

~/kaldi/tools/openfst-1.6.2/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L.fst | head -n 15

fstdraw [--isymbols=phones.txt --osymbols=words.txt] L.fst | dot –Tps | ps2pdf – L.pdf
~/kaldi/tools/openfst-1.6.2/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt HCLG.fst

3. mfcc 生成的文件

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_test_hires.1.ark ark,t:- | head
在文件前边加ark关键字,告诉copy-feats是什么格式的,还有后面加一个ark,t:- 表示输出格式为t文本,否则默认是二进制。

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark:- |~/kaldi/src/featbin/add-deltas ark:- ark,t:- | head
这样可以看到40维的数据

4. mdl文件

~/kaldi/src/gmmbin/gmm-copy --binary=false 0.mdl -

5. tree文件

~/kaldi/src/bin/copy-tree --binary=false tree -

~/kaldi/src/bin/draw-tree ../../data/lang/phones.txt tree | dot -Gsize=50,100 -Tps|ps2pdf - tree.pdf

6. ali.1.gz 对齐文件

~/kaldi/src/bin/copy-int-vector "ark:gunzip -c ali.1.gz|" ark,t:- |head -n 1

可以先解压 gunzip ali.1.gz
然后 ~/kaldi/src/bin/show-alignments ../../data/lang/phones.txt 40.mdl ark:ali.1 |head -n 2
可以看到类似于这种

7. raw文件

nnet3-info

nnet3-copy --binary=false init.raw xx

8. ubm

gmmbin/gmm-global-copy --binary=false exp/diag_ubm/final.dubm xxx

fgmmbin/fgmm-global-copy --binary=false exp/full_ubm/final.ubm xxx

9. vad

./../../../../src/bin/copy-vector ark:vad_train.1.ark ark,t:- > vad_train1.txt

./../../../../src/featbin/copy-feats ark:raw_mfcc_train.1.ark ark,t:- > raw_mfcc_train1.txt

nnet3-copy-egs 查看egs.1.ark

你可能感兴趣的:([Kaldi] 查看不同文件)