kaldi feature extraction

支持提取mfcc/plp特征,和HTK特征的主要差别在于默认参数值的设定。使用选项-htk-compat=true以及合适的参数,可以得到htk特征。

全局CMVN

compute-cmvn-stats

假设帧数为i,特征维度为j,cmvn计算得到两个矩阵:

(A1,A2,...,Aj,Aj+1)

(B1,B2,...,Bj)

Aj+1 表示总的帧数N
假设特征为 fij ,其中变量的计算公式如下:
Aj=ifij

Bj=if2ij

apply-cmvn

假设均值和方差分别是 Mj Vj ,特征 fj 经过CMVN归一化以后变成:

fj=fjMjVj

其中 MJ 表示均值, Vj 表示标准差:
Mj=AjN

Vj=BjNM2j

方差的计算展开可以得到:
Vj=i(fijMj)2N=if2ijNM2j

你可能感兴趣的:(kaldi)