主页:python_speech_features
百度百科:MFCC
MFCC原理详解:MFCC特征提取教程
参考:python_speech_features文档翻译
def mfcc(signal,samplerate=16000,winlen=0.025,winstep=0.01,numcep=13,
nfilt=26,nfft=512,lowfreq=0,highfreq=None,preemph=0.97,
ceplifter=22,appendEnergy=True)
MFCC特征向量描述了一帧语音信号的功率谱的包络信息,但是语音识别也需要帧之间的动态变化信息,比如MFCC随时间的轨迹,实际证明把MFCC的轨迹变化加入后会提高识别的效果。因此我们可以用当前帧前后几帧的信息来计算一阶差分系数和二阶差分系数,计算第t帧的Delta需要t-N到t+N的系数,N通常是2。:
def python_speech_features.base.delta(feat, N)