梅尔倒谱系数matlab,科学网—声学信号处理基础最佳入门(译):(一)梅尔频率倒谱系数(MFCC) - 洪峰的博文...
任何自动语音识别系统的第一步是提取特征,即识别音频信号的组成部分,这些组成部分有助于识别语言内容,并丢弃所有其他携带的诸如背景噪声、情绪等信息的东西。理解语音的要点是人类产生的声音被声道的形状过滤,包括舌头,牙齿等。这种形状决定了声音是什么样的。如果我们能够准确地知晓该形状,我们就能准确地表示其产生的音素(phoneme)。声道的形状以短时功率谱的包络的形式表现出来,而MFCC的作用就是是准确表示