Mel Frequency Cepstral Coefficient (MFCC)提取

MFCC提取:

opensmile工具箱

官方的opensmile文档提取的MFCC压根打不开,所以在此就需要该官方的配置文件,opensmile-2.3.0/config/MFCC12_0_D_A.conf

(官方的配置文件对提取的语音特征都有着详细的说明,每一个conf文件提取的特征都有所不同,根据自己需要来修改)

1、进入opensmile-2.3.0/bin/Win32后,按住shift键,再右击鼠标选择“在此处打开命令窗口(W)”

2、输入命令SMILExtract_Release -C C:\Users\HQ\Desktop\opensmile-2.3.0\config\MFCC12_0_D_A.conf -I F:\201.wav -O F:\mfcc.csv

对上述命令行解释一下:

SMILExtract_Release -C     这个部分不需要做任何改变

C:\Users\HQ\Desktop\opensmile-2.3.0\config\MFCC12_0_D_A.conf     这个是配置文件MFCC12_0_D_A.conf的路径

-I F:\201.wav   输入的语音样本, -I 不能少, 样本的路径可以根据自己的样本路径修改

-O F:\mfcc.csv   输入的特征值,  -O  B不能少, 特征值路径可以根据自己需要进行修改

上述已MFCC为例,其余的特征均可以修改配置文件(.conf)来获取相关的语音特征。

到此opensmile提取特征及基本结束。


注意在之前说过官方的MFCC配置文件MFCC12_0_D_A.conf提取的mfcc.csv无法打开,

修改后的MFCC12_0_D_A.conf地址:http://download.csdn.net/download/heqiang525/10155573

打不开:

Mel Frequency Cepstral Coefficient (MFCC)提取_第1张图片

Ok了:

Mel Frequency Cepstral Coefficient (MFCC)提取_第2张图片


你可能感兴趣的:((3)语音识别)