OpenSMILE 提取音频特征

环境:win7

工具:OpenSMILE-2.3.0


首先,要进入opensmile2.3.0文件包下的bin下Win32目录,然后输入提取OpenSmile特定的命令:SMILExtract_Release -C E:\opensmile-2.3.0\config\IS09_emotion.conf -I E:\BaiduNetdiskDownload\8375.wav -O E:\very\2.txt

这里说明一下,-C表示提取特征的配置文件,就是后面的conf文件,这里我用的官方给出的IS09_emotion.conf,当然这里配置文件可以自己编写,来实现提取需要的特征;-I (这里是大写字母I)表示后面的目录是输入的数据源; -O表示后面的是输出的特征文件的路径。

还有几点要说明,一般来说,音频文件要是wav,其他格式好像不支持;还有音频的格式最好小一点,太大的音频文件处理起来有点慢。


然后下面是处理的结果,没有Error就是可行的。提示MSG可以忽略

OpenSMILE 提取音频特征_第1张图片

因为我这个是10秒钟的音频,所以几乎一瞬间就在txt文件里有了结果。

OpenSMILE 提取音频特征_第2张图片

接下来,就是TANN神经网络处理 这个大矩阵了。待续。

注:没有opensmile文件包的同学可以私信我。

你可能感兴趣的:(音频处理)