语音识别等应用离不开音频特征的提取,最近在看音频特征提取的内容,用到一个python下的工具包——pyAudioAnalysis: An Open-Source Python Library for Audio Signal Analysis,该工具包的说明文档可以点击这里下载,对应的github链接点击这里。
这个工具包原说明文档支持的是Linux安装,且不能与python3很好地兼容,注意啦!
pyAudioAnalysis是一个音频处理工具包,主要功能如图:
其中Feature Extraction包括(顺序有先后):
补充说明一下:
34-Chroma Deviation:这个就是Chroma Vector的标准方差。
如果希望了解更多的音频特征,这里给出一个链接,点击这里,包含的特征有:
对应都有graph、sound可以点击,sound是对应的音频,graph对应的是特征的效果图。
pyAudioAnalysis对应链接点击这里。安装这个工具包需要依赖:
1、A-hmmlearn安装
hmmlearn的链接点击这里。安装hmmlearn有几个前提:
下载之后,把hmmlearn-master放在C:\Anaconda3\pkgs\python-3.6.4-h6538335_1\Lib目录,cmd窗口下cd进去,输入:
pip install -U --user hmmlearn
即可安装成功:
注:博主在这里这个包还未安装成功。解决办法请参照博主的另一篇博客。
2、B-Simplejson工具包安装:
Simplejson是Python的JSON编码和解码器,它具有简单、快速、完整、正确和易于扩展的特点,对应的链接点击这里。Simplejson工具包直接conda安装即可:
conda install simplejson
3、C-eyed3安装:
eyed3:A tool for working with audio files, specifically MP3 files containing ID3 metadata. 它提供了读写 ID3 标签(v1.x 和 v2.3/v2.4)的功能。同时可检测 MP3 文件的头信息,包括比特率、采样频率和播放时间等。eyed3直接conda install没有成功,对应的链接点击这里。选择了这个版本:
放在了python库的Lib文件夹下:C:\Anaconda3\pkgs\python-3.6.4-h6538335_1\Lib,cd到对应目录下,pip install 文件名.whl,即可完成安装。
4、D-pydub安装:
pydub是音频处理常用的工具包,例如:
打开一个wav格式文件:
from pydub import AudioSegment
song = AudioSegment.from_wav("never_gonna_give_you_up.wav")
我在github上下载对应的工具包,里边有对应的安装说明。
5、E-pyAudioAnalysis安装
Github给出的是linux下的安装思路,这里下载之后将pyAudioAnalysis放在了\Anaconda3\Lib\site-packages文件夹下,进入该文件夹C:\Anaconda3\Lib\site-packages\pyAudioAnalysis-master后输入指令:
pip install pyAudioAnalysis