汽车鸣笛声、雨声和警笛声的频谱分析

        

                                              声音频谱分析

  1. 实验内容

       本次实验将通过matlab绘制各种声音的频谱图去推算其频谱范围。其各种声音来源于ESC-50声音集,其采样频率为44.1KHz,采样位数为16位,时长,音频格式为WAV。

  1. 种声音的频谱分析
    1.  汽车鸣笛声

         对声音库中的两段汽车鸣笛声进行频谱分析,然后对其采样率进行降采样然后再分析其频谱变化。首先听一下鸣笛声1鸣笛声2,然后查看其时域波形和频谱图如下图。

汽车鸣笛声、雨声和警笛声的频谱分析_第1张图片

                                                                                图2.1 汽车鸣笛声的频谱

汽车鸣笛声、雨声和警笛声的频谱分析_第2张图片

                                                                                图2.2 汽车鸣笛声时域图

       从上面频谱图可以看出来,鸣笛声1的频率最高能达到19KHz,而鸣笛声2的频率最高能达到16KHz,其相同之处在鸣笛声频率以一定间隔重复出现。而从时域波形来看,很明显鸣笛声1为被截断,而鸣笛声2被以某种方式截断了,这应该是鸣笛声2频谱频率未达到19KHz的原因。2原因:按键按的方式、移动中录制、采样频率

然后我们对鸣笛声1进行降采样为8KHZ,然后听一听鸣笛声1的声音变化。最后看其频谱图如下。

 

汽车鸣笛声、雨声和警笛声的频谱分析_第3张图片

                                                                     图2.3 鸣笛声1降采样后与原声的对比频谱

       从上图中可以看出,被降采样到8K之后的鸣笛声频谱只保存到4KHz,不仅丢失了4KHz之外的频谱细节,而且在0.7s后的频谱也丢失了。其对分类影响还需要以后验证。虽然频谱被降采样到4KHz,但是人耳还是能辨别出其声音,可见仅仅鸣笛声的特点用其对频率的变化并不敏感,我们需要寻找除频谱之外的特征来用于分类。

    1. 雨声


我同样在ESC-50声音集中寻找到三条雨声用来分析频谱,首先听一下,雨声1雨声2雨声3,然后观察其频谱和时域波形,如下图。

汽车鸣笛声、雨声和警笛声的频谱分析_第4张图片

                                                                                    图2.4 雨声频谱图

汽车鸣笛声、雨声和警笛声的频谱分析_第5张图片
 

图2.5 雨声时域图

               通过上面频谱图可以看出,雨声1频谱只能达到8KHz,而雨声2和雨声3均能达到16KHz,且其在频谱范围内,功率分布均匀如同白噪声。从这三个频谱图中还可以看出,其在最高频处截断的很平整,所以猜测录制雨声的机器并没有采用44.1KHz的采样率,而是后来经过了解释采样才达到44.1KHz的采样率。为此,我将雨声2进行降采样到16KHz,然后保存到rain1_resample,然后观察其频谱图和时域波形,见下图。

汽车鸣笛声、雨声和警笛声的频谱分析_第6张图片

                                                                    图 2.6 雨声降采样前后频谱对比图

汽车鸣笛声、雨声和警笛声的频谱分析_第7张图片

                                                                   图2.7 雨声降采样前后时域波形对比图

从上面频谱对比图可以看出,降采样之后的频谱范围限制在8KHz之内,而且其功率谱密度变小了。其时域波形变化并不大,仅仅有些数据没有采到。

    1. 消防车警报和警车警报


   我对消防车警报警车警报进行了分析,其频谱图与时域波形如下图。

图2.7 消防车与警车的警报频谱图

汽车鸣笛声、雨声和警笛声的频谱分析_第8张图片

                                                                    图2.8 警车与消防车警报的时域波形图

     从上面警车与消防车的频谱图可以看出,其基频与谐振频率区分度很高,而且警车的频率从600Hz到1.4KHz之间随时间线性变化,而消防车从600Hz到1.2KHz之间随时间缓慢变化。对于这类声音可以根据基频来作为特征进行分类。

  1. 总结

        通过上述实验认识到,对于不同的声音,对其进行降采样会影响到其音色,即谐波分量,使其丢失声音的高频细节,在一定范围内不会影响到人耳对他的识别,但在频谱成分上就会出现有很大的差别。

        通过查阅资料以及对这些实验分析可以估计,32KHz的采样率已经可以比较完整的保存声音的完整度了,因此在实际的声音采集设备中采用32KHz的采样率即可。

(如有错误,请批评指正)

 

你可能感兴趣的:(声学特征总结)