《语音信号处理》第三章总结——时域分析

3

1、语音信号特性:语音信号有时变特性,是一个非平稳的随机过程。但在一个短时间范围内其特性基本 保持不变,即语音的“短时平稳性”。

2、取样:所谓取样,就是以固定的时间间隔,将模拟信号的振幅记录下来。取样率经常取10 kHz

   量化:用固定数目的位来表示这些取样值。

 《语音信号处理》第三章总结——时域分析_第1张图片

3、反混叠滤波器(一个截止特性良好的低通滤波器,实际中做成一个带通滤波器100hz~3.4khz

预滤波的目的:

A.为了防止混叠失真和噪声干扰

B.为了防止50 Hz市电频率干扰

4、预加重——(深刻理解+记忆)

a) 原因:由于语音信号的平均功率谱受声门激励和口鼻辐射的影响,高频端大约在800 Hz以上按6dB/倍频程跌落,(造成高频端的信号信噪比到达不能容忍的程度)为此要在预处理中进行预加重(人为加重输入信号的高频分量)

b) 目的:提升高频部分,使信号的频谱变得平坦,以便于进行频谱分析或声道参数分析。

c) 位置:预加重可在A/D变换前的反混叠滤波之前进行,这样不仅能够进行预加重,而且可以压缩信号的动态范围,有效地提高信噪比。

5、能量分析:短时平均能量和短时平均幅度——(理解)


En的作用:反映出语音的能量或振幅随时间缓慢变化的规律。(浊音段能量比清音段大的多)

En的应用:

1)区分清音段和浊音段 ;

2)区分声母和韵母;

    3)区分无声和有声的分界(信噪比较高的信号)

4)区分连字的边界;        

5)用于语音识别

En的缺点:对高电平过于敏感,给加窗宽度的选择带来了困难。扩大了振幅不相等的任何两个相邻取样值(此处的取样值是指某语帧的短时平均能量值)之间的幅度差别,必须用较宽的窗函数才能平滑能量幅度的起伏。

为了使En能准确反映语音能量的时变规律:

- 数据窗w(n)或滤波器h(n)函数形式和宽度的选择相当重要


MnEn的对比:

窗口长度N对平均幅度函数的影响与短时平均能量的分析结果相同。

短时平均幅度的动态范围(最大值与最小值之比)比短时平均能量要小,实际上短时平均幅度的动态 范围接近于短时平均能量的平方根。

同样可以区分出清音和浊音,但二者的电平差不如短时能量那样明显。

在清音的范围内,MnEn二者的区别特别显著。

【过零:信号波形穿越时间轴或零值线;对于离散时间信号而言就是相邻的取样值符号改变。

平均过零率:单位时间(或单位样本)内过零的次数。浊音低、清音高、纯粹的噪音高】补充扩展内容

6、短时自相关函数:信号与延迟后信号之间相似性的度量

短时自相关函数应用:分析语音信号的同步性周期性

确定性信号序列自相关函数定义:


序列自相关函数的性质:

1) 若此序列是周期的(周期为Np),则R (k)=R (k + Np)

2) R (k)= R (-k)

3) R (0)≥│R (k)

4) R(0)等于确定性信号序列的能量或随机序列的平均功率

由性质1)3)可知浊音的自相关函数周期性出现峰值点,且周期为基音周期。

 《语音信号处理》第三章总结——时域分析_第2张图片

Rn(k)[x(n)x(n-k)*hk(n) 

短时自相关函数可看做序列[x(n)x(n-k)]通过单位函数响应为hk(n)的数字滤波器的输出 

《语音信号处理》第三章总结——时域分析_第3张图片

 《语音信号处理》第三章总结——时域分析_第4张图片

 

你可能感兴趣的:(语音信号处理)