音频信号处理——基音周期

音频信号处理——基音周期

标签(空格分隔): 音频处理

一、简介

1.1 什么是基音?什么是基音周期

基音顾名思义就是声音的基础。这里我们主要讨论人的发声,根据声带震动的方式的不同,将声音信号分为清音和浊音。其中浊音需要声带周期性震动,所以具有明显的周期性,这种声带振动的频率称为基音频率,相应的周期就成为基音周期。但清音没有明显的周期性。

通常,基音频率与个人的声带的结构有很大的关系,所以基因频率也能用于识别发音源。一般来说,男性说话者的基音频率较低,而女性说话者和小孩的基音频率相对较高,就是通常说的“男的声音高,女的声音低”。基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。

基因周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码、语音识别和说话人确认等领域都有着广泛而重要的问题,尤其对汉语更是如此。此处省略对汉语识别的突出贡献。

1.2 主要方法

到目前为止,基音检测的方法大致上可以分为三类:

1)时域法,直接由语音波形来估计基音周期,常见的有:自相关法、并行处理法、平均幅度差法、数据减少法等;

2)频域法,它是一种将语音信号变换到频域来估计基音周期的方法,首先利用同态分析方法将声道的影响消除,得到属于激励部分的信息,然后求取基音周期,最常用的就是倒谱法,这种方法的缺点就是算法比较复杂,但是基音估计的效果却很好;
3)混合法,先提取信号声道模型参数,然后利用它对信号进行滤波,得到音源序列,最后再利用自相关法或者平均幅度差法求得基因音周期。

下面我们介绍三种基音周期监测方法:基于自相关的基音周期检测,基于倒谱的基音周期监测,基于线性预测编码的基音周期检测。

二、基于自相关的基音周期检测

2.1 自相关函数

能量有限的语音信号 x(n) 的短时自相关函数定义为:
R(m)=n=n=+x(n)x(n+m)
此公式表示一个信号 n 和延迟 m 的相似性。如果信号 x(n) 具有周期性,那么它的自相关函数也具有周期性,且周期与信号 x(n) 的周期相同。一般算法都是通过其自相关函数来获得信号周期。因为在周期的整数倍上,自相关函数能获得最大值。这种计算方式不需要考虑语音信号的起始时间,而从自相关函数的最大值就能获得。

2.2 短时自相关函数法

语音信号虽然具有一定的周期性,但是语音信号还是一种非稳态的信号,他的特性还是随时间变化而变化。所以我们将取一段声音片段,这个片段很短,我们可以假设,一个很短的时间段内,信号具有相对稳定的特征即短时平稳性。一般来说,这段时间取,5ms-50ms。

应注意的是这里的统计特性和频谱特性都是对短时段而言的。

能量有限的语音信号 s(n) 的短时自相关函数定义为:
Rn(τ)=m=0N1τ[s(n+m)w(m)

你可能感兴趣的:(声音处理,音频处理)