基于Python的语音信号处理(2)——基于语音信号的时域分析(分帧,短时能量分析,过零率)

摘要

语音信号的典型特征包括短时能量分析,过零率,短时自相关系数(下一个博客再说)等。实现语音信号的短时分析,首先实现加窗分帧就要。

分帧

一般来说假定语音信号在10ms到30ms之间是一个平稳的信号,窗函数平滑的在语音信号中滑动,来将语音信号分帧,分帧可以连续也可以交叠,一般来说都是交叠的方法,交叠的区间叫做帧移,一般来说为窗长的一半。
在本次例子中定义的窗函数为汉明窗与汉宁窗,大家可以自行更改参数和窗函数。
根据公式:
在这里插入图片描述
a代表两个窗函数的参数分别为0.46和0.5,N代表窗长,n的取值范围在0 到N-1之间,不再这个范围内,w(n)=0.
代码实现:

def Windows(width,parameter):##########width带
    function=np.zeros(width)
    for n in range(width):
        function[n]=(1-parameter)-parameter*np.cos((2*3.14*n)/(width-1))
    return function
hamming=Windows(512,0.46)
hanning=Windows(512,0.5)
plt.figure(0)
plt.plot(hanning)
plt.savefig("hanning.png",dpi=1000)
plt.figure(1)
plt.plot(hamming)
plt.savefig("hamming.png",dpi=1000)

这里有很多窗函数,我们就不一一实现了。
汉宁窗:
基于Python的语音信号处理(2)——基于语音信号的时域分析(分帧,短时能量分析,过零率)_第1张图片
汉明窗:
基于Python的语音信号处理(2)——基于语音信号的时域分析(分帧,短时能量分析,过零率)_第2张图片

分帧

代码实现:

def framing(audio_1,N,move):##################N代表帧长,move代表帧移
    framing=np.zeros(1)
    for i in range(0,len(audio_1),move):
        Calculation=np.zeros(N)
        print(len(audio_1[i:i+N]))
        if len(audio_1[i:i+N])==N:
            Calculation=audio_1[i:i+N]*hamming
            framing=np.append(framing,Calculation)
        else:
            Calculation=audio_1[i:i+N]*hamming[0:len(audio_1[i:i+N])]
            framing=np.append(framing,Calculation)
    return framing
x=framing(audio_1,512,256)
plt.plot(x)
plt.savefig("分帧.png",dpi=1000)

分帧后:
基于Python的语音信号处理(2)——基于语音信号的时域分析(分帧,短时能量分析,过零率)_第3张图片

短时能量分析

短时能量分析可以用来区分清音浊音,有声无声,声母韵母等等。其公式为:
在这里插入图片描述
x(n)为语音信号,w(n)为窗函数,在某些特定场合,公式变为:
在这里插入图片描述
代码实现:

def short_power_function_1(audio_1,N,choose):
    
    short_power=np.zeros(1)
    if choose==1:
        for i in range(0,len(audio_1),256):
            Calculation_1=np.zeros(N)
            print(len(audio_1[i:i+N]))
            if len(audio_1[i:i+N])==N:
                Calculation_1=audio_1[i:i+N]*hamming
                Calculation_1=Calculation_1*Calculation_1
                short_power=np.append(short_power,Calculation_1)
            else:
                Calculation_1=audio_1[i:i+N]*hamming[0:len(audio_1[i:i+N])]
                Calculation_1=Calculation_1*Calculation_1
                short_power=np.append(short_power,Calculation_1)
    else:
        for i in range(0,len(audio_1),256):
            Calculation_1=np.zeros(N)
            print(len(audio_1[i:i+N]))
            if len(audio_1[i:i+N])==N:
                Calculation_1=np.abs(audio_1[i:i+N])*hamming
                short_power=np.append(short_power,Calculation_1)
            else:
                Calculation_1=np.abs(audio_1[i:i+N])*hamming[0:len(audio_1[i:i+N])]
                short_power=np.append(short_power,Calculation_1)        
    return short_power
x1=short_power_function_1(audio_1,512,1)
x2=short_power_function_1(audio_1,512,0)
plt.figure(0)
plt.plot(x1)
plt.savefig("能量1.png",dpi=1000)
plt.figure(1)
plt.plot(x2)
plt.savefig("能量2.png",dpi=1000)

choose为1时为第一个公式,其他为第二个公式

过零率

过零率就是每一帧过零个数的统计,有的会设计门限。实现如下:

def zeros_count(audio_1,N,T):#########T代表门限

    def sgn(a,T):
   ##################定义一个判别函数,对输入数据a,大于T的定义为1,小于T的定义为-1
        if a>=T:
            return 1
        else:
            return -1
    
    count=np.zeros(1)
    
    for i in range(0,len(audio_1),256):
        Calculation=0
        if len(audio_1[i:i+N])==N:
            for j in range(N):
                Calculation_1=0.5*(np.abs(sgn(audio_1[i+j],T)-sgn(audio_1[i+j-1],T)))
    #            print(Calculation_1)
                Calculation=Calculation+Calculation_1
            
            count=np.append(count,Calculation)
        else:
            for j in range(len(audio_1[i:i+N])):
                Calculation_1=0.5*(np.abs(sgn(audio_1[i+j],T)-sgn(audio_1[i+j-1],T)))
                Calculation=Calculation+Calculation_1
            count=np.append(count,Calculation)        
    return count

你可能感兴趣的:(语音信号处理)