音频数据小波去噪-python

大部分内容参考自https://zhuanlan.zhihu.com/p/157540476
原文中处理的数据类型是一维数据类型,由于wav文件也是一维数据,因此同样适用。

1. 第一种实现方法

1.1 基本介绍

小波层数:5
小波基:sym8
阈值公式:音频数据小波去噪-python_第1张图片,cD1为第一层分解的细节系数,N为数据长度
阈值函数:软硬阈值折中的方法

1.2 代码

# 读excel表格数据进行去噪,并使用自适应阈值计算和软阈值收缩处理
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt

# 封装成函数
def sgn(num):
    if(num > 0.0):
        return 1.0
    elif(num == 0.0):
        return 0.0
    else:
        return -1.0

def wavelet_noising(new_df):
    data = new_df
    data = data.tolist()  # 将np.ndarray()转化为列表
    w = pywt.Wavelet('sym8')  # 选择sym8小波基
    [ca5, cd5, cd4, cd3, cd2, cd1] = pywt.wavedec(data, w, level=5)  # 5层小波分解
    length1 = len(cd1)
    length0 = len(data)

    Cd1 = np.array(cd1)
    abs_cd1 = np.abs(Cd1)
    median_cd1 = np.median(abs_cd1)

    sigma = (1.0/0.6745)*median_cd1
    lamda = sigma * math.sqrt(2.0*math.log(float(length0), math.e))  # 固定阈值计算
    usecoeffs = []
    usecoeffs.append(ca5)  # 向列表末尾添加对象

    # 软硬阈值折中的方法
    a = 0.5
    for k in range(length1):
        if (abs(cd1[k]) >= lamda):
            cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - a*lamda)
        else:
            cd1[k] = 0.0

    length2 = len(cd2)
    for k in range(length2):
        if (abs(cd2[k]) >= lamda):
            cd2[k] = sgn(cd2[k])*(abs(cd2[k])-a*lamda)
        else:
            cd2[k] = 0.0

    length3 = len(cd3)
    for k in range(length3):
        if (abs(cd3[k]) >= lamda):
            cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - a * lamda)
        else:
            cd3[k] = 0.0

    length4 = len(cd4)
    for k in range(length4):
        if (abs(cd4[k]) >= lamda):
            cd4[k] = sgn(cd4[k]) * (abs(cd4[k]) - a * lamda)
        else:
            cd4[k] = 0.0

    length5 = len(cd5)
    for k in range(length5):
        if (abs(cd5[k]) >= lamda):
            cd5[k] = sgn(cd5[k]) * (abs(cd5[k]) - a * lamda)
        else:
            cd5[k] = 0.0

    usecoeffs.append(cd5)
    usecoeffs.append(cd4)
    usecoeffs.append(cd3)
    usecoeffs.append(cd2)
    usecoeffs.append(cd1)
    recoeffs = pywt.waverec(usecoeffs, w)  # 信号重构
    return recoeffs

# 主函数
# path = "" #数据路径

# 提取数据
path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0]  # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)

data_denoising = wavelet_noising(data)  # 调用函数进行小波去噪
plt.plot(data_denoising)  # 显示去噪结果
plt.show()

1.3 去噪效果

去噪前的音频波形
音频数据小波去噪-python_第2张图片
去噪后的音频波形
音频数据小波去噪-python_第3张图片
音频数据小波去噪-python_第4张图片

2 第二种实现方法

音频数据小波去噪-python_第5张图片

#模块调用
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt
from math import log

#sgn函数
def sgn(num):
    if(num > 0.0):
        return 1.0
    elif(num == 0.0):
        return 0.0
    else:
        return -1.0

def wavelet_noising(new_df):
    data = new_df
    data = data.values.T.tolist()  # 将np.ndarray()转为列表
    w = pywt.Wavelet('dB10')#选择dB10小波基
    ca3, cd3, cd2, cd1 = pywt.wavedec(data, w, level=3)  # 3层小波分解
    ca3=ca3.squeeze(axis=0) #ndarray数组减维:(1,a)->(a,)
    cd3 = cd3.squeeze(axis=0)
    cd2 = cd2.squeeze(axis=0)
    cd1 = cd1.squeeze(axis=0)
    length1 = len(cd1)
    length0 = len(data[0])

    abs_cd1 = np.abs(np.array(cd1))
    median_cd1 = np.median(abs_cd1)

    sigma = (1.0 / 0.6745) * median_cd1
    lamda = sigma * math.sqrt(2.0 * math.log(float(length0 ), math.e))
    usecoeffs = []
    usecoeffs.append(ca3)

    #软阈值方法
    for k in range(length1):
        if (abs(cd1[k]) >= lamda/np.log2(2)):
            cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - lamda/np.log2(2))
        else:
            cd1[k] = 0.0

    length2 = len(cd2)
    for k in range(length2):
        if (abs(cd2[k]) >= lamda/np.log2(3)):
            cd2[k] = sgn(cd2[k]) * (abs(cd2[k]) - lamda/np.log2(3))
        else:
            cd2[k] = 0.0

    length3 = len(cd3)
    for k in range(length3):
        if (abs(cd3[k]) >= lamda/np.log2(4)):
            cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - lamda/np.log2(4))
        else:
            cd3[k] = 0.0

    usecoeffs.append(cd3)
    usecoeffs.append(cd2)
    usecoeffs.append(cd1)
    recoeffs = pywt.waverec(usecoeffs, w)#信号重构
    return recoeffs

path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0]  # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)

data_denoising = wavelet_noising(data)#调用小波阈值方法去噪
print(data_denoising)
plt.figure()
plt.plot(data_denoising)#显示去噪结果
plt.show()

去噪前:
音频数据小波去噪-python_第6张图片
去噪后:
音频数据小波去噪-python_第7张图片
音频数据小波去噪-python_第8张图片

3. 小波阈值去噪简略原理

对信号进行小波分解时,系数分解为近似小波系数(信号的低频成分)和细节小波系数(信号的高频成分)
小波阈值去噪方法认为,信号中的噪声存在于高频成分之中,因此,对于细节小波系数作阈值收缩处理,再将个小波系数进行组合重构就得到去噪后的信号。

如何对细节小波系数做阈值收缩处理呢?

信号经小波分解后:对于每层的小波系数,噪声对应的数值较小,因为,选取合适的阈值,将绝对值小于阈值的小波系数置0,绝对值较大的系数语义保留或收缩(阈值函数的作用),再利用小波逆变换进行重构,即得到去噪后的信号。

小波阈值去噪信号的步骤

(1) 对含噪信号进行小波分解。选择合适的小波基以及分解尺度,进行小波分解,得到一组小波系数。

(2) 对小波分解的各层高频系数进行阈值量化处理,得到小波系数的估计值。

(3)对经阈值量化处理的小波系数,进行逆小波变换以重构信号,得到去噪信号。

你可能感兴趣的:(python,音视频,numpy)