【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用

目录

简介

安装

将工程以压缩包形式下载到本地

把压缩包传到服务器(你想部署的地方)上进行解压

用编辑器打开setup.py进行修改

在工程目录下进行安装

测试


简介

speechmetrics库提供了对语音质量进行评估的各种指标,包括MOSNet、BSSEval、STOI、PESQ、SRMR、SISDR等,方便我们对模型进行快速评估。

github链接在这里。


安装

由于【pip install git+http://......】会出现一些问题,再加上国内的种♂种♂原♂因,用speechmetrics官方提供的安装方式无法成功安装。

亲测有效的安装方式如下:

将工程以压缩包形式下载到本地

【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用_第1张图片

如果下载速度慢的话可以考虑使用魔♂法。

把压缩包传到服务器(你想部署的地方)上进行解压

【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用_第2张图片

用编辑器打开setup.py进行修改

将21~24行的https改为git

 【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用_第3张图片

【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用_第4张图片

在工程目录下进行安装

进入工程目录,直接使用如下命令进行安装

pip install ./

 安装过程中会下载一大堆依赖库,首次下载会花费相对较长的时间,耐心等待即可(或者使用魔♂法)


测试

测试代码如下

import speechmetrics

#定义窗长,每多少秒评价一次,None则对完整音频进行评价
window_length = None # seconds

#加载metric,在这里定义需要评价的指标
metrics = speechmetrics.load(['pesq', 'stoi', 'sisdr'], window_length)

#对音频进行评价
score = metrics("./DCCRN-C.wav", "./0-clean.wav") #params: denoised.wav, clean.wav
print(score)
'''
{'nb_pesq': 2.7491965293884277,
 'pesq': 1.773357629776001,
 'sisdr': 8.636653915700691,
 'stoi': 0.9070218637754633}
'''

用DCCRN官方公布的测试音频(simulated WSJ0 and MUSAN data中0db音频的DCCRN-C效果)进行测试,可以看到窄带PESQ的值跟DCCRN论文中的值还是比较接近的。

【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用_第5张图片

你可能感兴趣的:(python,语音,语音识别,人工智能,python,github)