有参考音质评估

本文对工作过程中遇到的音质评估问题作以记录。如有不当之处欢迎批评指正

目录

  • 1. 前言
  • 2. 方法
  • 3. 注意事项
  • 4. 举例
  • 5. 参考文献

1. 前言

  这篇文章主要想简单地谈一下评估音质的方法。对一段含噪语音降完噪之后,想评估一下其音质,最常想到的方法就是使用 pesq (perceptual evaluation of speech quality) 工具对其进行打分,而计算 pesq 得分需要事先知道含噪语音中的纯干净语音成分,这种音质评估方法就称为有参考音质评估。

2. 方法

  而降完噪之后的信号其实包含两部分:语音成分和噪声成分, 如何单独评估降噪算法对干净语音的失真以及对噪声的降噪量那。当然,需要先从降完噪之后的信号中分离出语音成分和噪声成分,下面介绍一种简单的分离方法:
s ^ ⃗ c l e a n = < s ⃗ d e n o i s e d , s ⃗ c l e a n > s ⃗ c l e a n ∣ ∣ s ⃗ c l e a n ∣ ∣ 2 \vec{\hat{s}}_{clean}=\frac{\lt\vec{s}_{denoised},\vec{s}_{clean}\gt\vec{s}_{clean}}{||\vec{s}_{clean}||^{2}} s^ clean=s clean2<s denoised,s clean>s clean

  其中,
   s ⃗ d e n o i s e d \vec{s}_{denoised} s denoised: 表示降完噪的信号
   s ^ ⃗ c l e a n \vec{\hat{s}}_{clean} s^ clean: 表示降完噪信号中的语音成分
   s ⃗ c l e a n \vec{s}_{clean} s clean: 表示事先知道的含噪语音中的纯干净语音成分
   < a ⃗ , b ⃗ > \lt\vec{a},\vec{b}\gt <a ,b >: 表示 a ⃗ \vec{a} a b ⃗ \vec{b} b 的点积操作
   ∣ ∣ a ⃗ ∣ ∣ 2 ||\vec{a}||^{2} a 2: 表示 a ⃗ \vec{a} a 2范数的平方

  这种做法的思想是将降完噪之后的信号投影到干净语音上。分离出降完噪信号中的语音成分和噪声成分后就能进一步估计降噪算法对语音的失真以及对噪声的降噪量了。

3. 注意事项

  在具体实现的过程中需要注意以下两点:
  1. 在计算投影因子 < s ⃗ d e n o i s e d , s ⃗ c l e a n > ∣ ∣ s ⃗ c l e a n ∣ ∣ 2 \frac{\lt\vec{s}_{denoised},\vec{s}_{clean}\gt}{||\vec{s}_{clean}||^{2}} s clean2<s denoised,s clean>的时候可以(如每帧30ms)计算;
  2. 在计算 < s ⃗ d e n o i s e d , s ⃗ c l e a n > \lt\vec{s}_{denoised},\vec{s}_{clean}\gt <s denoised,s clean>的时候, s ⃗ d e n o i s e d \vec{s}_{denoised} s denoised s ⃗ c l e a n \vec{s}_{clean} s clean必须对齐,两者之间尽可能不存在延迟。

4. 举例

  下面给个例子看一下分离效果:
有参考音质评估_第1张图片

1 降噪之后的信号

有参考音质评估_第2张图片

2 分离出的干净语音

有参考音质评估_第3张图片

3 分离出的残留噪声

5. 参考文献

[1] Vincent E , Gribonval R , Fevotte C . Performance measurement in blind audio source separation[J]. IEEE Transactions on Audio, Speech and Language Processing, 2006, 14(4):1462-1469.

你可能感兴趣的:(信号处理)