矢量量化(Vector Quantization)

动机:在子空间中寻找代表矢量,用此代表矢量来代表子空间中的其它矢量,从而压缩了数据量,即连续矢量映射到了离散矢量上。

The input vector is then replaced by the index of the codeword with the smallest distortion.
Therefore, a description of the vector
quantization process includes:
1. the distortion measure;
2. the generation of each codeword in the codebook;
在最小的失真程度下,输入的矢量被码字序号所代替。
因此,描述一个矢量量化过程需需要包含:
1.失真的度量
2.码本中每一个码字的生成

——《Speech Language Processing》

用数学语言描述矢量量化,事实上是一个连续矢量空间到离散矢量空间的映射过程:

设有N个K维特征矢量

X={X1,X2,...,XN}xnRKxi={x1,x2,...,xk}

RK 分成 J 个不相交子空间。
{Jj=1=RKRiRj=,ij

在每一个子空间可以找到代表矢量Y_j
L:XY

即量化器。

失真度量函数

度量失真的基本想法就是去测量代表矢量和原始矢量的差距,差距越小,失真程度越小。
1. 基于欧氏距离失真度量函数
- 均方误差 d2(X,Y)=(XY)T(XY)K
- r次方平均误差 dr(X,Y)=1KKi=1(xiyi)r
- r平均误差 dr(X,Y)=[1KKi=1|xiyi|r]1r
- 绝对值平均误差 d1(X,Y)=1KKi=1|xiyi|
- 最大平均误差 dM(X,Y)=max{|xiyi|}
- 加权 d(X,Y)=1KKi=1w(i)(xiyi)2

对于由线性预测方法求出的LPC系数矢量,由于预测器系数的差值不能代表语音信息的差别,所以不能直接用欧氏距离。为此采用I-S距离,比较系数所描述的信号模型的功率谱。
2. 线性预测失真测度

dIS(f,f)=aTRaαln2α1

其中, aT=(1,a1,a2,...,ap);R (p+1)×(p+1) 阶自相关矩阵。
aTRa=r(0)ra(0)+2i=1Pr(i)ra(i)

这里,
r(i)=k=0N1|i|x(k)x(k+|i|)ra(i)=k=0piakak+i

你可能感兴趣的:(speech,语音信号处理学习)