平方Pearson相关系数(SPCC)相关公式的推导

1、PCC及SPCC的定义
最近推导了维纳滤波的公式,其中最重要的是当然是最小平方误差准则(MSE)。但是在很多实际应用中,参考信号是不可知的,因此MSE准则不具有实际意义。为了解决这个问题,我们需要寻找另一个准则替代MSE成为新的代价函数。这就是皮尔逊相关系数(Pearson Correlation Coefficient, PCC)的来历。通过研究发现,相较于MSE,PCC具有许多吸引人的优秀性质,尤其在输出信噪比分析方面。因此经典最优或次优滤波器的设计通常都是以后者为指导的。

x y 是两个均值为 0 的实随机变量,PCC的原始定义是:

ρ(x,y)=E[xy]σxσy

其中, E[xy] 表示 x y 的互相关系数; σx=E[x2] σy=E[y2] 分别为信号 x y 的方差。
不过为了分析方便,通常使用的是平方Pearson相关系数(SPCC),其定义式如下:

ρ2(x,y)=E2[xy]σ2xσ2y

SPCC一个很重要的性质就是:
0ρ2(x,y)1

其意义是表示两个随机变量之间线性相关的程度。
2、SPCC的重要性质
在讲SPCC之前,需要把SPCC涉及到的维纳滤波中加性噪声的四个信号定义清楚。
在维纳滤波中,假设一个纯净的语音信号 x(k) 受到零均值噪声信号 ν(k) 的干扰,且 x(k) ν(k) 不相关。那么在离散采样 k 时刻,带噪声的语音信号描述为:
y(k)=x(k)+ν(k)

维纳滤波的目的,就在于根据观测信号 y(k) 找到信源信号 x(k) 的最优估计 z(k)
而维纳滤波的思想,就在于假设 z(k) 可以通过一个滤波器 h 和多个观测值序列 y(k) 组合得到。
z(k)=hTy(k)

其中,
y(k)=[y(k)y(k1)y(kL+1)] L 为滤波器长度。
根据 z(k) x(k) 之间的关系我们可以通过二者作差定义误差代价函数,利用MSE准则来求取最优滤波器,该滤波器就是维纳滤波器。但是这不是本文要阐述的重点,感兴趣的同学可以到网上搜索相关的文章来学习。

2.1 四个SPCC系数的定义
推导之前需要注意几个关键的代换关系,有了这几个代换关系公式的推导就不是什么难事。但是几乎所有的书上都认为这些关系是不言而喻的。有时候多提点一笔就可以节省很多时间,所以在此点破。
x=hT1x hTx=xTh
类似的,
ν=hT1ν hTν=νTh
其中, hT1=[10...0] ,长度还是 L .
有了这个关系,公式推导起来就很方便了。这也正是这篇博文的意义所在。

首先是信源信号 x(k) y(k) 之间的SPCC。根据定义是可以写成:
ρ2(x,y)=E2[xy]E[x2]E[y2]=SNR1+SNR
推导:
E[xy]=E[x(x+v)]=E[x2+xv]=E[x2]+E[xv]=E[x2]=σ2x
E[y2]=E[(x+v)2]==E[x2]+E[v2]=σ2x+σ2v
定义: SNR=E[x2]E[v2]=σ2xσ2v
上式容易得出。
其次是信源信号 x(k) z(k) 之间的SPCC。根据定义是可以写成:

ρ2(x,z)=E2[xz]E[x2]E[z2]=(E(xhTy))2σ2xhTRyyh

关键推导步骤:
E[xz]=E[xhTy]=E[xhT(x+v)]=E[xhTx+xhTv]=E[xhTx]=E[hT1xhTx]=E[hT1xxTh]=hT1Rxxh
E[z2]=E(hTyyTh)=hTRyyh

所以上式可以写成:

ρ2(x,z)=(hT1Rxxh)2σ2xhTRyyh=(hT1Rxxh)2σ2xhTRxxhhTRxxhσ2xhTRyyh

容易发现:
(hT1Rxxh)2σ2xhTRxxh=ρ2(x,hTx)

ρ2(hTx,hTy)=hTRxxhσ2xhTRyyh=hTRxxhhTRvvh1+hTRxxhhTRvvh=1+SNR(h)SNR(h)

所以可以得到下述性质:
ρ2(x,z)=ρ2(x,hTx)ρ2(hTx,hTy)

由于公式编辑实在是太过于耗费时间和精力,我直接改成贴图了,希望大家理解。
平方Pearson相关系数(SPCC)相关公式的推导_第1张图片
类似的,可以得到相似的性质。

ρ2(v,z)=ρ2(v,hTy)=ρ2(v,hTv)ρ2(hTv,hTy)

关于SPCC的其他性质的推导在此就不一一展示了。注意变量的定义和变量的代换,基本都能推导出来。如果有问题可以留言交流。

你可能感兴趣的:(SPCC)