X,Y若是独立的离散随机变量求Z=X+Y的分布
因为变量Z=X+Y,也就是X,Y的取值是可以任意的,但是加起来一定得为Z,说明X取定了x,那么Y就只能取z-x
即当X取了x,此时Y取z-x即可保证两者加起来等于z,也就是这两个取值必须同时发生,由于X,Y独立,
有P(Z=z) = P(X=x) * P(Y=z-x),因为x的值我没有具体指定是多少,他可以是,负无穷,-2,-1,0,1,2,3,。。。正无穷,
同时y的取值就是,z-负无穷.。。。z-(-2),z-(-1),z-0,z-1,z-2,z-3。。。z-正无穷
上面y的取值和x的取值的一一对应的,所以也就是说会存在很多对这样的点的情况,我们需要把这些情况发生的概率加起来就是总的Z=z的概率了
具体举个例:
P(Z=z) = P(X=负无穷) * P(Y=z-负无穷) +。。。+ P(X=-2) * P(Y=z-(-2)) + P(X=-1) * P(Y=z-(-1)) + P(X=0) * P(Y=z-0) + P(X=1) * P(Y=z-1) + P(X=2) * P(Y=z-2) + 。。。+P(X=正无穷) * P(Y=z-正无穷)
写成求和形式就是:P(Z=z) =P(X=x) * P(Y=z-x),其中x取值为负无穷到正无穷
所以我们发现这不就是离散卷积公式嘛,也就是说,X,Y若是独立的随机变量,Z=X+Y的分布为X,Y的卷积
X,Y若是独立的连续随机变量求Z=X+Y的分布
X的密度函数为fx(x),Y的为fy(y),设Z的密度函数为fz(z)
同离散情况分析一样,取值是一样的,只是概率P(Z=z) = P(X=x) * P(Y=z-x)变成了密度函数相乘(因为连续随机变量在一个点的概率为0,只能是计算一段区间的概率),即fz(z) = fx(x) * fy(z-x),注:本文里所有的*号就代表普通的乘积
由于仍然存在多对满足情况点的情况,所以跟上面一样,还是加起来,即:
fz(z) = fx(负无穷) * fy(z-负无穷) + 。。。fx(-1) * fy(z-(-1)) + fx(0) * fy(z-0) +fx(1) * fy(z-1) +fx(2) * fy(z-2) + 。。。fx(正无穷) * fy(z-正无穷)
即: fz(z) =fx(x) *fy(z-x),其中x取值为负无穷到正无穷,
由于x不是离散取值,而是连续取值,所以求和号变成了积分号
即:fz(z) =fx(x) *fy(z-x) dx,哇塞,这不就是卷积公式嘛(你现在终于知道卷积的实际意义了吧,实际上处理不同问题会对应不同的实际意义,比如图像处理中卷积用于特征提取,滤波等等)
所以X,Y若是独立的随机变量,Z=X+Y的分布密度函数fz(z)为X,Y的密度函数的卷积
接下来我们再看个问题,概率论中定义g(u) = E[e^juX]为随机变量X的特征函数(有很多方便之处,所以数学家才定义了这个),我们展开看看:
即:g(u) = fx(x) * e^jux dx = E[e^juX](就是连续随机变量数字特征中的均值)其中fx(x)为X的概率密度函数,我们发现这不就是密度函数fx(x)做了一个傅里叶变换嘛
刚刚 X,Y若是独立的随机变量,Z=X+Y的分布这个问题,
我们有Z的特征函数
E[e^juZ] = E[e^ju(X+Y)] = E[e^juX * e^juY] = E[e^juX] * E[e^juY] (因为X,Y相互独立,所以才可以这样拆开,结尾我会给出一个证明)
结论:上述等式就说明:所以X,Y若是独立的随机变量,Z=X+Y随机变量Z的密度函数fz(z)的傅里叶变换等于X,Y的密度函数傅里叶变换后相乘,所以再傅里叶逆变换回去即可得到Z的密度函数fz(z)
结合最前面的问题得出的结论X,Y若是独立的随机变量,Z=X+Y的分布密度函数fz(z)为X,Y的密度函数的卷积和刚刚利用特征函数方式求出Z的密度函数fz(z)的结论表面,原来密度函数时域的卷积等效于密度函数傅氏变换后即在频域做的乘积
哇,算不算竟然从一个概率实际问题中完成了著名的定理:时域的卷积等于频域的乘积 的证明呢,嘻嘻
具体关于这个定理的严谨纯数学证明可以参考这篇文章https://blog.csdn.net/taiyangshenniao/article/details/54379083,用的是转为二重积分方式进行证明
所以在求解概率问题时,一般而言特征函数方法求解更容易更方便(其实很多其他概率问题用特征函数都更方便)
附录:证明:X,Y相互独立,有E[e^juX * e^juY] = E[e^juX] * E[e^juY]
因为X,Y相互独立,所以相关系数=0,根据相关系数公式,有协方差Cov(X,Y)=0
所以 Cov(X,Y)= E[X*Y] - E[X] * E[Y] = 0,因此E[X*Y] = E[X] * E[Y]
因为X,Y相互独立,所以变量e^juX和e^juY也是相互独立的,
那么根据刚刚推导出来的公式,
有E[e^juX * e^juY] = E[e^juX] * E[e^juY],证毕