高斯概率密度函数

高斯概率密度函数

1. 单变量正态分布

单变量正态分布概率密度函数定义为:
ρ ( x ) = 1 2 π σ e − 1 2 ( x − μ σ ) 2 (1) \rho(x)=\frac{1}{\sqrt{2\pi \sigma}} e^{-\frac{1}{2} (\frac{x- \mu}{\sigma})^2} \tag 1 ρ(x)=2πσ 1e21(σxμ)2(1)
式中 μ \mu μ为随机变量 x x x的期望, σ 2 \sigma^2 σ2 x x x的方差, σ \sigma σ称为标准差。
μ = E ( x ) = ∫ − ∞ ∞ x ρ ( x ) d x (2) \mu=E(x)=\int_{-\infty}^{\infty} x\rho(x) dx \tag 2 μ=E(x)=xρ(x)dx(2)
σ 2 = ∫ ∞ ∞ ( x − μ ) 2 ρ ( x ) d x (3) \sigma^2=\int_{\infty}^{\infty} (x-\mu)^2 \rho(x) dx \tag 3 σ2=(xμ)2ρ(x)dx(3)
matlab绘制正态分布曲线:

% 绘制单变量正态分布概率密度曲线
x1=-5:0.01:5; # 注意取值的对称性
subplot(2,1,1)
y1=normpdf(x1,0,1);
plot(x1,y1,'r');
title('\mu=0,\sigma^2=1')
xlabel('x')
ylabel('\rho(x)')
subplot(2,1,2)
x2=-5:0.01:7; # 注意取值的对称性
y2=normpdf(x2,1,sqrt(0.2));
plot(x2,y2,'r');
title('\mu=1,\sigma^2=0.2')
xlabel('x')
ylabel('\rho(x)')

图像
高斯概率密度函数_第1张图片

由图中可知,方差越大曲线越宽,曲线始终以 μ \mu μ为中心对称

正态分布的样本主要都集中在均值附近,其分散程度可以用标准差来表征, σ \sigma σ越大分散程度也越大。从正态分布的总体中抽取样本,约有95%的样本都落在区间 ( μ − 2 σ , μ + 2 σ ) (\mu-2\sigma,\mu+2\sigma) (μ2σ,μ+2σ)(或写作 ∣ x − μ ∣ < 2 σ |x-\mu|<2\sigma xμ<2σ)中。

2. 多元正态分布

(1)多元正态分布的概率密度函数的定义为:
ρ ( x ) = 1 ( 2 π ) d / 2 ∣ Σ ∣ 1 2 e − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) (4) \rho(x)=\frac{1}{(2\pi)^{d/2} |\Sigma|^{\frac{1}{2}}} e^{-\frac{1}{2} (x-\mu)^T \Sigma^{-1} (x-\mu)} \tag 4 ρ(x)=(2π)d/2Σ211e21(xμ)TΣ1(xμ)(4)
式中: x = [ x 1 , x 2 , . . . , x d ] T x=[x_1,x_2,...,x_d]^T x=[x1,x2,...,xd]T d d d维列向量; μ = [ μ 1 , μ 2 , . . . , μ d ] T \mu=[\mu_1,\mu_2,...,\mu_d]^T μ=[μ1,μ2,...,μd]T d d d维均值向量; Σ \Sigma Σ d × d d \times d d×d维协方差矩阵, Σ − 1 \Sigma^{-1} Σ1 Σ \Sigma Σ的逆矩阵, ∣ Σ ∣ |\Sigma| Σ Σ \Sigma Σ的行列式。
定义 Σ \Sigma Σ为:
Σ = E [ ( x − μ ) ( x − μ ) T ] (5) \Sigma=E[(x-\mu)(x-\mu)^T] \tag 5 Σ=E[(xμ)(xμ)T](5)
显然, d = 1 d=1 d=1时,多变量高斯和单变量高斯一致。有时用符号 N ( μ , Σ ) N(\mu,\Sigma) N(μ,Σ)表示均值为 μ \mu μ、协方差为 Σ \Sigma Σ的高斯概率密度函数。
为更好地理解什么是多变量高斯,我们考虑在二维空间的一些情况,二维空间是可视的。在这种情况下,有:
Σ = [ σ 1 2 σ 12 σ 12 σ 2 2 ] (6) \Sigma = \left[ \begin{array}{cc} \sigma_1^2 & \sigma_{12} \\ \sigma_{12} & \sigma_2^2 \end{array} \right ] \tag 6 Σ=[σ12σ12σ12σ22](6)
其中 ( x − μ ) (x-\mu) (xμ) 2 × 1 2 \times 1 2×1的列向量, ( x − μ ) T (x-\mu)^T (xμ)T 1 × 2 1 \times 2 1×2的行向量。对于每个 μ i \mu_i μi E [ x i ] = μ i , i = 1 , 2 E[x_i]=\mu_i,i=1,2 E[xi]=μi,i=1,2,通过定义 σ 12 = E [ ( x 1 − μ 1 ) ( x 2 − μ 2 ) ] \sigma_{12}=E[(x_1-\mu_1)(x_2-\mu_2)] σ12=E[(x1μ1)(x2μ2)],得到随机变量 x 1 x_1 x1 x 2 x_2 x2的协方差,这个可以度量它们的相互统计相关性。在统计意义下,如果变量是独立的,其协方差为0。显然, Σ \Sigma Σ对角元素是随机向量中各个元素的方差。

3. 二维高斯概率密度函数的示例

代码

% 绘制双变量正态分布概率密度曲线
x = 1 : 0.3 : 7 ;  
y = 1 : 0.3 : 7 ;      
[X,Y] = meshgrid(x,y);
U1 = 4.0;
DX = 1;     % X的方差
dx = sqrt(DX);
U2 = 3.8;
DY = 1;     % Y的方差
dy = sqrt(DY);
COV = 0;     % X Y的协方差
r = COV / (dx * dy);
part1 = 1 / ( 2 * pi * dx * dy * sqrt( 1 - r^ 2 ));
p1 = - 1 / ( 2 * ( 1 - r^ 2 ));
px = (X - U1).^ 2. / DX;
py = (Y - U2).^ 2. / DY;
pxy = 2 * r.* (X - U1).* (Y - U2)./ (dx * dy);
Z = part1 * exp(p1 * (px - pxy + py));
figure(1)
mesh(X,Y,Z)
xlabel('x1');
ylabel('x2');
zlabel('\rho(x)');
title('二维概率密度曲线');
figure(2);
mesh(X,Y,Z);
xlabel('x1');
ylabel('x2');
zlabel('\rho(x)');
title('等值曲线');
view(0,90);

需要自行更改值的变量为Dx,Dy,COV

3.1 σ 1 2 = σ 2 2 \sigma_1^2=\sigma_2^2 σ12=σ22

二维概率密度函数曲线
高斯概率密度函数_第2张图片
等值曲线
高斯概率密度函数_第3张图片
此时等值曲线呈现各方向同性的球对称状。

3.2 σ 1 2 > > σ 2 2 \sigma_1^2>>\sigma_2^2 σ12>>σ22

二维概率密度函数曲线
高斯概率密度函数_第4张图片
等值曲线
高斯概率密度函数_第5张图片
此时等值曲线呈现向 x 1 x_1 x1方向延申状。

3.3 σ 2 2 > > σ 1 2 \sigma_2^2>>\sigma_1^2 σ22>>σ12

二维概率密度函数曲线
高斯概率密度函数_第6张图片
等值曲线
高斯概率密度函数_第7张图片
此时等值曲线呈现向 x 2 x_2 x2方向延申状。

3.4 σ 12 ≠ 0 \sigma_{12} \not=0 σ12=0

二维概率密度函数曲线
高斯概率密度函数_第8张图片
等值曲线
高斯概率密度函数_第9张图片
由于改变 σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22 σ 12 \sigma_{12} σ12的值就可以得到不同的形状和方向。
等值曲线是不同方向、与短轴长度成不同比例的椭圆。考虑对角线协方差矩阵的随机向量的均值为0,即 μ 1 = 0 , μ 2 = 0 \mu_1=0,\mu_2=0 μ1=0,μ2=0,即有如下方程:(计算等值曲线相当于计算指数为常数 C C C的曲线)
x 1 2 σ 1 2 + x 2 2 σ 2 2 = C (7) \frac{x_1^2}{\sigma_1^2}+\frac{x_2^2}{\sigma_2^2} =C \tag 7 σ12x12+σ22x22=C(7)

你可能感兴趣的:(模式识别,matlab,概率论,贝叶斯分类,高斯概率密度函数)