正态分布下的最大似然估计

正态分布下的最大似然估计

前导知识:【最大似然参数估计的求解】
本文仅以单变量正态分布情况下估计其均值和方差为例来说明最大似然估计的用法。
单变量正态分布的形式为:
ρ ( x ∣ θ ) = 1 2 π σ e − 1 2 ( x − μ σ ) 2 (1) \rho(x|\theta)=\frac{1}{\sqrt{2\pi \sigma}} e^{-\frac{1}{2} (\frac{x- \mu}{\sigma})^2} \tag 1 ρ(xθ)=2πσ 1e21(σxμ)2(1)
其中均值 μ \mu μ和方差 σ 2 \sigma^2 σ2为未知参数,即待估计的参数为 θ = [ θ 1 , θ 2 ] T = [ μ , σ 2 ] T \theta=[\theta_1,\theta_2]^T=[\mu,\sigma^2]^T θ=[θ1,θ2]T=[μ,σ2]T,用于估计的样本仍然是 X = { x 1 , x 2 , . . . , x N } X=\{x_1,x_2,...,x_N\} X={x1,x2,...,xN}
根据如下式子:
▽ θ H ( θ ) = ∑ i = 1 N ▽ θ ln ⁡ ρ ( x i ∣ θ ) = 0 (2) \bigtriangledown_{\theta} H(\theta) = \sum_{i=1}^{N} \bigtriangledown_{\theta} \ln \rho(x_i|\theta) = 0 \tag 2 θH(θ)=i=1Nθlnρ(xiθ)=0(2)
从正态分布式 ( 1 ) (1) (1)可以得到:
ln ⁡ ρ ( x k ∣ θ ) = − 1 2 ln ⁡ 2 π − 1 2 θ 2 ( x k − θ 1 ) 2 (3) \ln \rho(x_k|\theta) = -\frac{1}{2} \ln 2\pi - \frac{1}{2\theta_2}(x_k-\theta_1)^2 \tag 3 lnρ(xkθ)=21ln2π2θ21(xkθ1)2(3)
分别对两个未知参数求偏导,得到:
▽ θ ln ⁡ ρ ( x k ∣ θ ) = [ 1 θ 2 ( x k − θ 1 ) − 1 2 θ 2 + 1 2 θ 2 2 ( x k − θ 1 ) 2 ] (4) \bigtriangledown_{\theta} \ln \rho(x_k|\theta)= \left[ \begin{array}{cc} \frac{1}{\theta_2}(x_k-\theta_1) \\ -\frac{1}{2\theta_2}+\frac{1}{2\theta_2^2}(x_k-\theta_1)^2 \end{array} \right] \tag 4 θlnρ(xkθ)=[θ21(xkθ1)2θ21+2θ221(xkθ1)2](4)
因此,最大似然估计应该是以下方程组的解:
{ ∑ k = 1 N 1 θ 2 ^ ( x k − θ 1 ^ ) = 0 − ∑ k = 1 N 1 θ 2 ^ + ∑ k = 1 N 1 θ 2 ^ 2 ( x k − θ 1 ^ ) 2 (5) \left\{ \begin{array}{cc} \sum_{k=1}^{N} \frac{1}{\hat{\theta_2}}(x_k-\hat{\theta_1}) =0\\ -\sum_{k=1}^{N} \frac{1}{\hat{\theta_2}}+\sum_{k=1}^{N} \frac{1}{\hat{\theta_2}^2}(x_k-\hat{\theta_1})^2 \end{array} \right. \tag 5 {k=1Nθ2^1(xkθ1^)=0k=1Nθ2^1+k=1Nθ2^21(xkθ1^)2(5)
可以得到:
μ ^ = θ 1 ^ = 1 N ∑ k = 1 N x k σ ^ 2 = θ 2 ^ = 1 N ∑ k = 1 N ( x k − μ ^ ) 2 (6) \hat{\mu}=\hat{\theta_1}=\frac{1}{N} \sum_{k=1}^{N} x_k \\ \hat{\sigma}^2=\hat{\theta_2}=\frac{1}{N} \sum_{k=1}^{N} (x_k-\hat{\mu})^2 \tag 6 μ^=θ1^=N1k=1Nxkσ^2=θ2^=N1k=1N(xkμ^)2(6)
上述两式是对正态分布样本的均值和方差的最大似然估计。
多元正态分布
多元正态分布的均值和方差的最大似然估计是:
μ ^ = 1 N ∑ i = 1 N x i Σ ^ 2 = 1 N ∑ i = 1 N ( x i − μ ^ ) ( x i − μ ^ ) T (7) \hat{\mu}=\frac{1}{N} \sum_{i=1}^{N} x_i \\ \hat{\Sigma}^2=\frac{1}{N} \sum_{i=1}^{N} (x_i-\hat{\mu})(x_i-\hat{\mu})^T \tag 7 μ^=N1i=1NxiΣ^2=N1i=1N(xiμ^)(xiμ^)T(7)
最大似然估计量是平方误差一致和简单一致估计量,但不一定都是无偏估计量。上述估计中, μ ^ \hat{\mu} μ^是无偏的,而 Σ ^ \hat{\Sigma} Σ^就不是无偏的,它的无偏估计为:
Σ ^ = 1 N − 1 ∑ k = 1 N ( x k − μ ^ ) ( x k − μ ^ ) T (8) \hat{\Sigma}=\frac{1}{N-1} \sum_{k=1}^{N} (x_k-\hat{\mu})(x_k - \hat{\mu})^T \tag 8 Σ^=N11k=1N(xkμ^)(xkμ^)T(8)

你可能感兴趣的:(模式识别,正态分布,最大似然估计,无偏估计)