极大似然估计与贝叶斯估计的比较

  • 极大似然估计

已知某个随机样本(x_{1},x_{2},...,x_{n})符合某种概率分布,但是其中某个具体参数\theta不清楚,通过极大似然估计得到\widehat{\theta },该\widehat{\theta }使这个随机样本出现的概率最大。

一般步骤

1.写出似然函数:L(\theta _{i})=\prod_{i=1}^{N}f(x_{i},\theta _{1},\theta _{2},...,\theta _{n})

2.对似然函数取对数:lnL(\theta _{i})

3.对\theta _{i}求偏导数:\frac{\partial }{\partial \theta _{i}}lnL(\theta )

4.解似然方程组:\frac{\partial }{\partial \theta _{i}}lnL(\theta )=0

例题

推导下述正态分布均值\mu的极大似然估计,数据x_{1},...,x_{n}来自正态分布N(\mu ,\sigma ^{2}),其中\sigma ^{2}已知。根据样本x_{1},...,x_{n}写出\mu的极大似然估计。

正态分布概率密度函数:f(x)=\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{(x-\mu )^{2}}{2\sigma ^{2}})

第一步,写出似然函数:

L(\mu )=\prod_{i=1}^{n}f(x_{i},\mu )=\prod_{i=1}^{n}\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{(x_{i}-\mu )^{2}}{2\sigma ^{2}})

第二步,对似然函数取对数:

lnL(\mu )=-nln(\sqrt{2\pi }\sigma )-\frac{1}{2\sigma ^{2}}\sum_{i=1}^{n}(x_{i}-\mu )^{2}

第三步,对\mu求偏导数:

\frac{\partial }{\partial \mu }lnL(\mu )=-\frac{1}{\sigma ^{2}}\sum_{i=1}^{n}(x_{i}-\mu )

第四步,解似然方程组:

\frac{\partial }{\partial \mu }lnL(\mu )=0\Rightarrow \widehat{\mu }=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\overline{x}

 

  • 极大似然估计与贝叶斯估计的区别

问题:已知数据集D服从概率分布P,P中\theta参数未知。

极大似然估计:

  1. 未知参数\theta是一个定值。
  2. 目标:未知参数\theta使得数据集D(x_{1},x_{2},...,x_{n})发生的概率最大。maxP(D|\theta )

贝叶斯估计:

  1. 未知参数\theta本身服从一定的概率分布。
  2. 目标:数据集D(x_{1},x_{2},...,x_{n})发生的情况下,哪一个\theta发生的概率最大。maxP(\theta|D )

 

  • 贝叶斯估计

一般步骤

1.写出L(\theta )=P(\theta |D)P(\theta |D)=\frac{P(D|\theta )P(\theta )}{P(D)}

2.取对数:lnL(\theta _{i})

3.对\theta _{i}求偏导数:\frac{\partial }{\partial \theta _{i}}lnL(\theta )

4.解方程组:\frac{\partial }{\partial \theta _{i}}lnL(\theta )=0

例题

推导下述正态分布均值\mu贝叶斯估计,数据x_{1},...,x_{n}来自正态分布N(\mu ,\sigma ^{2}),其中\sigma ^{2}已知。假设\mu的先验分布是正态分布N(0,\tau ^{2}),根据样本x_{1},...,x_{n}写出\mu的极大似然估计。

正态分布概率密度函数:f(x)=\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{(x-\mu )^{2}}{2\sigma ^{2}})

第一步,写出L(\mu )=P(\mu |D):

P(\mu |x_{1},x_{2},...,x_{n})=\frac{P(\mu ,x_{1},x_{2},...,x_{n})}{P(x_{1},x_{2},...,x_{n})}=\frac{P(\mu )P(x_{1},x_{2},...,x_{n}|\mu )}{P(x_{1},x_{2},...,x_{n})}=\frac{P(\mu )P(x_{1}|\mu )...P(x_{n }|\mu )}{\int P(\mu ,x_{1},x_{2},...,x_{n})d\mu }

=k\frac{1}{\sqrt{2\pi }\tau }exp(-\frac{\mu ^{2}}{2\tau ^{2}})\prod_{i=1}^{n}\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{(x_{i}-\mu ) ^{2}}{2\sigma ^{2}})(分母与\mu无关,可不考虑)

第二步,取对数:

lnP(\mu |x_{1},x_{2},...,x_{n})=k-\frac{\mu ^{2}}{2\tau ^{2}}+\sum_{i=1}^{n}(-\frac{(x_{i}-\mu ) ^{2}}{2\sigma ^{2}})

第三步,求导:

\frac{\partial }{\partial \mu }lnP(\mu |x_{1},x_{2},...,x_{n})=-\frac{\mu }{\tau ^{2}}+\sum_{i=1}^{n}\frac{x_{i}-\mu }{\sigma ^{2}}

第四步,解方程组

-\frac{\mu }{\tau ^{2}}+\sum_{i=1}^{n}\frac{x_{i}-\mu }{\sigma ^{2}}=0\Rightarrow \widehat{\mu }=\frac{\sum_{i=1}^{n}x_{i}}{n+\frac{\sigma ^{2}}{\tau ^{2}}}

你可能感兴趣的:(数学基础)