最大似然估计

对于总体的分布我们通常不能完全知道,往往总体的分布中含有未知的参数,最大似然估计可以用来求解这些参数。

最大似然估计的基本思想是通过总体的样本来估计参数,获得一组样本,该组样本值出现的概率是每个值出现的概率的乘积,因为每次采样之间是相互独立的。我们通过随机抽样获取了该组样本,那么完全可以认为该组样本出现的概率就是最大的(当然这只是一种近似,所以才叫似然估计,想想也可以理解,为什么随机抽样之后没有得到其他的样本而得到这组样本,显然该组样本出现的概率最大)。我们通过总体的概率密度(含有参数)得到该组样本出现的概率,也就是每个样本值出现的概率的乘积,这个乘积就应该取最大值,因为上面说了,这组随机抽取的样本既然出现了,就应该是最大概率的。

所以含有参数的该样本出现的概率取最大值的时候,其中参数的值就是总体的概率分布中参数的一个估计,也就是最大似然估计。

感觉精髓思想在于:已经出现的,我就认为是最有可能出现的。

你可能感兴趣的:(机器学习)