1.似然函数
(1)离散型
若总体X属离散型,其分布律P{X=}=p(
),
的形式为已知,
为待估参数,
是
可能取值的范围,设
是来自X的样本,则
的联合分布律为:
又设是相应于样本
的一个样本值,易知样本
取到观测值
的概率,亦即事件{
}发生的概率为
这一概率随的取值而变化,它是
的函数,
称为样本的似然函数(这里
是已知的样本值,它们都是常数).
那么我们可以作如下考虑:现在已经取到样本值了,这表明取到这一样本值的概率
比较大,我们当然不会考虑那些不能使样本
出现的
作为
的估计,再者,如果已知当
时使
取得很大值,而
中其他
值是
取很小值,我们自然认为取
作为未知参数
的估计值较为合理.由费希尔引进的最大似然估计法,就是固定样本观察值
,在
取值的可能范围
内挑选使似然函数
达到最大的参数值
,作为参数
的估计值,即取
使
这样得到的与样本值
有关,记为
,称为参数
的最大似然估计值,而相应的统计量
称为参数
的最大似然估计量
(2)连续型
若总体X属连续型,其概率密度,
的形式为已知,
为待估参数,
是
可能取值的范围,设
是来自X的样本,则
的联合密度为:
设是相应于样本
的一个样本值,则随机点
落在点(
)的邻域(边长分别为
的n维立方体)内的概率近似地为
这一概率随的取值而变化,它是
的函数,但因子
不随
而变故只需考虑函数
的最大值称为样本的似然函数,若
则称为参数
的最大似然估计值,而相应的统计量
称为参数
的最大似然估计量 .
总结:已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值.最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值(利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值)