什么是似然函数及为什么要使用它

似然函数的概念:

在教科书中,似然常常被用作“概率”的同义词。但是在统计学中,二者有截然不同的用法。概率描述了已知参数时的随机变量的输出结果;似然则用来描述已知随机变量输出结果时,未知参数的可能取值。例如,对于“一枚正反对称的硬币上抛十次”这种事件,我们可以问硬币落地时十次都是正面向上的“概率”是多少;而对于“一枚硬币上抛十次,落地都是正面向上”这种事件,我们则可以问,这枚硬币正反面对称的“似然”程度是多少。

“似然性”与“概率”意思相近,都是指某种事件发生的可能性,不同在于似然性不看重绝对值,只看重相对值,所以不要求归一性(一般可以把概率当做似然性,但似然性不能当做概率)。概率(probability)和似然(likelihood),都是指可能性,都可以被称为概率,但在统计应用中有所区别。    概率是给定某一参数值,求某一结果的可能性的函数。似然是给定某一结果,求某一参数值的可能性的函数。   例如,抛一枚硬币,抛10次,结果是6次正面向上,其是匀质的可能性多大?似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。    例如,抛一枚匀质硬币,抛10次,6次正面向上的可能性多大?    解读:“匀质硬币”,表明参数值是0.5,“抛10次,六次正面向上”这是一个结果,概率(probability)是求这一结果的可能性。    解读:“抛10次,结果是6次正面向上”,这是一个给定的结果,问“匀质”的可能性,即求参数值=0.5的可能性。

似然函数的算法:

统计学中,似然函数是一种关于统计模型参数的函数。给定输出x时,关于参数θ的似然函数L(θ|x)(在数值上)等于给定参数θ后变量X的概率:L(θ|x)=P(X=x|θ)。即算法上与算概率是一样的。

下面给出一个详细的例子:

已知结果49次正,31次反。不同硬币抛出正面的概率不同。即似然算的是针对不同的硬币,它抛出上述结果的可能性。

似然函数的用处:

在给定矩阵X和参数情况下,目标变量(向量)有一个概率值(这个概率值是在对误差有了明确的分布估计前提下得到的),

当在某个范围内进行变动时,这个概率值也就变成了一个概率分布(函数),也就是似然函数。给定一个结果,对于不同的,概率是不同的。而我们需要最大化似然函数。

为什么要最大化似然函数?

 一种理论处理思路,自然地认为实验所得到的数据应是理论模型中发生概率最大的情况。最大化似然函数的过程实际上是理论模型取拟合实验数据的过程。

似然函数可以被应用在Linear Regression中。

具体例子可以参考如下文章:

线性回归原理及实现

你可能感兴趣的:(什么是似然函数及为什么要使用它)