学习:StatQuest-概率与似然,极大似然

概率与似然

我们利用分布函数来说吧,这是一个小鼠体重分布函数图:


image.png

如果我们想求32grams—34grams这段区间发生的概率,我们可以计算红色部分面积,即0.29,这就是概率

那么什么是似然呢?还是这个例子,


image.png

我们想求34grams的似然,那么即为对应曲线上的纵坐标值,即0.12

综上,概率指固定分布曲线下区域的面积;似然指某数据点在分布曲线函数上对应的Y值
往往似然表示的是某事件将发生的可能性,注意了,可能性不代表概率,可能性取值范围可以大于1,但概率不可以

极大似然

极大似然的目标就是要找到最能拟合数据分布的分布函数,我们往往可以采用极大似然法来估计分布函数的参数

我们看个例子 ,我们有一组数据,关于小鼠体重分布



我们假设它服从正态分布,那么我们要估计它分布函数的均值和方差
如何估计均值呢?


image.png

我们在分布有data的数轴上依次求似然,数据点分布稀疏的似然(概率密度)显然低,数据点分布密集的似然(概率密度)显然高,我们就是要找到似然最大的那个点,该点所对应的值即为均值
同样,我们也可以以此来估计方差:
image.png

确定好均值位置(均值所对应的X轴坐标)以后,我们可以找到使该均值点对应的似然值最大的方差是多少了

极大似然法估计参数的核心思想即对于每个数据点,将其依次带入分布函数,再将它们相乘构造似然函数
那么我们想求使其每个数据点的似然值都达到最大的参数,即相乘的值要达到最大,显然转变为求极值问题

你可能感兴趣的:(学习:StatQuest-概率与似然,极大似然)