1.3-标准误的估计

来源网站:http://dbtemp.blogspot.com/2011/08/estimating-standard-errors.html

标准误的估计目前是有争议的话题。这里我们在尽量不涉及过多数学细节的情况下对其进行讨论。

似然度函数

估计标准误的其中一个方法便是考察似然函数。回想之前似然度的脚本(Likelihood_demo),我们对一个相关的似然度进行了估计。
下图中为两种似然度函数:实线为平缓的似然度函数;虚线为更加陡峭的似然度函数。

1.3-标准误的估计_第1张图片
陡峭和平缓的似然度函数

一般情况下,样本量越大似然度函数就越陡峭。对于更为平缓的实线表示的似然度函数来说,对于估计的相关的置信区间将会更宽。 似然度函数的“梯度(gradient, 斜率?)”是标准误估计的关键性因素。
在OpenMx的输出中,常常可以看到一个术语 "Hessian matrix":这是一个用于估计似然度梯度的矩阵。

bootstrapping

另外一个估计标准误的方法是bootstrapping,这种方法对某个参数的值进行重复模拟(比如相关系数为0.5)然后得到通过模型拟合后的这个参数值的分布范围。举例来说,如果我们模拟一万组数据,然后通过我们设置好的模型进行计算,每次都会得到一个新的结果。把这些结果的分布画出来,可能是如下所示的。

1.3-标准误的估计_第2张图片
r=0.5的数据重复生成一万次

这样我们可以得到精确的置信区间:例如,95%置信区间为最小的2.5%到最大的2.5%之间的范围。
值得注意的是,当我们采取这种方式估计置信区间时,其区间范围不一定是关于估计值(r=0.5)对称的。由于这种方法不依赖于任何先验的分布,而是通过数据本身直接重复运行模型得到,bootstrapping逐渐成为更合理且广泛应用的估计置信区间的方法。然而,对于复杂的模型来说,模型的拟合优化本身就需要几秒的时间,大量的重复势必会使得置信区间的估计十分缓慢。

你可能感兴趣的:(1.3-标准误的估计)