可计算的估计量

  满足Le Cam卷积定理前提的概率分布族称为正规参数族(Regular parametric family),囊括了大多数参数统计学常用的分布。然而,一元正规参数族的是在开区间上定义的连续参数,其取值有不可数无穷多个。计算机可执行的算法均由有限多基本步骤组成,故算法个数至多为可数无穷。简单的推论即得绝大多数值都不存在可行算法。

  但我们要估计参数值时,恰恰又要依赖可执行在观测样本上的算法(例:矩估计。这里默认样本自身的取值数有限),因此得出的只能是总数占沧海一粟的可计算值。用极特例的估计值去逼近一般情况下的不可计算值,能做到多好的精确度呢?这就是Vladimir Vovk在这篇论文中解决的问题:

  原作者证明:令为正规参数族中值的一致可计算估计量,下标表示测得i.i.d样本数,则当值不可计算时恒有:

                    

  对所有充分大的成立。式中为标准正态分布累积函数,是个样本的总Fisher信息。c为可选的正数。

  我们取c=3,查正态累积值表知约为0.0015,故估计量对真值的偏离不超出范围的概率至多到0.9985。换言之,在置信水平不低于99.85%的要求下,只能精确到的区间。其他置信度的情形可自行代换c值类推,不论如何,精确程度决定于总Fisher信息的高低,Fisher信息量越小,估计范围就越大越失准。这性质同Cramer Rao不等式相仿,但这里对有偏的估计量同样适用。

  此式的趣味之一在于:它只针对不可计算的参数值。若可计算,则有很自然的反例:令(与样本无关的常数),既然可计算,这也算是个可计算估计量(“一只停了的钟每天也准两次”)。显然它在处不遵守上述规律——它偏离真值的概率始终是0,与样本量n无关。但正如前文所叙,可计算的参数值是凤毛麟角,此种形同套用已知值作弊的做法被不可计算性阻挡了。

你可能感兴趣的:(可计算的估计量)