很多时候,我们不清楚统计量的分布,或不确定对它所作的假设是否合理。蒙特卡罗模拟可以处理这些情况,它的应用包括:
1)当待检测统计量(the test statistics)从未知时,进行推断
2)当参数假设(parametric assumptions),评估推断方法的性能
3)在各种情况下进行假设检验
4)比较不同检测子(estimator)的质量
用于推断统计的蒙特卡罗模拟的根本思想是:统计量的特征可通过从相同总体中重复抽样,并观察统计量在这些样本上的表现来获得。
第一步是决定一个伪总体(pseudo-population),假设它可以表达真实总体。这里“伪”是为了强调样本是利用计算机和伪随机数生成的。同时,这里讨论的蒙特卡罗模拟类型都是参数化的技术,应为都是从已知的或假设的分布中抽样。具体步骤:
1)确定伪总体,或可表达真实分布的模型
2)从伪总体中抽样
3)计算统计量的值
4)重复2、3,进行M次实验
5)利用4中获得的M个统计量值来研究统计量的分布
需要注意的是:从伪总体中抽样时,要保证所有相关特征反映同样的统计状况。例如,相同的样本大小和抽样策略。这意味着,通过此方法获得的统计量分布仅对此抽样过程和伪总体假设有效。
最后一步就是利用对统计量分布的估计来研究感兴趣的统计特征。如估计偏度、峰度、标准差等。
在统计假设检验中,利用检验统计量null hypothesis应该被拒绝或接受的信度。当观测到检验统计量的值后,需要通过判断这个值是否与null hypothesis一致。估计检验统计量在null hypothesis下的分布是蒙特卡罗假设检验的目标之一。
回顾假设检验的critical value approach:首先给定置信水平(significance level)a;然后利用此a找到在null hypothesis为真下检验统计量分布上的置信区间(critical region)。而在蒙特卡罗方法中,我们利用假设统计量的估计分布来确定置信值的,步骤如下:
1)利用总体的大小为n的随机样本(这时实际观测的数据),计算检验统计量的观测值
![]()
2)确定一个能反映null hypothesis为真下真实总体特征的伪总体
3)从伪总体中抽样n次,形成大小为n的随机样本
4)利用3中的随机样本,计算检验统计量的值
5)重复3和4共M次,获得值
,它们就是对null hypothesis为真条件下的检验统计量分布的估计
6)获得对于给定置信水平a下的critical value
Lower Tail Test: get the a-th sample quantile,
, from the
.
Upper Tail Test: get the (1-a)-th sample quantile,, from the
.
Two-Tail Test: get the sample quantilesand
from the
.
例:关于总体均值的假设检验。数据mcdata有25条记录;null and alternative hypotheses为: ;检验统计量为
。分析过程如下:
2)确定
的正态分布为伪总体的分布模型(即null hypothesis为真条件下的检验统计量的分布)。通过绘制下面的qq图,从而验证此模型的合理性。
3)重复1000次实验。每此都从null hypothesis(正态分布
)为真条件下的检验统计量分布抽样,并计算检验统计量的值,Tm中保存了检验统计量的估计分布
M = 1000;% Number of Monte Carlo trials % Storage for test statistics from the MC trials. Tm = zeros(1,M); % Start the simulation. for i = 1:M % Generate a random sample under H_0 % where n is the sample size. xs = sigma*randn(1,n) + 454; Tm(i) = (mean(xs) - 454)/sigxbar; end4)估计lower tail的critical value,得到它为![]()
% Get the critical value for alpha.
% This is a lower-tail test, so it is the
% alpha quantile.
alpha = 0.05;
cv = csquantiles(Tm,alpha);