研究随机问题时,基本都要用到抽样仿真,比较仿真结果与实验结果的偏差。
设随机变量的均值为 μμ,方差为 σ2σ2,则 nn 个样本的均值为 μμ,方差为 σ2nσ2n。
在给定的置信水平 1−α1−α 下, 设样本的均值为 X¯¯¯¯X¯,其误差 εε 由下列计算公式得出:
ε=|X¯¯¯¯−μ|ε=|X¯−μ|
1. 若 σσ 已知
由于中心极限定理,大量样本服从正态分布,样本的标准差为 σ/n−−√σ/n,根据正态分布概率的计算公式,
Φ(|X¯¯¯¯−μ|σ/n−−√)=α/2Φ(|X¯−μ|σ/n)=α/2
因此,
ε=|X¯¯¯¯−μ|=Zα/2σn−−√ε=|X¯−μ|=Zα/2σn
可以推出样本容量 nn 的计算公式为:
n=Z2α/2σ2ε2n=Zα/22σ2ε2
2. 若 σσ 未知
大部分情况下 σσ 是未知的,为了消除 σσ 的影响,有学者引入了 tt 分布,
t=X¯¯¯¯−μS/n−−√t=X¯−μS/n
上面这个表达式为 自由度为 n−1n−1 的 tt 分布,其中 SS 为样本方差,则
ε=|X¯¯¯¯−μ|=tα(n−1)Sn−−√ε=|X¯−μ|=tα(n−1)Sn
得到 nn 的计算公式为:
n=t2α(n−1)S2ε2n=tα2(n−1)S2ε2
在样本容量 n>30n>30 时,置信水平 α<0.05α<0.05时,一般可以近似采用下面的计算公式:
n=4S2ε2n=4S2ε2
若样本容量实在很小,则采用 “试差法” 确定 nn.
参考资料:
1. https://en.wikipedia.org/wiki/Student%27s_t-distribution
2. https://wenku.baidu.com/view/45a2dab5f605cc1755270722192e453610665bef.htmlrec_flag=default&sxts=1531916030126