数据分析--------统计学-------置信区间例题2

总体有6250人,从中抽样250人,其中142人认为教室安装电脑有必要,108人认为没必要。

(1)计算认为有必要的概率是99%的置信区间。

(2)在保证概率是99%的前提下该如何缩小置信区间


(1)分析:只有两种情况,一种是有必要,另一种是没必要。是伯努利分布。假设不必要是0,发生概率是1-p。必要是1,发生概率是p。

数据分析--------统计学-------置信区间例题2_第1张图片

按照上述公式计算样本均值和样本方差。

样本均值=(0x108+1x142 )/250=0.568

样本方差(修正后)=(142x(1-0.568)²+108x(0-0.568))/(250-1)=0.246

样本标准差=0.5

样本均值的抽样分布是正态分布。样本均值的均值=总体期望。参考https://blog.csdn.net/cuicui_ruirui/article/details/108287650中的矩估计法。样本均值可以用来估计总体均值,所以总体均值=0.568。因为样本均值的均值等于总体均值,所以样本均值的抽样分布的均值=0.568。

数据分析--------统计学-------置信区间例题2_第2张图片

样本均值的抽样分布的方差等于σ²/n。此处σ是总体标准差,总体标准差可以用样本标准差来估计,所以总体标准差=0.5,n是样本容量250,得到样本均值的抽样分布的标准差=0.031。

此处参考https://blog.csdn.net/cuicui_ruirui/article/details/108294598。一个正态总体的期望的区间估计。此处的枢轴变量是样本均值,对样本均值的分布做标准化,成为关于y轴对称的标准正态分布。1-α=99%,α/2=0.5%。图像上α/2左侧的概率是99.5%,在z分数表上找到值为99.5%对应的z分数是2.58即u(α/2)。得到结果是0.568-0.031x2.58<μ<0.568+0.031x2.58,即置信区间是(0.488,0.648)

数据分析--------统计学-------置信区间例题2_第3张图片

 


(2)增大样本容量。

样本容量增大,抽样分布的标准差减小,而置信区间是加减一定倍数的标准差,置信区间就会随之减小

你可能感兴趣的:(数据分析--------统计学-------置信区间例题2)