整理总结:深入浅出统计学——置信区间的构建

参考资料:电子工业出版社的《深入浅出统计学》

前言

我们的确可以使用点估计量来估计总体均值、方差或一定比例的精确值,但是我们始终无法确定我们使用的样本一定是无偏样本,因此我们考虑使用置信区间的方法来估计总体统计量,因为它是考虑了不确定性的方法。

本篇目录

  • 参考资料:电子工业出版社的《深入浅出统计学》
    • 前言
    • 具体内容
      • 一、置信区间的求解 —— 总体正态、样本正态
        • 1、选择总体统计量
        • 2、求出其抽样分布
        • 3、决定置信水平
        • 4、求出置信上下限
      • 二、置信区间的简便算法
        • 1、统计量的抽样分布符合正态分布时
        • 2、统计量的抽样分布符合T分布时
      • 三、特殊情况 —— 总体正态、样本T分布
        • 1、选择总体统计量
        • 2、求 X ‾ \overline X X的概率分布
        • 3、决定置信水平
        • 4、求出 μ \mu μ的置信上下限

具体内容

糖果公司用一个包含100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,于是便在电视节目黄金时段宣布其公司糖球口味的平均持续时间为62.7分钟,但有人自行做了测试,得出了不同的结果,威胁要起诉糖果公司。
此时,我们应该制定的是总体均值的估计值的区间范围,而不是一个精确值,因为这样的话会给予我们更大的误差空间,就不容易被人起诉了。

一、置信区间的求解 —— 总体正态、样本正态

1、选择总体统计量

在问题中,需要为糖球口味持续时间的均值来构建区间,于是需要为总体均值 μ \mu μ来构建一个置信区间。

2、求出其抽样分布

为了求出总体均值的抽样分布,我们需要先计算出 X ‾ \overline X X的期望、方差和分布。而这些在上一节中已经计算过了。整理总结:深入浅出统计学——置信区间的构建_第1张图片
此时一个问题是我们现在并不知道总体的方差是多少,但是我们可以借用点估计法 μ ^ \hat{\mu} μ^ s 2 s^2 s2 来近似替代,因为这已经是我们目前所具有的数据中可以得到的最近似的值了。公式进一步推导成如下形式。在这里插入图片描述
对于样本均值的分布,我们可以根据"若X符合正态分布,那么 X ‾ \overline X X也符合正态分布"的定理来得知,其应符合正态分布。在本题中即是 X ‾ ∼ N ( μ , s 2 n ) \overline X \thicksim N(\mu,\frac{s^2}{n}) XN(μ,ns2)

3、决定置信水平

置信水平表明你希望自己对于“总体统计量落入置信区间”的这一说法有多大的把握,比如我们希望总体均值的执行水平为95%,这表明总体均值处于置信区间的概率为0.95,当然可以更高如99%,这样糖果公司就可以更有信心在广告宣称“总体均值位于这个置信区间”这一说法。
值得注意的是,置信水平越高,区间越宽,也就是确定的概率越大,范围越广,也越对说法有把握。
为了防止说法几乎毫无意义,我们需要确定一个合适的置信水平,确保范围小而可靠,对此,我们一般采用95%作为常用置信水平。整理总结:深入浅出统计学——置信区间的构建_第2张图片

4、求出置信上下限

根据抽样分布和选择好的置信水平来求出置信上下限,从而确定置信区间的范围。整理总结:深入浅出统计学——置信区间的构建_第3张图片
此时我们再将 X ‾ \overline X X进行标准化,从而利用正态分布表来查出其对应的区间值。
在这里插入图片描述
此时我们将括号里面的不等式进行展开,即可确定置信区间范围,其中 X ‾ \overline X X可以通过样本 x ‾ \overline x x来计算。
整理总结:深入浅出统计学——置信区间的构建_第4张图片
得出最后结果。
整理总结:深入浅出统计学——置信区间的构建_第5张图片

二、置信区间的简便算法

1、统计量的抽样分布符合正态分布时

整理总结:深入浅出统计学——置信区间的构建_第6张图片整理总结:深入浅出统计学——置信区间的构建_第7张图片

2、统计量的抽样分布符合T分布时

整理总结:深入浅出统计学——置信区间的构建_第8张图片

三、特殊情况 —— 总体正态、样本T分布

糖果公司想求出糖球重量的置信区间,但只抽取了少量的样本,比如抽取了一个具有代表性的样本,共10颗,然后称了每一粒糖球的重量,计算出这个样本的 X ‾ \overline X X=0.5, s 2 s^2 s2=0.09,此时该如何求出其置信区间。

1、选择总体统计量

我们需要为糖球重量均值构建一个置信区间,也就是要为总体均值 μ \mu μ构建置信区间。

2、求 X ‾ \overline X X的概率分布

当总体符合正态分布, δ 2 \delta^2 δ2未知,且可供支配的样本很小时, X ‾ \overline X X符合T分布。而当样本数量为n个时,T分布的形式为 T ∼ t ( n − 1 ) T\thicksim t(n-1) Tt(n1),而 T = X ‾ − u s / n T=\frac{\overline X - u}{s/\sqrt{n}} T=s/n Xu,也就是说在这道题中 T = X ‾ − u s / n ∼ t ( 9 ) T=\frac{\overline X - u}{s/\sqrt{n}} \thicksim t(9) T=s/n Xut(9)整理总结:深入浅出统计学——置信区间的构建_第9张图片

3、决定置信水平

一般设置为95%。

4、求出 μ \mu μ的置信上下限

整理总结:深入浅出统计学——置信区间的构建_第10张图片
再利用T分布概率表可求出 P ( T > t ) = p P(T>t)=p P(T>t)=p中的t值,在这道题中p=0.025。
整理总结:深入浅出统计学——置信区间的构建_第11张图片

你可能感兴趣的:(Math)