统计|如何理解区间估计中σ已知和未知的情形

本博文源于《商务统计》,区间估计对于一些初学者来说是非常头痛的事情,公式有多,看有么看不懂,不知道如何去做,去估计置信区间。本博文就以熟悉的例子来理解σ已知和未知的情形。

区间估计起源

总体和样本是两个概念,我们总想让样本的一些特性去估计总体的属性,现实中根据前人已经总结好的定律:大数定律。告诉我们,只要样本足够大就能清晰描述总体的属性。而且样本大一定能服从正态分布。
统计|如何理解样本足够大样本就一定服从正态分布
那么这时候我们可以用样本的一些属性较好的模拟出总体的分布。

区间估计:正态总体,σ^2已知

前面提到样本大就一定服从正态分布,样本大在我们统计学中一般认为n>30即可,即使样本<30,但题目中已经告诉你正态总体的情况下,其实也可以。σ^2就是样本方差…这时候我们用正态分布统计量z来搞定区间估计:
统计|如何理解区间估计中σ已知和未知的情形_第1张图片
统计|如何理解区间估计中σ已知和未知的情形_第2张图片

或许根本不需要理解z的具体内容,只需要知道z一般题目中会在这种前提下会告诉你,比如这题:

例子:食品检测标准案例

统计|如何理解区间估计中σ已知和未知的情形_第3张图片

解决实验步骤

  • 求取25袋食品重量的均值
  • 然后将题目中的量化为参数带进公式
  • 计算公式的值,求取结果。

实验内容解决细节

  • 25袋食品质量平均值105.36
  • z统计量是95%置信水平区间,因此是1.96
  • 标准差σ告诉我们是10
  • n就是样品容量是25
    统计|如何理解区间估计中σ已知和未知的情形_第4张图片

区间估计:正态总体、σ^2未知,小样本

当σ^2不知道的时候,σ也就是标准差,标准差的平方就是方差,方差未知,可以根据t分布统计量去模拟,为什么t统计量,因为《统计学》中,有一张t分布表,t分布是正态分布小样本形态,随着样本增大,t分布逐渐逼近正态分布。这时候置信区间公式就变成了:
统计|如何理解区间估计中σ已知和未知的情形_第5张图片

  • t就是服从n-1自由度下的多少置信水平的值
  • s就是样本标准差
  • n就是样本的数量
  • x把 就是样本均值

例子:灯泡寿命置信区间

统计|如何理解区间估计中σ已知和未知的情形_第6张图片

解决实验步骤

  • 计算样本平均值x把
  • 计算样本标准差s
  • 查出t表,t的自由度是样本大小-1
  • 套用公式收获喜悦

实验内容细节

  • n=16
  • 1-α=95%
  • t(α/2)=2.131
  • 样本均值x拔为1490
  • s标准差为24.77
  • 代入公式,求取结果
    统计|如何理解区间估计中σ已知和未知的情形_第7张图片

总结

区间估计是我们根据样本的性值去估计总体的分布一个很好的手段,而一般的形式无非是:点估计±临界值 * 标准误差,然后根据σ已知和未知去分类,如果已知那就是正态分布z统计量,如果未知那就是t分布统计量。

你可能感兴趣的:(线代概率,统计学,机器学习,数据分析,人工智能)