[统计学理论基础] 置信区间

1. 点估计和区间估计

例如:刮刮卡
[统计学理论基础] 置信区间_第1张图片

2. 置信区间

置信区间又称估计区间,是用来估计参数的取值范围的。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。

2.1 计算步骤

第一步:求一个样本的均值
第二步:计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%;
500个样本的抽样误差为±5%;
1200个样本时的抽样误差为±3%;
第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
置信区间=点估计±(关键值× 点估计的标准差)

2.2 性质

窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则

置信区间 间隔 宽窄度 表达的意思
0-100分 100 等于什么也没告诉你
30-80分 50 较窄 你能估出大概的平均分了(55分)
60-70分 10 你几乎能判定全班的平均分了(65分)

2.3 置信水平

置信水平是指总体参数值落在样本统计值某一区内的概率。
假如设定的置信水平为95%,即做100次抽样,会有95个置信区间包含了总体平均值。

2.4 置信区间与置信水平、样本量的关系

(1)样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。

实例分析:
[统计学理论基础] 置信区间_第2张图片
由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一半(实践证明,样本量要增加4倍,置信区间才能变窄一半),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。

(2)置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。

2.5 实例分析

美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:
[统计学理论基础] 置信区间_第3张图片
由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。

参考文章
https://www.zhihu.com/question/26419030
https://baike.baidu.com/item/%E7%BD%AE%E4%BF%A1%E5%8C%BA%E9%97%B4/7442583?fr=aladdin
http://www.360doc.com/content/18/0317/16/15033922_737796626.shtml

你可能感兴趣的:(统计学)