可汗统计学习笔记2

1、中心极限定理 (Central Limit Theorem)

1)中心极限定理

随着样本容量(Sample size) n趋于无穷,

样本均值(Sampling Distribution of the Sample Mean)越接近正态分布
样本均值的标准差(Standard Error of the Mean) 变小:偏度(Skew)更接近于0,峰度(Kurtosis)也更接近于0
大数定律 Law of Large Number:随着样本容量n越大,样本均值越接近总体均值

除了样本均值,样本众数、样本和,样本极差等统计量也适用

一般n>30即可看作样本均值为正态分布

2)样本均值的抽样分布
样本均值的标准差(Standard Error of the Mean)
3)实例
(1)男性在户外活动时平均喝2L水(标准差是0.7L)。50人全天户外旅行,准备110L水.这些水不够的概率是多少?

从实际问题抽取出数学概念:
50个人看作样本,样本容量 n=50
n=50
50人准备110L水,即平均喝水 x¯=110/50=2.2L
x=110/50=2.2L,均值分布服从正态分布
求水不够的概率,等价于求平均喝水超过2.2L的概率P(x¯>2.2)=?
P(x>2.2)=?

样本均值抽样分布的标准差
可汗统计学习笔记2_第1张图片
置信区间

1)置信区间是什么?
在样本估计总体均值时,我们需要知道估计的准确度,因此选定一个区间[a,b],目的是让这个区间包含总体均值,这个区间叫做置信区间。

对于这个区间有多大概率包含总体均值,这个概率称为置信水平,是我们对这个范围的可信程度。。置信水平是根据实际问题自己确定的,一般设定为95%即两个标准差。
可汗统计学习笔记2_第2张图片
3)实例
(1) 某地区教学区获得一批技术拨款,用于在教师中安排4台一组的计算机.该区总共有6250名教师,随机抽取250名,并且问他们是否认为计算机是教师必备的教学工具.抽取的教师中,有142名认为计算机是教学必备的工具.

问题1:
计算一个99%置信区间,其中教师认为计算机是必备的教学工具.

定义:
1表示计算机被认为是必备工具,占比为p,
0表示计算机被认为不是必备工具,占比为q=1-p.
可汗统计学习笔记2_第3张图片
z表格的值应该为0.99/2+0.5=0.995
对应2.58个标准差处
0.568±2.58×0.031=0.568±0.080.568±2.58×0.031=0.568±0.08
即 0.488∼0.648=48.8%∼64.8%0.488∼0.648=48.8%∼64.8%
有99%的几率,48.8%~64.8%的老师认为计算机是必备的

你可能感兴趣的:(统计学,可汗)