抽样与抽样分布——中心极限分布、点估计

1. 抽样

1.1简单随机样本

容量为N的总体中,抽取一个容量为n的样本,如果容量为n的样本中,每一个可能的样本都以相等的概率被抽取,那么该样本为简单随机样本。

1.2随机样本

从一个无限总体中抽取一个容量为n的样本,如果满足:(1)每个抽取的个体都来自同一个总体;(2)每个个体的抽取都是独立的。则该样本是一个随机样本。

2. 点估计

2.1 参数

总体的数字特征记为参数。例如总体均值、标准差、比率。

2.2 样本统计量

为了估计总体参数,计算相应的样本特征-----样本统计量。例如:样本均值、样本标准差。

2.3 估计量

2.4 点估计值

根据一个具体的样本计算出来的估计量的数值称为估计值

要估计一个班学生考试的平均分数,从中抽取一个随机样本,全班的平均分数就是参数根据样本计算的平均数就是一个估计量,假定计算出来的样本平均分数是80分,这个80分就是估计量的具体数值,称为估计值 

2.5 点估计

3抽样分布

3.1样本均值]的抽样分布

3.1.1 样本均值的数学期望


3.1.2 样本均值的标准差

3.1.3的抽样分布的形式

总体服从正态分布   任何样本容量下样本均值的抽样分布都是正态分布。

总体不服从正态分布 中心极限定理可以帮助我们确定样本均值的抽样分布的形状。

中心极限定理

从总体中抽取容量为n的简单随机样本,当本容量很大时,样本均值的抽样分布近似服从正态概率分布。

样本容量多大时,才可以应用中心极限定理?

当样本容量>=30时,样本均值的抽样分布可用正态分布近似。

当总体是严重偏态或者出现异常点时,需要样本容量达到50。

3.1.4 样本容量与样本均值的抽样分布的关系

我们对样本均值的抽样分布感兴趣的实际原因是,它可以用来提供样本均值和总体均值的值之间差异的概率信息。

随着样本容量的增加,均值的标准误差减少。样本容量越大,样本均值落在总体均值附近某一特定范围内的概率也越大。

 

3.2 样本比率的抽样分布

3.2.1 样本比率的数学期望

3.2.2 样本比率的标准差

3.2.3 样本比率的抽样分布的形态

3.3 点估计的性质

无偏性、一致性、有效性。 

3.3.1 无偏性

无偏性 上面有介绍。

3.3.2 有效性

有较小标准误差的点估计量比其他点估计量更相对有效。

3.3.3 一致性

随着样本容量的增大,点估计量的值与总体参数越来越接近,则称该点估计量是一致的。

3.4 其他抽样方法

分层随机抽样、整群抽样、系统抽样都是概率抽样。

方便抽样、判断抽样是非概率抽样。

3.4.1 分层随机抽样

总体中的个体首先被分成称作层的组,总体中的每一个个体属于且仅属于某一层。当每一层的个体都尽可能地相似时,得到的结果最佳。

分层以后,从每一层抽一个简单的随机样本。将每层的样本结果合并,利用公式对感兴趣的总体参数进行估计。

3.4.2 整群抽样

总体中的个体首先被分成称作群的单个组,总体中的每一个个体属于且仅属于某一群。以群为单位抽取一个简单随机样本,抽出的群的所有个体组成一个样本。当群中的个体不同质时,得到的结果最佳。

3.4.3 系统抽样

简单随机抽样的另一个替代方法是系统抽样。

eg:希望从5000个个体的总体中选取样本容量为50的样本,我们从总体每50/5000=100个个体中选取一个为样本点。在系统抽样情形下,即为在总体清单的钱100个个体中随机选取一个,然后从第一个已选出的个体开始,依次向下,在总体清单中每隔100个个体选取一个为样本点。

 3.4.4 方便抽样

非概率抽样技术。样本的确定主要基于简便。

3.4.5 判断抽样

由对研究总体非常了解的人主观确定选择总体中他认为最具代表性的个体组成样本。

参考 商务与经济统计


你可能感兴趣的:(抽样与抽样分布——中心极限分布、点估计)