常见概率抽样方法及其适用场景总结(简单随机抽样、分层抽样、整群抽样、系统抽样)

常见概率抽样

抽样一般分为概率抽样非概率抽样两大类,本文主要讨论概率抽样

所谓概率抽样,是指按照一定的概率从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法。

主要介绍简单随机抽样 、分层抽样 、整群抽样 、系统抽样 以及多级抽样这五种概率抽样方法。

1. 简单随机抽样

简单随机抽样(simple random sampling ,SRS)是最简单的概率抽样方 法 ,也是其他抽样方法的基础 。

方法:从一个单元数为 N 的总体中逐个抽取单元并且无放回 ,每次都在所有尚未进入样本的单元中等概率地抽取 ,直到 n个单元抽完。

适用场景

  • 当总体N较小
  • 总体方差S2与任意局部方差基本相当的情况;

2. 分层抽样

分层抽样(stratified sampling)是指先按照某种规则把总体划分为不同的层 ,然后在层内再进行抽样 ,各层的抽样之间是独立进行的 。

特别地 ,如果各层内是简单随机抽样 ,则称为分层随机抽样 。

分层抽样的估计是先在各层内进行的 再由各层的估计量进行加权平均或求和 ,从而得出总体的估计量 。

适用场景:

  • 适用于层间有较大的异质性,
  • 每层内的个体具有同质性的总体;

3. 整群抽样

整群抽样(cluster sampling)是指先把总体中的个体划分成称作群的单个组,总体中的每一个个体属于且仅属于某一群。以群为单位抽取一个简单随机样本。

当群中的个体不同质时,整群抽样得到的结果最佳。

在理想状态下,每一群是整个总体小范围内的代表。

整群抽样的值依赖于每一群对整个总体的代表性。如果所有的群在这个意义上是同质的,则抽取小量的群就可以得到关于总体参数的好的估计。

适用场景:适用于群间差异小、群内各个体差异大、可以依据某种特征差异来划分的群体;

4.系统抽样

系统抽样(systematic sampling)是指先将总体中的抽样单元按某种次序排列 ,在规定范围内随机抽取一个初始单元 ,然后按事先规定的规则抽取其他样本单元 。

特别地 ,如果在抽取初始单元后按相等的间距抽取其余样本单元 ,则称为等距抽样 。

适用场景:适用于容量很大且个体的排列是按照随机顺序排列的总体;

5. 多级抽样

多级抽样(multi-stage sampling)可以看作整群抽样的发展 ,在抽得初级抽样单元后 ,并不调查其全部次级单元 ,而是再进行抽样 , 从入选的初级单元中抽选次级单元 ,这种抽样方法称为二阶段抽样 。

二阶段的第一阶段指抽取初级单元 ,第二阶段是指抽取次级单元(在二阶段抽样中,也就是基本抽样单元)。

类似地 ,可以定义三阶段抽样 :先抽取初级单元 ,在其中继续抽取次级单元 ,在抽中的次级单元中再抽取三级单元(基本单元)。依此类推 ,可定义四阶段抽样等 。二阶及二阶以上抽样统称为多级抽样 。

适用场景:适用于分布情况复杂,不易从总体中直接抽取调查单位作为样本的情况;

————————————————

你可能感兴趣的:(机器学习,机器学习,深度学习,算法,线性代数)