第17章 人口抽样调查

《人口原理概论》第17章 人口抽样调查

一、人口抽样调查的涵义及特性
人口抽样调查,简称为人口抽查,它是进行人口调查的一种方法,是为了一定的研究目的,采取随机抽样的形式,对人口总体中的一部分进行调查,用以推断说明人口总体情况的一种调查方法。例如,为了掌握全国人口年龄和性别的构成情况,便可以按照随机抽样的原则,对某一地区或某几个单位人口状况进行全面调查,并将调查结果作为全国或一个地区的缩影,进而推断全面的人口年龄和性别的构成状况。
人口抽样调查在人口研究领域有着广泛的用途。例如,对人口出生率、死亡率、自然增长率、人口总数、人口构成、人口变动等,都可以通过抽样调查取得所需要的基础数据。由此看来,人口抽查决不是人口普查的辅助手段,决不是可有可无的,而是比人口普查更简便的一种科学的人口调查手段。人口抽查与人口普查各有利弊,各有其相适应的调查内容。人口普查适应全面的综合的调查,调查内容全面、数据准确,然而工作量大,比较复杂,不宜频繁进行。人口抽查只适应进行专题的单项的调查,调查内容不全面、推断数据不够准确,然而工作量小,比较简单,可以经常进行。
人口抽样调查具有两方面的特点:一方面,抽样调查时必须是随机抽样,而决不能是人们主观地有意识地选择,这是抽样调查与一般调查的根本区别。如果按照事先已准备好的“样板”和“典型”去进行调查,那就不能算是抽样调查。另一方面,根据样本指标推断说明总体,这一点与典型调查有点相似,即用局部调查的结果说明一般,用点说明面。如果调查只限于说明局部和个别现象,便失去了抽样调查的意义。
二、人口抽样调查的过程
人口抽样调查是一个过程,完成这一过程,大体要经过以下几个步骤:
(一)确定全及总体和抽样总体
进行人口抽样调查,首先要明确调查的对象。抽样调查的对象分为两个方面:一方面是全及总体,另一方面是抽样总体。全及总体是指被调查研究范围内的全部单位所构成的总体,又简称为总体,一般用符号N(大写)表示。抽样总体是指从全及总体中抽选出来以准备进行调查的那部分单位数所构成的总体,又简称为样本,一般用符号n(小写)表示。
例如,我们的调查对象是黑龙江省某市近五年来初婚女子平均年龄,以便研究全市女性初婚者的晚婚状况。那么,全市近五年来所有初婚女子人数,就是一个全及总体。当我们根据一定的抽样原则,从上述全及总体中抽出一部分近五年内的初婚女子人数所构成的总体,则是抽样总体。
(二)确定抽样平均数指标和抽样成数指标
根据人口抽样指标所反映的事物或现象的性质划分,一般分为抽样平均数指标和抽样成数指标:
1、抽样平均数指标
抽样平均数指标是根据抽样总体数字特征计算的反映事物或现象的平均水平一类的指标。例如,上例抽样总体中所研究的是全市近五年内的初婚女子人数。在此基础上计算这些初婚女子的平均初婚年龄,就是抽样平均数指标。抽样平均数一般用x(小写)表示。
2、抽样成数指标
抽样成数指标是根据抽样总体数字特征计算的反映事物或现象的比例性质一类的指标。例如,根据人口抽样总体计算的育龄妇女的一胎比例,即一胎率;育龄妇女中的不婚、不育比例,即不婚率、不育率;已婚妇女中婚后不同年份的生育比例分布等指标,都属于抽样成数一类性质的指标。抽样成数指标
一般用p(小写)表示。
(三)确定全及平均数指标和全及成数指标
全及平均数指标是与抽样平均数指标相对应的指标,它是反映全及总体中平均数一类性质的指标。
全及成数指标与抽样成数指标相对应的指标,它是反映全及总体中比例一类性质的指标。全及平均数一般用符号X(大写)表示,全及成数一般用符号P(大写)表示。
(四)分析抽样误差
抽样误差是抽样调查中引起的误差,是指按照随机原则抽样时所得抽样指标与全及总体指标之间的差数。它等于抽样平均数与全及总体平均数之差,或等于抽样成数与全及总体成数之差,抽样误差一般用符号u(小写)表示。
(五)对总体指数进行推断
抽样调查的目的,在于用抽样调查所得的样本指标去对全及总体指标进行推断说明。具体来说,就是用样本平均数指标去推断说明相应的全及平均数指标,用抽样成数指标去推断说明相应的全及成数指标。这就是对总体指数进行推断。
由于概率论是抽样研究的理论基础,因此,在对总体进行推断时,必须根据一定的概率保证进行推断。推断的具体方法如下:
1、全及平均数的推断
全及平均数 X = 样本平均数 x ± 抽样平均数误差 ux × 概率度 t
例如,对某市初婚妇女人口群抽出的样本进行调查计算,其平均初婚年龄为25、3岁,抽样平均数误差为0、142岁,当要求在95、45%的概率保证下,即取相应的概率度t为2时,全及平均数X计算如下:
X = x ± ux t
= 25、3 ± 0、142 × 2
= 25、3 ± 0、284
= (25、016,25、584)
计算全及平均数结果表明,在以95、45%的可信概率保证下,进行抽样调查的全及总体中的全部初婚妇女的平均初婚年龄的置信区间,在25至25、6岁之间。这也就是说,被调查的某市人口群中的全部初婚妇女的平均初婚年龄在25至25、6岁之间这一推断,有95、45%的可靠性。
2、全及成数的推断
全及成数 P = 样本平均数 p ± 抽样平均数误差 up × 概率度 t
例如,经过对某市某一年龄在25岁以上已婚妇女人口群抽出的样本进行调查计算,不育比例为3、8%,抽样成数误差为0、27%。这样,当要求在68、27%的概率保证下,即取相应的概率度t为1时,这一
已婚妇女人口群的不育比例,可按下式推断:
P = p ± up t
= 3、8% ± 0、27% × 1
= 3、8% ± 0、27%
= (3、53%,4、07%)
以上全及成数推断结果表明,在以68、27%的可信概率保证下,这一抽样调查的全及总体中的全部25岁以上已婚妇女中,不育者的比例置信区间在3、53%到4、07%之间。也就是说,全部25岁以上已婚妇女中,不育者的人数比例为3、53%到4、07%之间这一推断,有68、27%的可靠性。
三、人口抽样调查的方法
人口抽样调查的方法多种多样,现介绍下列几种方法:
(一)简单随机抽样法
简单随机抽样,就是完全按照随机的原则,从全及总体中抽取调查单位的抽样方法。人口简单随机抽样,通常是先将总体各单位进行编号,然后用随机方法进行抽样。具体方法有以下两种:
1、抽签或拈阄。就是先将总体各单位编号,并依号制成纸签、竹签或纸团,然后加以混合,再按照抽样数目,从中随机抽取。
2、用“随机数表”法进行抽样。这就是自制一个完全由随机数字组成的数字表,用来进行简单随机抽样。
(二)等距离抽样法
等距离抽样是将全及总体各单位按照某一标志排列,即按照与抽样调查目的无关的标志排列,然后依照固定的顺序和等间隔抽取样本的方法。具体来说,分两步进行:
1、确定抽样距离
抽样距离 = 抽样总体 ÷ 抽样数目
例如,某村18岁以上女性6000人,为调查婚姻状况,确定抽取150人为样本进行调查,其抽样距离
的计算是: 抽样距离 = 6000 ÷ 150 = 40,这就是说,在进行抽样时,每隔40人抽取1人。
2、确定抽样起点
在已知6000名女性的编号和抽样距离之后,必须确定从那一个编号的女性开始抽选。具体方法是:在1-40编号的人中,用简单随机的方法,如用抓阄的办法,确定出第一个被抽的人。例如,被确定编号5的妇女被选中为起点时,那么,便可以从第5号起,以后每隔40人抽1个人。这样,被抽中的妇女的编号分别为:5;45;85;125;、、、、这种等距离抽样,由于具有抽样单位在全及总体中分布均匀的特点,其抽样误差比较小,所以,在抽样调查中得到广泛应用。不过要注意,在确定抽样距离时,对所取的抽样距离应避免与人口现象的周期性变化出现一致,否则,抽样结果的代表性就会受到影响。
(三)分层抽样法
分层抽样是先将总体按照一定的标志分为性质相近的若干个子群,然后在各子群中按照简单随机抽样或等距离抽样方法进行抽样。分层抽样的优点是缩小抽样误差,增大样本的代表性。例如,在进行生育率抽样调查时,由于人口的生育现象与人口的年龄结构有关,当育龄妇女内部的年龄结构差异很大时,就需要事先对育龄妇女按年龄进行分层,这样,就可以减少误差,增大抽样调查的代表性。
分层的方法多种多样。例如,可以按地理特征,分为山区、平原、沿海三层;可以按人口年龄结构,分为少年、青年、中年、老年四层。
(四)整群抽样法
整群抽样就是按照随机原则从总体中成群成诅地抽取调查单位的抽样调查方法。这种方法的特点是:被抽中的群或组中的每一个调查单位,都要无一例外地进行调查,样本单位比较集中,调查登记和取得资料都很方便。不过,由于样本集中,使样本在总体的分布不够均匀,因此样本的代表性较差。
(五)多阶段抽样法
多阶段抽样就是把抽取样本单位的过程分为若干阶段来进行,直到最后选出样本单位的抽样调查方法。例如,抽样调查要抽取的样本是村办小学,那么可以分四个阶段进行抽样。第一阶段是从全国抽选出省;第二阶段是从省抽选出县;第三阶段是从县抽选出乡;第四阶段是从乡抽选出村。这叫四阶段抽样。多阶段抽样的特点是:最终样本的选出须经过若干阶段,在每个阶段抽选过程中,一经后面的样本单位选出来,前面已被抽选的单位便随之被排除。因此,前几个阶段原来被抽选的单位,只是为最后阶段选出样本单位打基础,而只有最后抽选的单位才是样本单位。
四、抽样调查数目的确定
(一)确定抽样数目的意义
抽样数目是指组织一次抽样应抽选的样本单位数量。抽样数目是否合理,对于抽样调查的效果和质量直接相关。抽样数目过多,会造成人力物力财力上的浪费:相反,抽样数目过少,会使抽样的精度得不到保证。因此,确定合理数目的抽样样本,无论对于抽样质量,还是对于调查费用,都会带来好处。
(二)确定抽样数目的必备条件
要确定合理的抽样数目,满足抽样的最佳要求,必须具备一定的条件。主要是:(1)要具备相当水平的抽样技术,对各种抽样方法能够灵活运用。(2)要具备与抽样客体相关的丰富的多学科知识,这就要求调查者应掌握人口学的基本理论和政策规范。(3)要具备与抽样研究有关的丰富的实践经验,在具体讨论抽样数目时,要采取领导、专家、群众三结合的办法,使抽样数目准确、合理、适当。
(三)确定抽样数目的根据
确定抽样数目,应当依照的根据主要是:
1、根据调查对象的差异大小
若调查对象的差异比较大,样本的数目应当多抽一些。例如,调查成年人口文化构成,从大学到小学或者文盲,不同地区、不同职业的文化程度相差较大,因此就需要将抽样数目确定多一些。相反,若调查对象的差异比较小,样本的数目应当少抽一些。例如,在实行计划生育的情况下,城市间独生子女率的差异一般比较小,样本数目可以少抽一些。
2、根据研究目的的精细程度
一般来说,当研究目的对抽样要求详细、精确时,样本数目可以多抽一些;相反,如果研究目的对抽样要求粗略时,样本数目可以少抽一些。如调查在职职工文化构成和性别构成时,可以多取一些样本,力争精确细致;而当调查农村少年入学率时,可以少取一些样本,只取得大概比例就可以了。
3、根据全及总体单位的数量多少
一般来说,全及总体单位的数量多,抽样数目也要多些;反之,全及总体单位的数量少,抽样数目也要少些。例如,调查各育龄年龄段的妇女生育情况,抽样数目要多一些;而调查某一年龄段育龄妇女生育情况,抽样数目可少一些。

(此专著出版于1990、9、25 黑龙江人民出版社,主编王振岳、聂鸣、石永利。获佳木斯市委党校优秀科研成果一等奖,获佳木斯市优秀科研成果二等奖,获黑龙江省党干校系统优秀科研成果三等奖,获中国人口学会优秀科研成果佳作奖,获佳木斯市委宣传部市文联市社联市图书馆优秀科研成果奖。)

 

转载于:https://www.cnblogs.com/wzy52413616/p/4525910.html

你可能感兴趣的:(第17章 人口抽样调查)