1什么是二手资料?使用二手资料需要注意些什么?
答:(1)如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据,即二手资料。
(2)在使用二手资料前,对二手资料进行评估是必要的。对二手资料进行评估应考虑如下一些内容:
①资料是谁搜集的?这主要是考察数据搜集者的实力和社会信誉度。
②搜集的目的是什么?为了某个集团的利益而搜集的数据是值得怀疑的。
③数据是怎样搜集的?搜集数据可以有多种方法,不同方法所采集到的数据,其解释力和说服力都是不同的。如不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。数据的质量取决于数据的生产过程。
④什么时候搜集的?对于过时的数据,其说服力自然受到质疑。
另外,使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。
2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
答:(1)概率抽样和非概率抽样的特点
①概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据样本的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间;在进行抽样设计时,对估计的精度提出要求,可以计算出所需要的样本量;概率抽样的技术含量更高,无论抽选样本还是对调查数据进行分析,都要求掌握较多的统计学专业知识,调查的成本也比非概率抽样的高。
②非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确定的,因此无法使用样本的结果对总体相应的参数进行推断。非概率样本的特点是操作简便、时效快、成本低,而且对于抽样中的统计学专业技术要求不是很高。
(2)概率抽样和非概率抽样适用的情况
①若调查的结果要求对总体的有关参数进行估计,计算估计的误差,得到总体参数的置信区间,并对估计的精度提出了要求,则应选择概率抽样,如调查不同年龄层的消费水平等。②非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做准备。非概率抽样也适合市场调查中的概念测试,如产品包装测试、广告测试等,这时不需要将调查结果投影到总体的情况。
3调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法?答:搜集数据的方法除了自填式、面访式、电话式,还有观察式,即调查人员通过直接观测的方法获取信息,如利用安置在超市中的录像设备观察顾客挑选商品时的表情;在十字路口通过计数的方法估算车流量等。4自填式、面访式、电话式调查各有什么利弊?
答:(1)自填式是指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷
①自填式的长处:
a.调查组织者对自填式方法的管理相对容易,只要把问卷正确地送达被调查者手中即可;b.调查成本最低,增大样本量对调查费用的影响很小,所以可以进行大范围的调查;
c.被调查者可以选择方便的时间填答问卷,可以参考有关记录而不必依靠记忆进行回答。这种方式可以在一定程度上减小被调查者回答敏感问题的压力。
②自填式的弊端:
a.问卷的回收率比较低;
b.自填式方法不适合结构复杂的问卷,调查的内容会受局限;
c.调查周期通常都比较长;
d.对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。
(2)面访式是指现场调查中调查员与被调查者面对面,调查员提问、被调查者回答
①面访式的长处:
a.可以激发被调查者的参与意识,提高调查的回答率;
b.调查员可以在现场解释问卷,回答被调查者的问题,对被调查者的回答进行鉴别和澄清,提高调查数据的质量,并且可以对识字率低的群体实施调查;
c.在问卷设计中可以采用更多的技术手段,使得调查问题的组合更为科学、合理。例如,可以借助其他调查工具(图片、照片、卡片、实物等)丰富调查内容;
d.能对数据搜集所花费的时间进行调节。
②面访式的弊端:
a.调查的成本比较高;
b.在调查过程的质量控制方面有一定难度;
c.对于敏感问题,在面对面条件下,被调查者通常不会像自填式方法下那样放松,也不愿意回答,还有可能会造假。
(3)电话式是指调查人员通过打电话的方式向被调查者实施调查
①电话式的长处:
a.速度快,能够在很短的时间内完成调查;
b.特别适合样本单位十分分散的情况,由于不需要支付调查员的交通费,数据搜集的成本比较低;c.对调查员是安全的;
d.对访问过程的控制比较容易。
②电话式的缺点:
a.容易受电话工具的限制;
b.进行访问的时间不能太长;
c.调查所使用的问卷要简洁明了,问题不能太多;
d.由于不是面对面的交流,在被访者不愿意接受调查时,要说服他们会更困难。5请举出(或设计)几个实验数据的例子。答:实验数据是指在实验中控制实验对象而搜集到的变量的数据。例如:对在一起饲养的一群牲畜,分别喂给不同的饲料,以检验不同饲料对牲畜增重的影响;对其他条件完全相同的几块农田,分别施不同的肥料,以检验不同肥料对农田收成的影响。
6你认为应当如何控制调查中的回答误差?
答:回答误差是指被调查者在接受调查时给出的回答与真实情况不符。控制调查中的回答误差需要根据导致回答误差的原因进行分析,导致回答误差的原因有多种,主要有理解误差、记忆误差和有意识误差。
(1)对于理解误差,要注意问卷中的措辞,设计一份好的调查问卷;
(2)对于记忆误差,要缩短调查所涉及的时间间隔;(3)对于有意识误差,调查人员要做好被调查者的思想工作,让他们打消顾虑;调查人员要遵守职业道德,为被调查者保密;调查中尽量避免敏感问题。
7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。
答:针对无回答误差应做好预防工作,出现了无回答误差,要具体分析导致误差的原因,进行补救。
(1)如果无回答误差是随机的,可以通过增大样本量的方式解决。
例如:调查设计要求完成1000个样本单位,结果回答了800个,无回答率为20%,这时可以再随机抽250个单位,并对其进行调查,如果无回答率仍旧为20%,就可以得到200个单位的回答。同时还应增加调查员的责任心和耐心。
(2)如果无回答误差是系统性误差,解决的途径主要在两个方面:①预防,即在调查进行前做好各方面的准备工作,尽量把无回答降到最低程度。例如,要调查某地区居民每月的生活费用支出,在可能的条件下,可充分利用调查组织者的权威性和社会影响力,激发被调查者的参与意识;另外,在调查前可预先通知、对调查作出详细的解释说明;雇佣与被调查者熟悉的人做调查员,如居民委员会成员、下岗职工等也有助于打消被调查者的顾虑。②当无回答出现后,分析无回答产生的原因,采取一些补救措施。例如:在无回答单位中再抽取一个样本,实施更有力的调查,并以此作为无回答层的代表,和回答层的数据结合起来对总体进行估计。