数据的收集----统计学(第六版)贾俊平

1.数据的来源
        1.1 数据的间接来源:数据是别人通过调查或实验的方式搜集到的
            原信息已经存在 我们只是对原数据进行重新加工、整理,使之可以满足我们的需要
                渠道:[外部]统计部门、报纸期刊、互联网;[内部]财务报表、公司内部统计资料
            搜集二手资料是研究者首先考虑并采用的 分析也应该首先从二手资料开始
            对二手资料进行评估:
                1.1.1 资料是谁收集的 搜集者的实力和社会信誉度
                1.1.2 为什么目的而收集数据 为集团内部利益是值得怀疑的
                1.1.3 数据是怎么收集的 不同方式得到的数据 解释力和说服力都是不同的 
                1.1.4 什么时候收集的数据  数据具有一定的时效性 
                
        1.2 数据的直接来源:通过自己的调查或实验活动,直接获得第一手数据
            主要是通过调查和实验获得 调查针对于社会现象 实验针对于自然现象 
            通常面临的是样本的数据 ----> 如何从总体抽出一个有效的样本?
            
2.调查数据的两个方式
            如何选出一个好的样本?
                1.针对研究的问题:不同问题选取的样本的不一样的---->满意度(已经消费的顾客);购买意愿(潜在购买者)
                2.针对调查费用与估计精度的关系而言:好的样本具有一定的性价比(节省费用);放松估计精度(航天仪器与香肠、收视率与股票收益率)
            
        2.1 概率抽样:也称随机抽样[可以计算估计量误差] 是指遵循随机原则进行的抽样 每个单位中都有一定的机会被选入样本
                      2.1.1 随机原则抽取样本 排除主观上有意识地抽取掉调查单位 随机≠随便
                      2.1.2 每个样本被抽中的概率是已知的 或者是 可以计算出来的
                      2.1.3 当用样本对总体标量进行估计时 要考虑每个样本被抽中的概率 估计了不仅与样本单位的观测值有关 与其入样概率也有关 
                      简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。
                    
        2.2 非概率抽样:相对于概率抽样而言 抽取样本不是随机的 而是根据研究目的对数据的要求 采取某种方式从总体中抽取部                                      分单位进行分析
                                    方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样、
            
        2.3 概率抽样与非概率抽样比较:
                在调查中采取何种抽样类型 取决于多种因素:研究问题的性质、使用数据要说明的问题、调查对象特点、费用、时间
                非概率抽样 无法使用样本的结果来对总体相应的参数进行估计
        
                概率抽样的抽选样本以及数据分析都要求较高的统计学专业知识 成本高
                非概率抽样要求的专业技术不是很高 
                    
    


    

你可能感兴趣的:(数据的收集----统计学(第六版)贾俊平)