常用的统计分析方法

        统计方法是指有关收集、整理、分析和解释统计数据,并对其所反映的问题作出一定结论的方法。统计方法是一种从微观结构上来研究物质的宏观性质及其规律的独特的方法。统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。随着人们对定量研究的日益重视,统计方法已被应用到自然科学和社会科学的众多领域,统计学也已发展成为由若干分支学科组成的学科体系。

        统计资料丰富且错综复杂,要想做到合理选用统计分析方法并非易事。常用的统计分析方法有以下:

1. 描述性统计

描述性统计是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各种活动。主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形。常用指标:均值、中位数、众数体现了数据的集中趋势;极差、方差、标准差体现了数据的离散程度;偏度、峰值体现了数据的分布形状。它是对数据最初的认识。

2. 回归分析

回归分析是一种预测性的建模技术,它研究的是因变量和自变量之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。它包括,线性回归、多项式回归、逻辑回归、逐步回归等。

3. 方差分析

方差分析又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别显著性检验。

常用的统计分析方法_第1张图片

 根据数据设计类型的不同,有以下两种方差分析的方法:

a. 对成组设计的多个样本均值比较,应采用完全随机设计的方差分析,即单因素方差分析。

b. 对随机区组设计的多个样本均值比较,应采用配伍组设计的方差分析,计量因素方差分析。

4. 假设检验

假设检验是推论统计中用于检验统计假设的一种方法。它是用于判断样本数据与总体数据之间的差异是否显著。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等

假设检验是小概率事件的原理,其统计推断方法是带有某种概率性质的反证法。先提出某种假设,在用方法,利用小概率原理,证明假设是否存在。为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0 。

常用的统计分析方法_第2张图片

 5. 相关分析

相关分析是用于探究两个或多个变量之间的关系,例如,人的身高和体重之间;空气中的相对湿度与降雨量之间,员工业务只是与销售业绩之间的关系都是相关分析研究的问题。它包括相关系数、协方差、散点图等。相关关系又可以分为正相关与负相关。

常用的统计分析方法_第3张图片

 6. 聚类分析

聚类分析是用于将数据按照类似性划分为不同的群组,用于数据分类和模式识别等。

聚类效果的好坏依赖于两个因素:

a. 衡量距离的方法

b. 聚类的算法:K means、层次聚类、网格聚类

7. 判别分析

判别分析是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来求位置类别的数据进行分类。

8. 因子分析

因子分析用于数据降维和变量间关系的分析,寻找潜在的因子。

9. 主成分分析

主成分分析方法是将彼此梠关的一组指标变适转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反应原多个指标变量中所包含的主要信息。

10. 列联表分析

列联表分析是用于分析离散变量或定型变量之间是否存在相关。

11. 时间序列分析

用于研究时间序列数据的变化趋势、季节性以及周期性等。

12. 信度分析

信度即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。

信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。

常用的统计分析方法_第4张图片

 

你可能感兴趣的:(数据分析)