相关

变量间的关系可以分为两种:函数关系与相关关系。函数关系是一一对应的确定关系,然而实际中变量间的关系往往比较复杂,数量关系不确定,这种变量间的不确定的数量关系称为相关关系。
相关与回归分析是数值型自变量与数值型因变量之间关系的分析方法。两者存在许多联系,而两者之间的主要不同在于相关分析的目的在于测量变量间的关系强度,所使用的测度工具是相关系数;回归分析则侧重考察变量间的数量关系,并通过一定的数学表达式进行描述,从而确定自变量对因变量的影响程度。相关分析可以说是回归分析的基础和前提,而回归分析则是相关分析的深入和继续。当两个或两个以上的变量之间存在高度的相关关系时,进行回归分析寻求其相关的具体形式才有意义。

相关分析是对两个变量间线性关系的描述与度量,它解决的问题包括:1.变量间是否存在关系;2.如果存在关系,它们的关系是什么;3.变量间关系的强度是什么;4.样本所反映的变量间的关系能否代表总体变量间的关系。
为解决这些问题,需要先对总体进行以下两个假设:1. 两个变量之间是线性关系;2. 两个变量都是随机变量。
相关分析,常用的方法类别有:简单相关分析、偏相关分析、距离相关分析等,其中前两种方法比例常见。简单相关分析,是直接计算两个变量的相关程度;偏相关分析,是在排除某个因素后,两个变量的相关程度;距离相关分析,是通过两个变量之间的距离来评估其相似性。


相关分析分类.png

在进行相关分析是,1.首先绘制散点图来判断变量间的关系形态;2。判断是线性关系则可以利用相关系数来测度关系间的强度;3.随后对相关系数进行显著性检验,以判断样本所反映的关系能否代表两个变量总体的关系。

散点图

散点图是描述变量之间关系的一种直观方法,可以大体上反映变量间的关系形态及关系强度。

相关系数

相关系数是根据样本数据计算的度量两个变量间线性相关关系强度的统计量。根据数据的大小可以分为总体相关系数与样本相关系数。
线性相关系数( Pearson's correlation coefficient )的性质:1.取值在[-1,1]; 2. 大小与变量的原点及尺度无关; 3. 仅能描述线性关系,不能描述非线性关系;4. 线性相关关系不代表因果关系。

显著性检验

用于考察样本相关系数是否能代表总体相关系数。

你可能感兴趣的:(相关)