SPSS--相关关系是怎样的关系?

             在数据分析过程中,我们经常想知道两个变量之间的关系,广告费用与销售额中当投入一定的广告费用时,销售额的变化带有随机不确定性,这种不能用数学函数准确度量,但又存在一定规律的关系我们称为相关关系相关关系是一种非确定性的关系,它能够分析变量间的关联程度和关联形式,并且可以在相关分析的基础上,再通过回归分析来确定变量之间的数量关系,进而用于生产控制和预测。因此,相关关系和函数关系的区别在于:相关关系是变量间不确定的数量关系;函数关系是变量间一一对应的确定关系,比如长方体的高与体积之间的关系是线性函数关系。
相关分析是对两个变量之间线性关系的描述和度量,探讨的主要问题是:变量之间是否存在关系?存在什么关系?关系强度如何?以及样本所反映的变量间的关系能否代表总体变量间的关系?因此,在进行相关分析时,我们假定两个随机变量间是线性关系,如果是非线性关系,需要进行一定的数学变换将数据转换为线性关系。
如果我们需要探讨两个变量间的关系,可以使用简单散点图进行可视化探索,它是描述变量间相关关系的一种直观方法。相关关系包括线性相关、完全线性相关、曲线相关和不相关。

SPSS--相关关系是怎样的关系?_第1张图片

 

接下来,我将选用SPSS中的自带数据集car_sales.sav为例,向大家演示相关分析过程。这个数据文件包含假设销售估计值、订价以及各种品牌和型号的车辆的物理规格。我从中选择sales(销售额)和mpg(燃料效率)这两个随机数值变量,探索它们之间是否存在相关关系。两变量的部分数据截图如下:

SPSS--相关关系是怎样的关系?_第2张图片

 

首先,我将通过绘制散点图的方式确定变量间的关系。选择菜单中的图形 -> 图形构建器,在图库中选择散点图,双击简单散点图将它选入图表预览窗口,将sales变量拖至X轴,将mpg变量拖入Y轴,点击确定。图表对话框如下图所示:

SPSS--相关关系是怎样的关系?_第3张图片

 

得到的散点图如下所示:

SPSS--相关关系是怎样的关系?_第4张图片

 

从散点图来看,salesmpg这两个变量间不存在明显的相关关系。接下来,我们对它们进行相关分析,通过相关系数来确定两者间的相关程度。
点击分析 -> 相关 -> 双变量,在对话框中将两变量选入变量窗口;因为两变量均为数值型变量,所以默认选择皮尔逊Pearson相关系数。点击确定。对话框如下图所示:

SPSS--相关关系是怎样的关系?_第5张图片

 

得到分析结果如下:

SPSS--相关关系是怎样的关系?_第6张图片

 

相关分析的结果总是关于对角线对称的,所以我们只需要看其中一部分即可。我们看到,salesmpg这两个变量的相关系数是-0.017,显著性检验P值是0.837P0.05),说明两变量间不存在相关关系。 在上述案例中,我们选择的是Pearson相关系数,它适用于数值型变量,是运用最广的一种相关程度统计量。相关系数还有两个种类:Spearman等级相关Kendall tua-b等级相关。前者适用于度量有序分类变量之间的相关程度;后者也是用来度量有序分类变量之间的线性相关关系。在进行相关分析时,要注意根据数据类型选择不同的相关系数。

SPSS--相关关系是怎样的关系?_第7张图片

 

最后值得大家注意的一点是:相关关系不等于因果关系!相关关系只能说明二者间的数量关系,不能表明他们之间具有因果关系。两者之间是否存在因果关系还需要结合实际,进行一定的逻辑推理才能得出结论。有时候,两个完全不相干的变量间也可能存在很强的相关关系,比如说:“当明星”和“长得好看”之间具有很强的相关性,但并不能说“因为当了明星,所以才长得好看”,也不能得出“因为长得好看,所以是明星”的结论。

你可能感兴趣的:(算法,数据结构,线性回归,逻辑回归,推荐算法,宽度优先,决策树)