【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)

实验数据来自于何晓群《多元统计分析》第五版例题6.3 数据获取请关注公众号:321红绿灯

【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第1张图片

回复:例6.3 即可获得

区域公用事业的发展是地区綜合发展的重要组成部分,是促进社会发展的重要因素。因此,分析评价全国 31 个省、直辖市、自治区在城市公共交通、市政、设施等各方面的建设,把握各地区公用事业的整休发展水开具有重要意义。下面应用因子分析模型,选取反映城市公用事业建设的12 个指标作为原始变量,对全国各地区公用事业的整体发展水平做分析评价。这 12 个指标分别为:X1城区西积(平方公里);X2:建成区面积(平方公里):X3:人均公园绿地面积(平方米);X4:城市建设用地面积(平方公里);X5:年末
实有道路长度(公里):X6:年末实有道路面积(万平方米);X7:城市排水管道长度(公里);X8:城市道路照明灯(千盏);X9:年未公共交通车辆运营数(辆);X10:运营线路总长度(公里);X11:每万人拥有公共交通车辆(标台);X12:出租汽车数量(辆)
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第2张图片上图为数据节选

一、数据预处理——数据标准化

因为数据间存在着量纲的差异,为了分析结果的准确性,对数据进行标准化处理,以此排除变量数据大小之间的差异带来的影响。
操作步骤

【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第3张图片
也就是旁边的Zscore的变量。下图为节选部分数据标准化后数据。
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第4张图片

二、因子分析

操作步骤

【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第5张图片
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第6张图片
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第7张图片
结果分析
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第8张图片
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第9张图片
由KMO和巴特利特球状检验得到KMO值为0.837,说明适合进行因子分析,在巴特利特球状检验中,显著性为0.000显著小于0.01,因此拒绝协方差阵是单位阵的原假设,协方差阵不是单位阵,说明变量之间有相关性,因此适合做因子分析。

【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第10张图片
总方差解释图可以看到提取了两个主成分,在累计方差中,第一个主成分的累计方差为74.837%,即提取了74.837%的总信息,第二个主成分的累计方差为83.579%,即提取了83.579%的信息量,涵盖了绝大多数的信息量,因此只提取两个主成分。

【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第11张图片
从碎石图的变化趋势观察得到,碎石图趋于平稳时是提取了5个主成分,较为平稳时是从组件3开始的,因此选取两个主成分是合理的,也可以选取3个主成分,这样涵盖的变量信息会更为全面。
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第12张图片
成分矩阵图中,给出了各个变量在主成分一和主成分二中的成分系数,通过成分系数比特征值,可以求得主成分方程表达式中的各个变量前的系数。从而得到成分表达式。
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第13张图片
系数越大的变量是组成主成分因子中的决定程度越大的变量。因此在主成分一中,起决定性因素的是变量X2建成区面积及x4城市建设用地面积。其次是x5年末实有道路长度、x6年末实有道路面积、x7城市排水管道,x8城市道路照明灯、x9年末公共交通车辆运营数、x10运营线路总长度。反映了城市的综合建设水平。在主成分二中,对主成分二起决定性的变量是x12出租汽车数量,反映了公共交通的建设水平。
计算第一、二主成分得分:
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第14张图片
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第15张图片
计算综合得分
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第16张图片
【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第17张图片
作出分布的散点图:

【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)_第18张图片

从散点图中可以清晰的看到,大部分省市的城市建设情况类似,但青海和北京远离大多数省市群体,西藏的城市建设水平显著低于全国的城市建设水平。

试验总结:

通过因子分析,实现数据的降维,同时,得到两个主成分及其成分系数,最后作出散点图的分布。

你可能感兴趣的:(多元统计分析,大数据,数据分析,算法,统计学)