spss分析方法-主成分分析

spss分析方法-主成分分析(转载)

主成分分析利用的是降维的思想,利用原始变量的线性组合组成主成分。在信息损失较小的前提下,把多个指标转化为几个互补相关的综合指标。
下面我们主要从下面四个方面来解说:

 

  • 实际应用
  • 理论思想
  • 建立模型
     
  • 分析结果


 

一、实际应用


在实际工作中,往往会出现所搜集的变量间存在较强相关关系的情况。如果直接利用数据进行分析,不仅会使模型变得很复杂,而且会带来多重共线性等问题。主成分分析提供了解决这一问题的方法,其基本思想是将众多的初始变量整合成少数几个相互无关的主成分变量,而这些新的变量尽可能地包含了初始变量的全部信息,然后用这些新的变量来代替以前的变量进行分析

主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。



 

二、理论思想

主成分分析是将多个变量通过线性变换以选出较少重要变量的一种多元统计分析方法。主成分分析的思想是将原来众多具有一定相关性的变量,重新组合成一组新的互相无关的综合指标来代替原来的指标。它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理。
方差较大的几个新变量就能综合反应原多个变量所包含的主要信息,并且也包含了自身特殊的含义。




 

三、建立模型

主成分分析的基本步骤如下:
 

  • 进行因子分析
  • 计算特征向量矩阵
  • 计算主成分矩阵

主成分分析案例:
 

题目:给出了中国历年国民经济主要指标统计(19982005)。试用主成分分析对这些指标提取主成分并写出提取的主成分与这些指标之间的表达式。


一、数据输入

spss分析方法-主成分分析_第1张图片

二、操作步骤1、进入SPSS,打开相关数据文件,选择分析”|“降维”|“因子命令2选择进行因子分析的变量。在因子分析对话框的左侧列表框中,依次选择全国人口、农林牧渔业总产值、工业总产值、国内生产总值、全社会投资总额、货物周转量、社会消费品零售总额、进出口贸易总额、原煤、发电量、原油、钢、汽车、布、糖、粮食、棉花和油料进入变量列表框。

spss分析方法-主成分分析_第2张图片

3选择输出系数相关矩阵。

单击因子分析对话框右上角的描述按钮,在相关性矩阵选项组中选中系数复选框,单击继续按钮返回因子分析对话框。

spss分析方法-主成分分析_第3张图片

4、其余设置采用系统默认值即可。单击确定按钮,等待输出结果。





 

四、结果分析



1、系数相关矩阵各个变量之间都具有一定的相关关系而且有些相关系数还比较大,接近于1,所以本例很适合使用主成分分析。

spss分析方法-主成分分析_第4张图片

2、各成分的方差贡献率和累计贡献率只有前两个特征值大于1,所以SPSS只选择了前两个主成分。第一个主成分的方差贡献率是80.233%,第二个主成分的方差贡献率是7.884%,前两个主成分的方差占所有主成分方差的88.118%。由此可见,选择前两个主成分已足够替代原来的变量。

spss分析方法-主成分分析_第5张图片


3、成分矩阵下表为成分矩阵,表明各个成分在各个变量上的载荷,从而可以得出各主成分的表达式。值得一提的是,在表达式中各个变量已经不是原始变量,而是标准化变量。

spss分析方法-主成分分析_第6张图片


其中:F1=0.523*全国人口+0.990*农林牧渔业总产值+0.908*工业总产值+0.973*国内生产总值+0.995*全社会投资总额+0.991*货物周转量+0.988*社会消费品零售总额+0.998*进出口贸易总额+0.969*原煤+0.996*发电量+0.993*原油+0.992*+0.983*汽车+0.997*+0.571*-0.258*粮食+0.831*棉花+0.727*油料
F2=-0.025*全国人口+0.110*农林牧渔业总产值+0.405*工业总产值+0.055*国内生产总值+0.055*全社会投资总额+0.011*货物周转量-0.008*社会消费品零售总额+0.009*进出口贸易总额+0.174*原煤-0.054*发电量+0.01*原油+0.059*-0.052*汽车-0.018*+0.196*+0.892*粮食-0.205*棉花-0.565*油料

 

在第一主成分中,除粮食以外,变量的系数都比较大,可以看成是反映那些变量方面的综合指标;

在第二主成分中,粮食变量的系数比较大,可以看成是反映粮食的综合指标。


分析结论:(获取更多知识,前往gz号程式解说)
 

因为主成分分析只不过是一种矩阵变换,所以各个主成分并不一定有实际意义,本例中各个主成分的内在含义就不是很明确。



 

参考案例数据:
 

1spss统计分析与行业应用案例详解(第四版杨维忠,张甜,王国平  清华大学出版社

收录于合集 #spss

 16

上一篇spss分析方法-因子分析

原文来自https://mp.weixin.qq.com/s/fTNbEkKKgRETJCj4fSa7sA

spss分析方法-主成分分析_第7张图片

 

你可能感兴趣的:(算法,线性代数,矩阵)