(清风数学建模笔记)
因子分析在某种程度上可以被看成是主成分分析的推广和扩展。可以用主成分分析的问题也可以用因子分析,因子分析的结果更方便分析。
因子分析法通过研究变量间的相关系数矩阵,把这些变量间的错综复杂关系归结成少数几个综合因子,由于归结出的因子个数少于原始变量的个数,但是他们又包含原始变量的信息,所以这一过程也称为降维。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。
其他主要区别:
1.主成分分析只是简单的数值计算,不需要构建一个模型,几乎没有假定;
因子分析需要构建一个因子模型,并且伴随几个关键性的假定。
2.主成分分析的解都是唯一的,而因子分析有许多的解。
3.因子分析解释成功的可能性要远远大于主成分解释成功的可能性。
只用最常用的一种即可
得到因子模型后,其中的公共因子不一定能反映问题的实质特征,为了更好的解释每一个公共因子的实际意义其减少解释的主观性,可以通过因子旋转达到目的。
因子旋转分为:正交旋转与斜交旋转。
(不论使用正交旋转还是斜交旋转,应该使新的公共因子的载荷系数的绝对值尽可能接近0或1。)
(使用最多的是 最大方差法)
论文中最常用的是第三种方法(安德森-鲁宾因子得分法)
(1) 操作步骤:
(2)描述指标的具体意义:
1.单变量描述:输出参与分析的每一个原始变量的均值、标准差和有效取值个数。
2.初始解:输出为经过旋转直接计算得到的初始因子、初始特征值以及初始方差贡献率。
3.系数:输出初始分析变量间的相关系数矩阵。
4.显著性水平:输出每一个相关系数对于单侧假设检验的显著性水平。
5.决定因子:输出相关系数矩阵的行列式。
6.逆:输出相关系数的逆矩阵
7.再生:输出因子分析后的相关矩阵,还给出原始相关与再生相关之间的差值,即残差。
8.反映像:输出反应像的相关矩阵,包括偏相关系数的负数。
9.KMO检验和巴特利特球形检验:进行因子分析前要对数据进行KMO检验和巴特利特球形检验。
(3)结果分析
第一步:确定原始数据是否适合做结因子分析
注意:用SPSS做因子分析时,在查看器中若得不到KMO检验和巴特利特检验结果,则说明你的样本量小于指标数,需要增加样本量或者减少指标个数再来进行因子分析。
第二步:确定因子数目
从碎石图可以看出,前两个因子对应的特征值的变化较为陡峭,从第三个因子开始特征值的变化较为平坦,因此我们应该选择两个因子进行分析。
(注意:第一次运行因子分析的结果一般作为参考,下面需要根据第一次运行结果来确定公共因子的个数)
第三步:调整因子个数重新计算
这里选择的因子数就是刚刚我们通过碎石图得到的因子图
(注意:碎石图得到的因子数只起到参考作用;在因子分析应用于某些专业问题上时,可能实现我们已经知道了最后要确定的因子数,这是的碎石图的意义就不大了)
第四步:对因子分析结果的介绍
成分矩阵
无法解释时可以改变提取方法以及旋转方法
旋转后的因子载荷散点图
因子得分
注意:因子分析模型不能用于综合评价,尽管有很多论文是这样写的,但这个存在很大的问题的。例如变量的类型、选择因子的方法、旋转对最终的影响都是很难说清。