matlab因子载荷矩阵正交旋转,因素分析中的矩阵旋转

因素分析中的矩阵旋转

因素分析法

因素分析是一种统计技术,目的是从众多的可观测的“变量”中,概括和推论少数“因素”。用最少数的“因素”来概括和解释最大量的观测事实。揭示事物之间的最本质联系。

因素分析法的步骤

KMO和Bartlett球形检验

因素分析前,首先进行KMO检验和Bartlett球体检验。KMO检验用于检查变量间的相关性和偏相关性,取值在0~1之间。KMO统计量越接近于1,变量间的相关性越强,偏相关性越弱,因素分析的效果越好。实际分析中,KMO统计量在0.7以上时效果比较好;当KMO统计量在0.5以下,此时不适合应用因子分析法,应考虑重新设计变量结构或者采用其他统计分析方法。

如果变量间彼此独立,则无法从中提取公因子,也就无法应用因素分析法。Bartlett球形检验判断如果相关阵是单位阵,则各变量独立因素分析法无效。由SPSS检验结果显示Sig.<0.05(即p值<0.05)时,说明符合标准,数据呈球形分布,各个变量在一定程度上相互独立。

本人使用了spss进行因素分析的相关计算。

数据为全国各省份的生活消费情况。

资源放置在文章末尾,可自行下载。

进行KMO和Bartlett球形检验的结果为:

KMO统计量值为0.809,大于0.5,且0.8~0.9之间,可以看出变量间的相关程度无太大差异,数据很适合做因子分析;

巴特利特球形检验的结果小于0.05,球形假设被拒绝,原始变量之间存在相关性,适合做因子分析。

提取公共元素

因素分析的提取方法有主成分,广义最小平方,最大似然等分析方法。

其中主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。

本次主要使用相关性矩阵完成主成分分析法。

得到的结果如下:

旋转成分(载荷)矩阵

因素分析中的矩阵旋转方法为正交旋转与斜交旋转,而具体使用哪一种方法取决于潜变量之间的相关性。相关则用斜交,反之则用正交。

正交旋转

正交旋转(orthogonal rotation)方法有Varimax(方差最大正交旋转)、Quartmax(四次方最大正交旋转)、Equamax(平均正交旋转),而最常用的方法是最大方差正交旋转法。

最大方差正交旋转法通过坐标变换使各个因子载荷的方差之和最大。通俗地说,就是:

(1)任何一个变量只在一个因子上有高贡献率,而在其它因子上的载荷几乎为0。

(2)任何一个因子只在少数变量上有高载荷,而在其它变量上的载荷几乎为0.如果满足这个条件的因子载荷矩阵称为具有“简单结构”。

最大方差的一种数学表达为:

这个方法是Henry Felix Kaiser在 1958 提出的,是一种常用的正交旋转方法(旋转后各因子仍保持线性不相关)。

使用最大方差正交旋转后的载荷矩阵为:

斜交旋转

斜交旋转(oblique rotation)是因素旋转的一种。旋转后,公共因素之间允许相关的因素旋转。相当于对因素负荷矩阵作非正交的线性变换。当做了正交旋转后仍未能对公共因素作出满意的解释时,可考虑做斜交旋转。

斜交旋转方法有Direct Oblimin(直接斜交旋转)以及Promax(迫近最大方差斜交旋转)。

Direct Oblimin直接斜交旋转

具体数学公式未找到,在spss中计算获得的结果如下图:

Promax迫近最大方差斜交旋转

Promax斜交旋转,“迫近最大方差斜交旋转”(procrustes variance maximum-oblique rotation)的简称。因素分析中,从独立因素负荷矩阵求取相关因素负荷矩阵的一种斜交变换方法。它的解包括四个矩阵:

(1)斜因子模型矩阵,又称斜因子负荷矩阵,即测验点在斜因子轴上的坐标所组成的矩阵,表明因子(因素)对变量提供的方差,其负荷的绝对值可大于1。

(2)斜因子相关矩阵, 各斜因子间的相关系数所组成的矩阵,要求各相关不宜过高;

(3)斜因子结构矩阵,测验点在斜因子轴子的投影所组成的矩阵,用以衡量解的简单结构准则;

(4)斜参照因子结构矩阵,测验点在参照轴上的投影所组成的矩阵, 与斜因子结构矩阵的作用相同,但由于它扣除了其他相关因子的影响,故比斜因子结构矩阵更能确切地衡量解的简单结构准则。

具体数学公式未找到,在spss中计算获得的结果如下图:

总结

对于因素分析有了一定的了解,下一步还需要在数学方面对矩阵旋转做更为详细的研究。

数据资料

相关参考:

你可能感兴趣的:(matlab因子载荷矩阵正交旋转,因素分析中的矩阵旋转)