理论：因子分析原理剖析

因子分析概述：

因子分析分为Q型和R型，我们对R型进行如下研究：

一.因子分析步骤：

1.确认是是否适合做因子分析

2.构造因子变量

3.旋转方法解释

4.计算因子变量得分

二.因子分析的计算过程：

1.将原始数据标准化

目的：消除数量级量纲不同

2.求标准化数据的相关矩阵

3.求相关矩阵的特征值和特征向量

4.计算方差贡献率和累计方差贡献率

5.确定因子

F1,F2,F3...为前m个因子包含数据总量（累计贡献率）不低于80%。可取前m各因子来反映原评价

6.因子旋转

当所得因子不足以明显确定或不易理解时选择此方法

7.原指标的线性组合求各因子的得分

两种方法：回归估计和barlett估计法

8.综合得分：以各因子的方差贡献率为权，各因子的线性组合得到各综合评价指标函数

F=（λ1F1+…λmFm）/(λ1+…λm)

=W1F1+…WmFm

9.得分排序

因子分析详解：

因子分析模型，又名正交因子模型

X=AF+ɛ

其中：

X=[X1,X2,X3...XP]‘

F=[F1,F2...Fm]'

ɛ=[ɛ1,ɛ2...ɛp]'

以上满足：

（1）m小于等于p

（2）cov(F,ɛ)=0

(3)Var(F)=Im

D(ɛ)=Var(ɛ)=

ɛ1,ɛ2...ɛp不相关，且方差不同

我们把F成为X公共因子，A为荷载矩阵，ɛ为X特殊因子

A=(aij)

数学上证明：aij就是i个变量与第j个因子的相关系数，参见层次分析法aij定义。

<1>荷载矩阵

就荷载矩阵的估计和解释方法有主因子和极大似然估计，我们就主因子分析而言：（是主因子不是主成份）

设随机向量X的协方差阵为Ʃ

λ1,λ2,λ3..>0为Ʃ的特征根

μ1，μ2，μ3...为对应的标准正交向量

我们大一学过线代或者高代，里面有个东西叫谱分析：

Ʃ=λ1μ1μ1’+......+λpμpμp’

当因子个数和变量个数一样多，特殊因子方差为0.

此时，模型为X=AF,其中Var(F)=Ip

于是，Var(X)=Var(AF)=AVar(F)A'=AA'

对照Ʃ分解式,A第j列应该是

也就是说，除了uj前面部分，第j列因子签好为第j个主成份的系数，所以为主成份法。

如果非要作死考虑ɛ

原来的协方差阵可以分解为：

Ʃ=AA'+D=

以上分析的目的；

1.因子分析模型是描述原变量X的协方差阵Ʃ的一种模型

2.主成份分析中每个主成份相应系数是唯一确定的，然而因子分析中的每个因子的相应系数不是唯一的，因而我们的因子荷载矩阵不是唯一的

(主成分分析是因子分析的特例，非常类似，有兴趣的可以去看看，这两者非常容易混淆)

<2>共同度和方差贡献

无论是在spss或者R的因子分析中都围绕着贡献度，我们来看下，它到底是什么意思。

由因子分析模型，当仅有一个公因子F时，

Var(Xi)=Var(aiF)+Var(ɛi)

由于数据标准化，左端为1，右端分别为共性方差和个性方差

共性方差越大，说明共性因子作用越大。

因子载荷矩阵A中的第i行元素之平方和记为hi2

成为变量(Xi)共同度

它是公共因子对(Xi)的方差锁做出的贡献，反映了全部公共因子对变量(Xi)的影响。

hi2大表明第i个分量对F的每一个分量F1,F2,...Fm的共同依赖程度大

将因子载荷矩阵A的第j列的各元素的平方和记为gj2

成为公共因子Fj对x的方差贡献。

gj2表示第j个公共因子Fj对x的每一个分量Xi所提供的方差的总和，他就是衡量公共因子的相对重要行的指标。gj2越大，表明公共因子Fj对x的贡献越大，或者说对x的影响和作用就越大。

如果将载荷矩阵A的所有gj2都计算出来，按大小排列，就可以提炼最有影响力的公共因子。

<3>因子旋转

这方面涉及较为简单，我就简单提一下

目的：建立因子分析模型不是只要找主因子，更加重要的是意义，以便对实际进行分析，因子旋转就是使所得结论更加清晰的表示。

方法：正交旋转，斜交旋转两大类，常用正交。

便于理解，我解释下旋转的意义，以平面直角坐标系为例，我们想得到的数据正好为：y=x和y=-x上的点，我们能解释的却在x=0和y=0上，这时候我们就可以旋转坐标系，却不影响结果。

理论：因子分析原理剖析

你可能感兴趣的:(理论：因子分析原理剖析)