CDA Level 1建模分析-因子分析

CDA Level1 最后一部分,是整个cda Level 1中占比重最高的一个部分,整体占比为40%;主要分为五个部分:

1,主成分分析 4%,因子分析2%

2,系统聚类法 2%,K-means聚类法 3%

3,对应分析 2% 多维尺度分析2%

4,多元回归分析法20% (多元线性回归10%,逻辑回归10%)

5,时间序列 5%;

level 1的阶段 其实只要求对以上建模分析方法进行理解,并知晓各种分析方法的应用方向。

二,因子分析法 2%

大纲要求熟知:适用于因子分析的变量度量类型。通过分析结果,选取合适的因子个数;知道最常用的因子旋转的方法;

因子分析:

将主成分的坐标轴进行旋转,使一些变量的权重的绝对值在一个主成分上达到最大,而在其他主成分上绝对值最小,这样可以达到变量分类的目的,这种维度分析方法叫做因子分析法;是一类常用的连续变量降维并进行维度分析的方法。其经常采用主成分法作为其因子载荷矩阵估计方法,在特征向量方向上,使用特征值得平方根进行加权,最后通过因子旋转,使得变量的权重在不同因子上更加两级分化,常用最大方差进行因子旋转,这种方法是一种正交旋转

正交因子模型:

用矩阵表示为 X-μ=LF+ε

该模型被称为正交因子模型,X预先经过标准化后则μ=0。F包含m个P维的公共因子,会对X的每个分量Xi起作用:ε称为特殊因子,每个εi只对Xi起作用。各个特殊因子之间互不相关,特殊因子与公共因子之间互不相关,这两个条件是因子分析区别于其他矩阵分析的要点。

因子载荷矩阵:

是因子分析的主要问题之一。该模型中L称为因子载荷矩阵,因子分析师从对L的估计入手的,可以从两个方面来理解L的含义:

1,将其看做事对因子进行线性组合时的系数。

2,因子载荷矩阵L还可以看作是p维空间的一组单位正交向量,把这组向量当做坐标轴,隐含的因子F投影到这项向量上的值即为LF,LF与X-μ之间仅相差一个干扰项。因此如果X是标准化过的(μ=0),再排除干扰项,可以认为在L这个参考系中表示的F与在标准坐标系中表示的X是等价的。

算法解析:

因子分析的计算过程大致可分为三步:

1 估计因子载荷矩阵,2进行因子旋转,3 估计公共因子(因子得分)

因子旋转的两类方法:

正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)

因子分析与主成分分析的区别与联系:

1主成分分析:把主成分表示成各原始变量的线性组合。 因子分析:原始变量表示成各因子的线性组合。

2主成分分析:解释原始变量的总方差。 因子分析:解释原始变量的协方差。

3主成分分析:几个原始变量,就有几个主成分。 因子分析:因子个数可以根据业务场景的需要人为指定。

4主成分分析:给定的协方差矩阵或相关矩阵特征值唯一时,主成分也是唯一的。 因子分析:因子不是唯一的。并且通过旋转可以得到不同因子。

5主成分分析和因子分析用途:数据处理,降维,变量间关系的探索等。

6主成分分析是因子分析的一个特例。

你可能感兴趣的:(CDA Level 1建模分析-因子分析)