浅谈主成分分析法

主成分分析

**目的是将许多相关性很高的变量转化成彼此相互独立或不相关的变量
再从这些变量中选出比原始变数少,能解释大部分数据中的几个新变量(主成分,解释数据的综合性指标)**

步骤

  1. 对原始数据进行标准化处理(正规化方法:基于原始数值的均值和标准差进行数据的标准化)
    i个评价对象的第j个指标变量的取值为Aij
    将各个Aij化为标准化指标值

  2. 计算相关系数矩阵R

  3. 计算特征值和特征向量
    (设A是n阶方阵,如果存在数λ和n维非零向量α使
    Aα=λα 成立
    则称λ为方阵A的一个特征值,α为方阵A对应于特征值λ的一个特征向量)
    计算相关系数矩阵R的特征值λ1>=λ2>=…>=λm>=0
    及对应的特征向量u1,u2,…,u m,其中uj=【u 1j,u 2j,…,u mj】^T(转置)
    由特征向量组成m个新的指标变量:
    y1,y2,…,y m。

  4. 选择p(p<=m)个主成分,计算综合评价值
    (1).计算特征值λj(j=1,2,…, m)的信息贡献率和累积贡献率
    (贡献率在统计学中一般是指整体中某部分的增长量对整体增长的作用大小,
    实际上是指整体上中某部分的增长量占整体增长的比重)
    b j为主成分y j的信息贡献率(每个λ j与总的特征值的比)
    a p为主成分y1,y2,…,y p的累积贡献率(余下的特征值所占的比重)
    当a p接近于1,(一般a p取0.85,0.90,0.95)则选择前p个指标变量作为p个主成分,来替代原来的m个指标变量
    从而可对p个主成分进行综合分析

  5. 计算综合得分
    Z(j个主成分的信息贡献率b ij乘于y个主成分y j)
    根据综合得分值就可以进行评价

你可能感兴趣的:(浅谈主成分分析法)