1、指标确认
2、指标缩减
3、权重确定
PCA(主成分分析)是一种降维方法,常用于对高维数据集作降维,它会将一个大的变量集合转化为更少的变量集合,同时保留大的变量集合中的大部分信息。即对指标进行降维操作使其只保留关键指标。
1、判断数据是否适合主成分分析
2、确定主成分个数
3、利用主成分得到综合得分
数据处理中进行得分结果汇总。
综合得分=主成分1得分主成分1权重+主成分2得分主成分2权重+…
权重=各主成分对应的方差贡献率/累计方差贡献率
详细视频操作指路
1、数据标准化
数据缺失值极值处理
确认正负样本(为了避免求熵值时无意义,每个指标结果加上实数,如+0.001)
正相关指标(指标为正向,越多越好)
X = Xij-Min(Xij) / Max(Xij)−Min(Xij)
负相关指标(指标为反向,越少越好)
X = Max(Xij )-Xij / Max(Xij)−Min(Xij)
5、 计算指标权重
某项指标的信息效用值取决于该指标的信息熵与 1 之间的差值,它的值直接影响权重的大小。权重越大,对评价结果的贡献就越大