用户画像之指标权重

用户画像之指标权重

1、指标确认
2、指标缩减
3、权重确定

关键指标–主成分分析(SPSS)

PCA(主成分分析)是一种降维方法,常用于对高维数据集作降维,它会将一个大的变量集合转化为更少的变量集合,同时保留大的变量集合中的大部分信息。即对指标进行降维操作使其只保留关键指标。

1、判断数据是否适合主成分分析

  • KMO检验:KMO值大于0.6说明适合进行分析,反之,说明不适合进行分析。
  • Bartlett检验:对应P值小于0.05也说明适合分析。

2、确定主成分个数

  • 方差解释率表格:方差解释率越大说明主成分包含原数据信息的越多。
  • 碎石图:折线由陡峭突然变得平稳时,陡峭到平稳对应的主成分个数即为参考提取主成分个数。
  • 载荷系数表格:载荷系数绝对值大于0.4归于第一主成分,共同度为可被提取的信息量,越高说明指标能被主成分解释的程度越高,被提取的信息量越多。一般以0.4作为标准。

3、利用主成分得到综合得分

数据处理中进行得分结果汇总。
综合得分=主成分1得分主成分1权重+主成分2得分主成分2权重+…
权重=各主成分对应的方差贡献率/累计方差贡献率

权重确认–嫡值法

详细视频操作指路

1、数据标准化

  • 数据缺失值极值处理

  • 确认正负样本(为了避免求熵值时无意义,每个指标结果加上实数,如+0.001)
    正相关指标(指标为正向,越多越好)
    X = Xij-Min(Xij) / Max(Xij)−Min(Xij)

    负相关指标(指标为反向,越少越好)
    X = Max(Xij )-Xij / Max(Xij)−Min(Xij)

2、计算样本比重
用户画像之指标权重_第1张图片
3、计算指标嫡值
用户画像之指标权重_第2张图片

4、 计算差异系数
用户画像之指标权重_第3张图片

5、 计算指标权重
某项指标的信息效用值取决于该指标的信息熵与 1 之间的差值,它的值直接影响权重的大小。权重越大,对评价结果的贡献就越大
用户画像之指标权重_第4张图片

6、 计算综合得分
用户画像之指标权重_第5张图片

你可能感兴趣的:(数据分析,python,数据挖掘,数据分析)