相关性分析,不能只看系数结果!

相关性分析,不能只看系数结果!_第1张图片
只知其然不知其所以然.jpg

在分析业务数据时,常通过相关性分析寻找与关键特征相关的变量,或者用相关性系数验证两组业务逻辑上应该强相关的变量。
相关性系数的计算,在Excel、R语言、Python 中都非常容易实现,如果只快速的计算一个系数值,会有什么问题呢?举一个我今天遇到的例子:

  1. 两组变量分别是两种课程按照在不同学习阶段的答题正确率,教研设计是希望两种课程的难度高度相关
  2. 两组变量的 pearson 相关系数为 0.08,按照「0.0-0.2 极弱相关或无相关」的判断,那是否应该告诉教研组两种课程在不同学习阶段的难度不相关,存在问题呢?
    此时需要再看一下两组数据的分布,发现是这样子的,两组数值都非常集中:


    相关性分析,不能只看系数结果!_第2张图片
    image.png

    或者按照学习阶段看一下数据走势,也可以发现是这样的,在不同学习阶段,两种课程的难度都是稳定在 85% 的


    相关性分析,不能只看系数结果!_第3张图片
    image.png

    结论应该是反馈教研组这两种课程难度设计的非常好,都稳定在较好的学习区域内。

你可能感兴趣的:(相关性分析,不能只看系数结果!)