数据分析因子评分学习

当多个因素影响一个结果时,我们需要综合考虑这些因素分别对结果德影响。因子评分就是用于比较其对结果德影响程度。

文章目录

  • 前言
  • 一、案例背景
  • 二、解决方案
    • (一)分析思路
    • (二)剔除无关数据
    • (三)求变化值
    • (四)求收入评分
    • (五)求费用评分
    • (六)计算综合评分
  • 总结


前言

数据分析师的日常工作中,经常会遇到这样的问题,分析某个指标的下降/上升原因,且这个指标并不是受单一因素影响,这时就要求我们综合考虑分析。本文分享数据分析因子评分的学习案例,供各位小伙伴参考。案例来源:
【分析方法】指标下降如何分析?分享一种“因子评分法”,帮你快速定位原因​​,案例中数据标准化公式可能为原作者笔误,本人做部分修改。


一、案例背景

如下图所示,某新兴打车软件公司,2018年7月渠道引流新用户ROI环比大幅下降,需要排查异常渠道,为业务指明方向。
数据分析因子评分学习_第1张图片
==投资回报率(ROI)=(税前年利润/投资总额)*100%。是指企业从一项投资性商业活动的投资中得到的经济回报,是衡量一个企业盈利状况所使用的比率,也是衡量一个企业经营成果和效率的一项综合性指标。==本案例ROI=收入/费用)

二、解决方案

(一)分析思路

由于ROI受收入和费用两个因子影响,单看各渠道ROI无法准确定位到重点异常渠道。可使用因子评分,综合结果得到结论。

(二)剔除无关数据

虽然整体ROI下降近25%,但快手渠道的ROI却上升,分析下降原因时,应先将其剔除。
数据分析因子评分学习_第2张图片

(三)求变化值

将剩余4各渠道的收入和费用进行差值计算,由于ROI=收入/费用,当收入和费用同时增加时,两者对ROI贡献的影响程度相反。求出“收入变化-费用变化”值,用于判断各渠道对ROI下降的影响。
在这里插入图片描述

(四)求收入评分

数据标准化,这里使用其中一种计算方式(极差标准化法),将最大值定为1,最小值定为0,把所有值到压缩到0和1之间,常用于统一数据量级。计算公式为:(x-x最小值)/(x最大值-x最小值)

在ROI的的计算中,收入作为分子,分子下降越多,ROI值则下降越多,需要将其进行缩放倒数
缩放到0.1~0.9之间,计算公式为:(0.9-0.1)*x+0.1

倒数,使其与评分正相关(收入变化越大,评分越高),计算公式为:1/x
在这里插入图片描述

(五)求费用评分

在ROI的计算中,费用作为分母,“费用变化”越大,评分越高。所以不必进行缩放倒数,直接标准化。
数据分析因子评分学习_第3张图片

(六)计算综合评分

将收入评分与费用评分相加,可以看出,对ROI大幅下降的影响程度:抖音>今日头条>百度>爱奇艺。
数据分析因子评分学习_第4张图片


总结

以上案例的因子评分,其实分别分析收入和费用两个因子的变化情况,最后综合考虑才得出结论。如下图所示:

  1. 如果单纯看ROI环比,变化幅度是:抖音>百度>今日头条>爱奇艺;
  2. 如果单纯看收入变化,影响程度是:今日头条>抖音>百度>爱奇艺;
  3. 如果单纯看费用变化,影响程度是:抖音>百度>爱奇艺,今日头条费用减少,不会导致ROI下降

从单一角度考虑,都无法得出较准确的结论。所有可以参考上文,从以下几步分析:

  1. 剔除无关数据
  2. 求变化值
  3. 利用数据标准化,求各因子评分
  4. 综合评分得出结论
    数据分析因子评分学习_第5张图片
    在这里插入图片描述
    数据分析因子评分学习_第6张图片

你可能感兴趣的:(数据分析,数据分析,数据挖掘)