数据分析必须警惕的坑:辛普森悖论

在分组比较中都占优势的一方,在总评中有时反而是失势的一方。

数据分析必须警惕的坑:辛普森悖论_第1张图片

回避方式

为了避免辛普森悖论出现,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。

收获与总结:

避免辛普森悖论的关键是要同时参考不同用户间的事实全貌。

  • 第一,准确的用户分群在数据分析中是非常重要的,尤其是在免费产品当中,平均用户不仅不存在,而且是误导研发的因素之一,所以关键在于利用特征将用户进行合理划分。

  • 第二,在一个具体的产品中,普适型的数据(如粗暴的对比IOS和Android总体情况)是没有多大参考意义的,一定要细分到具体设备、国家、获取渠道、消费能力等等再进行比对才有价值。

  • 第三,斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。

你可能感兴趣的:(记录)