数据分析之因果分析

目录

一、因果分析概述

1.1 常见逻辑谬误

1.2 因果分析应用


一、因果分析概述

日常工作中,我们经常想用线性回归来看系数是否显著来判断“A的变化是否导致B的变化”,但经常会出现逻辑谬误。

什么时候用因果推断?

treatment(处理) 对于 Y的影响,实验的后续分析:

xx下跌是什么因素影响?

产品业务变动会导致平台生态如何变动?

1.1 常见逻辑谬误

  • 伪关系

       X和Y恰好同时发生,并无关联。

例:多维分析中无限下探,发现某个人群上效果显著,并没有控制多重检验问题

  • 两种选择偏差

遗漏变量偏差 没有控制同时影响X和Y的混淆变量(主播的被观看时长跟开播频率之间的关系,忽略了主播本身开播意愿和内容质量这一混淆变量)

幸存者偏差 重要样本因种种原因无法取到 (飞机弹孔机翼上的分布多,加强机翼?)

  • 反向因果

混淆因果Y果X (视频质量越高,用户活跃度越低? 用户活跃度低,观看视频少,质量高)

  • 联立方程

价格X 销量Y是由需求与供给所组成的系统决定的:

X=a1*Y+b1(需求)X=a2*Y+b2(供给)

X与Y之间关系不能代表消费者敏感度a1也不能代表生产者敏感度a2

1.2 因果分析应用

1.效果测评:一个功能有何影响?

2.产品迭代:怎么调整设置,怎么获得反馈产品功能好坏,什么作品作者什么展现形式更好?(单双列)

3.预估长期价值:从什么方向进行优化改进投资。

2.因果分析两种流派与常用工具

2.1 因果分析核心

你可能感兴趣的:(数据分析)