因果效应与uplift模型

最近工作中遇到了类似营销场景下找出对营销敏感用户的问题,用到了uplift model。所以想对uplift model做个简单的总结。

因果推断

这是一个非常大的研究领域,它是推断一个变量对另外一个变量的因果关系,以及影响大小。研究因果关系的是因果发现(causal discovery),估计影响大小的是因果效应(causal effect)。后面我们主要聚焦在因果效应上。

辛普森悖论

辛普森悖论是概率统计中的一种现象:在变量 Z 的每一个分层上,变量 X 和变量 Y 都表现出一致的相关性,但是在 Z 的整体上,X 和 Y 却呈现出与之相反的相关性。 这里我们用《Introduction to Causal Inference》这门课的例子来说明。

背景:假设你是一个医院的数据分析人员。 现在有一种疾病D,D的病情可以分为两种轻微(mild)和严重(severe)目前有两种治疗方式A和B,其中B比A需要的资源更稀缺。对于得了D的病人只有两种结局被治愈和死亡。
我们把上面的描述总总结成一个表格方便理解:
在这里插入图片描述
经过一段时间的实验,收集到的统计数据如下:
在这里插入图片描述
在分不同病情看方案A和B的治疗效果的时候,都

你可能感兴趣的:(工作与学习笔记,数据挖掘,数据分析)