基于PSM-DID的营销场景因果建模分析


文章目录

  • 前言
    • (1)背景介绍
    • (2)PSM倾向性匹配
    • (3)DID因果效应评估
  • 写在后面

前言

本文主要衔接上文继续补坑,补充一个简单的数据集用于讲解psm-did方法在数据场景下建模过程实现,希望可以帮助大家进一步理解PSM-DID方法,不足之处,望多多指正。

(1)背景介绍

  • 业务问题:这里以营销场景中优惠劵对用户前后消费额提升问题为例,通过PSM-DID方法对优惠券对用户消费额提升效应进行评估。
  • **实现方法:**这里通过python sklearn库实现倾向性得分的计算与匹配部分、statsmodels实现DID中回归拟合部分调用库包方法如下:
    基于PSM-DID的营销场景因果建模分析_第1张图片
  • 数据介绍:将想x1作为用户年龄(18-80),x2作为用户收入水平(1、2、3、4),x3作为用户性别(0:女性,1:男性),d作为处理变量(0表示用户未使用优惠劵,1表示用户使用了优惠劵)y0为结果变量表示在t=0发券前的消费额、y1为结果变量表示在t=1发券后的消费额,数据生成代码如下:
    基于PSM-DID的营销场景因果建模分析_第2张图片

(2)PSM倾向性匹配

  • 倾向得分计算:将用户年龄、收入水平、性别作为自变量、用户是否使用优惠劵作为因变量,计算倾向得分,代码如下:
    基于PSM-DID的营销场景因果建模分析_第3张图片
  • 倾向性匹配:通过最近邻匹配等到每个处理组对应匹配得到的控制组,代码如下:
    基于PSM-DID的营销场景因果建模分析_第4张图片
    将处理组与匹配到的控制组对应y1、pscore合并得到对应y2、pscore1用于下一步的DID步操作

(3)DID因果效应评估

  • 最小二乘拟合:Y1=Y2+a2d,实现代码如下a2d为使用优惠券对消费额的提升效应,实现代码如下:
    image.png
  • 回归方程残差分布观察:
    基于PSM-DID的营销场景因果建模分析_第5张图片
  • 拟合结果打印
    基于PSM-DID的营销场景因果建模分析_第6张图片
  • 因果效果评估:模型效果:模型拟合优度(R-squared)为 0.964,拟合效果较好,通过绘制残差分布图不难得到残差的正态结论,因果效应:其中自变量d的系数为0.7881,说明其他因素不变的情况,使用优惠券的行为可以提升用户0.7881单位的消费额,可以认为本次使用消费券对用户消费额有正向的提升作用。

写在后面

PSM-DID是一种反事实因果推断的有效方法,需要注意本文数据集旨在帮助读者理解PSM-DID建模应用,中间的数据处理、异常值处理、平行趋势检验等都通过数据简单化的处理未做展现,需要读者自己在的业务中根据自己的业务数据情况,灵活实践运用,让PSM-DID成为解决业务问题的利器,产生实际的业务价值。

你可能感兴趣的:(#,因果分析方法,python,机器学习,人工智能,营销分析,psm-did,因果分析)