数据分析36计(29):价格需求弹性和因果推断

目前出现了很多关于机器学习如何实现因果推断的理论论文,但还缺乏实际的应用场景和应用案例,这里探讨如何供应商利用因果推断计算价格弹性,从而指导价格的制定和浮动。

为什么关注价格弹性

经济学课程里谈到价格需求弹性,描述需求数量随商品价格的变动而变化的弹性。价格一般不直接影响需求,而是被用户决策相关的中间变量所中介作用。假设 Q 为某个商品的需求的数量,P 为该商品的价格,则计算需求的价格弹性为,

通过上式可以简单知道,价格改变 1 元比价格改变 100 元,会导致更大的需求改变。比如以 5 元的价格每日可以卖 100 单位产品,如果价格需求弹性为 ,那供应商将价格提升 5%(从 5 元-> 5.25 元),需求将下降 15%(从 100->85)。那么收入将减少 100*5-5.25*85=53.75。如果单价降低 5%,那么收入同理将提升 46.25。如果供应商知道了产品的价格弹性,那无须反复测试,即可清楚为提升收入到底应该是提价还是降价。

如何计算价格弹性

最好的方式,当然是直接进行 A/B 实验测试不同价格对用户的需求反应,但是价格这类的外生因素在同一产品同一阶段上,对不同用户展示不同的价格会直接损坏用户体验。因此从观察历史数据进行因果推断,但混杂因素(季节性、产品质量等)如何控制是因果推断的挑战。

这里采用 DML(Double Machine Learning) 方法进行因果推断,该方法主要解决两个问题,第一,通过正则化挑拣重要控制变量;第二,对比传统的线性回归模型,用非参数推断可以解决非线性问题。

DML 先应用机器学习算法去分别通过特征变量 X, W 拟合结果变量 Y 和处理变量 T,然后通过线性模型,使用处理变量的残差拟合出结果变量的残差。目标是估计 ,这里的 Y 函数构成为 T 的因果作用和 X、W 的协同作用之和。

  1. 将数据分为两部分,一部分样本选用随机森林等模型,用混杂变量预测处理变量(价格 P),得到 E[P|X];另外的样本同样可选择随机森林模型,用混杂变量预测结果变量(需求量 Q),得到 E[Q|X]。

  2. 计算残差,得到不受混杂变量影响的价格 P 和 需求量 Q,即为

关于残差正交化可得到无偏差因果效应的数学原理:https://zhuanlan.zhihu.com/p/41993542

  1. 因此直接将 进行 log-log 回归就能得到弹性系数

需要得到

关于为何用 log-log 回归可求解弹性系数:

案例和代码链接

数据分析36计(29):价格需求弹性和因果推断_第1张图片

你可能感兴趣的:(算法,机器学习,python,数据分析,人工智能)