模型系列-政策评估

DID只是在估计一个项目、政策、干预或“处理”效应时的一种估计方法,此外还有断点回归设计(RDD)、倾向分配得分(PSM)和合成控制法。因此有必要先了解科学评估方法的基本逻辑。

从科学意义上讲,评估一项政策的实施效应的背后逻辑是:在给定其他条件相同的情况下,实施政策后的表现与假定没有实施政策后的表现间的差异。这句话说着容易做着难,因为其前提条件非常苛刻!比如我们想评估大学教育对工资的贡献程度,让某人在现实中读大学,然后记下其工作时的收入A,然后用时空穿梭机把他送回去,这次不让他上大学,记录其收入B,则A-B就是此人上大学的教育回报。

在政策评估方法论中,例子中的B就是A的完美的反事实对照组,即一旦其接受了政策干预,表现为A,如果没有接受政策干预,结果就是B。上面的例子是无法实现的,因为历史是单线程的,我们也没有时空穿梭机。因此我们无法获得一个政策实施后的反事实对照组。在现实中我们常常会犯一些错误:横向对比的错误、纵向对比的错误。

政策评估的科学方法,本质就是找到反事实参照组。反事实参照组需要满足两个基本条件:

  • 保证呈现反事实的特征,即一旦实验组没有受到政策影响,其结果应该和反事实组是完全一致的
  • 反事实参照组不能受到实验组的影响,即受到政策干预的人群不能把这种影响传递给其他人,理论上是允许实验组内互相影响的,但是如果这种影响外溢到参照组,就会导致政策效应估计出现偏误。

我们可以基于“时空穿梭机”的视角,采用其他方法构造一种近似的“穿越”。常见的构造方法有两种:

  1. 数据筛选
    最佳例子是“同卵双胞胎”,给双胞胎同时服用,其中一方服用真实药物,另一方服用外形无差别的糖丸,这样双方都会认为自己服用了药物,心理干扰因素的作用对双方同时存在,其事后的差异就完全是药物作用了。
  2. 随机实验
    随机干扰试验(RCT),这一方法的核心是“随机”,其采用的是统计学原理,例如对有就医需求并去医院(正面硬币)和有就医需求但没有去医院(反面硬币)的人群的健康差异,就是医疗对健康的实际改善程度。

以上两种构造反事实组的方法虽然能够满足科学评估的要求,但是应用性弱。

现实中政府的绝大数政策并不是根据评估的要求实施的,因此政策评估的数据是一种观测数据,即政策实施后收集的数据。由于政策评估方(咱们写论文的)没有直接参与到政策的涉及和实施过程,无法按照科学评估方法的要求来构造和生产数据。因此任何利用观测数据的政策评估就必须非常小心和科学论证。针对不同的数据结构和政策类型采用不同的评估方法,并反复检验该方法的实用性。

根据政策实施过程,可以将一国或部门的政策分为三类:第一种是“先行先试”的政策,第二种是“一刀切”政策,第三种是“一次性推开”的政策。严格的说,前两种政策是可以用科学评估方法对政策效应进行合理估计。因此后续的DID、RDD等针对前两种政策类型而言的。

参考资料:
1. 如何科学评估经济政策的效应?,范子英,财经智库,No.5,2018
2. 第八讲实验和自然实验,许文立

你可能感兴趣的:(模型系列-政策评估)