计量DID

  • 批量生成虚拟变量:
forvalues x=1876/1939 {
    gen td_`x'=0
    qui replace td_`x'=1 if grn==`x'
    }
检验treat是否代表交乘项:reg treat td_*
说明这里的treat=TREATc ⋅ postTWEAt,是关键解释变量
下标是什么就在哪里聚类,这里在class这里聚类,下标为c,故:Robust standard errors clustered at the subclass level in parentheses
字符型转换成数值型(将股票代码生成id):encode uspto_class,gen(id)
设定面板:xtset class_id grntyr
固定效应,td*(时间虚拟变量),cluster(class_id)表示聚类在class_id上:xtreg count_usa treat count_for_2 td*, fe i(class_id) robust cluster(class_id)
outreg2 using ols_table2.xls, replace
将结果做成表格:outreg2
,append将这次的结果附录到之前的表上

Table4(工具变量,重点)

第二阶段的y是US的专利数
工具变量(敌人的专利数)影响我国专利数,但不会影响之后的专利数,因为之后敌人被赶走了。
第一阶段回归估计出license的值,将其估计值代入下一阶段回归。
第一阶段要包括一二阶段所有的控制变量。
number of licenses=

First stage: Number of licensesc,t = η0+ φ ⋅ Enemy patentsc ⋅ postTWEAt + μt + gc + ωct
Second stage: Patents by U.S. inventorsc,t = α0 +ß ⋅ Number of licensesc ⋅ postTWEAt+ δt + fc + εc,t
  • count_cl_itt中的_itt 意为intend to treat有意处理

  • (count_cl= count_cl_itt)中前者为内生变量,后者为工具变量

  • i(class_id): i(id)

  • xtivreg是不报告robust的,但可用vce(bootstrap)得到“自助标准误” 。

  • 现在计量都是要报告聚类稳健标准误的(robust):

    Robust standard errors in parentheses

Table6(安慰剂检验)

1000次(随机乱做)中有800次不显著,随机性很弱,随机性误差不存在(可以忽略),说明这个政策真的有用。
准实验有随机性误差,这个显著是否是随机性误差,做一千次的打乱
乱分是显著的,那就要去比较效应大小,自己做的效应中有多少是随机性误差。
看估计系数的分布,真实的t统计量是否分布在尾端(是则真的显著)

                `随机生成数表`

计量中要挤掉随机性误差时间趋势样本选择偏差这三个泡沫`

限制,做到950m就停止,为了少占内存:

set more off
set mem 950m
  • Figure1
reg count_ger td* if licensed_class==0, noco
reg count_ger td* if licensed_class==1, noco

不复制figure,主要复制table

只给code的示例,保证你能想起怎么做

  • 循环:
    foreach var in treat(界定在哪个变量后循环)在某一个变量处进行循环,即treat1,treat2,……
    foreach var in treat意思就是对in后面的变量treat的每一个treat都执行下面的命令:
    forvalues 相当于for,while循环语句
    !=表示不等于
    cap后面表示将其赋值为原来的
foreach var in treat  {
forvalues x=1875/1918 {
    cap gen `var'_`x'=`var' if grn==`x'
    qui replace `var'_`x'=0 if grn!=`x'
    }
}
foreach var in treat count_cl year_conf {
forvalues x=1919/1939 {
    cap gen `var'_`x'=`var' if grn==`x'
    qui replace `var'_`x'=0 if grn!=`x'
    }
}

文章贡献:

首次提出强度DID,找工具变量解决的内生性问题。

感悟:

学AER的code,都有数据文件下载。
RD很开阔脑洞,将房价、教育等等文章都看下来,学外国的文献
RD本质不是方法,是数据重组的一个过程
重要的是带宽和模型形式(即多项式)

你可能感兴趣的:(计量DID)