截面数据(Cross-sectional data)
时间序列数据(Time-series data)
混合截面数据(Pooled cross sections)
面板数据(Panel data)
One-way(单向效应):只考虑个体效应(individual effect),不考虑时间效应(time effect)。
y i t = β 0 + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + ϵ i t ϵ i t = λ i + u i t y_{it}=\beta_0+\beta_1x_{1it}+\beta_2x_{2it}+\dots+\beta_kx_{kit}+\epsilon_{it}\\ \epsilon_{it}=\lambda_i+u_{it} yit=β0+β1x1it+β2x2it+⋯+βkxkit+ϵitϵit=λi+uit
λ i \lambda_i λi是不可观测的个体效应。固定效应模型和随机效应模型都是非观测效应模型(unobserved effects model)。
结果:每一个横截面的不同个体具有固定的不同的截距项(因为 λ \lambda λ与解释变量相关,每个个体的解释变量观察值不同,所以不同个体的 λ \lambda λ不同)
y i t = β 0 + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + λ i + u i t y_{it}=\beta_0+\beta_1x_{1it}+\beta_2x_{2it}+\dots+\beta_kx_{kit}+\lambda_i+u_{it} yit=β0+β1x1it+β2x2it+⋯+βkxkit+λi+uit
给定一个个体 i i i,将上式两边对时间取平均:
y ‾ i t = β 0 + β 1 x ‾ 1 i + β 2 x ‾ 2 i + ⋯ + β k x ‾ k i + λ i + u ‾ i \overline y_{it}=\beta_0+\beta_1\overline x_{1i}+\beta_2\overline x_{2i}+\dots+\beta_k\overline x_{ki}+\lambda_i+\overline u_i yit=β0+β1x1i+β2x2i+⋯+βkxki+λi+ui
两式相减:
y i t − y ‾ i t = β 1 ( x 1 i t − x ‾ 1 i ) + β 2 ( x 2 i t − x ‾ 2 i ) + ⋯ + β k ( x k i t − x ‾ k i ) + ( u i t − u ‾ i ) y ~ i t = β 1 x ~ 1 i t + β 2 x ~ 2 i t + ⋯ + β k x ~ k i t + u ~ i t y_{it}-\overline y_{it}=\beta_1(x_{1it}-\overline x_{1i})+\beta_2(x_{2it}-\overline x_{2i})+\dots+\beta_k(x_{kit}-\overline x_{ki})+(u_{it}-\overline u_i)\\ \tilde y_{it}=\beta_1\tilde x_{1it}+\beta_2\tilde x_{2it}+\dots+\beta_k\tilde x_{kit}+\tilde u_{it} yit−yit=β1(x1it−x1i)+β2(x2it−x2i)+⋯+βk(xkit−xki)+(uit−ui)y~it=β1x~1it+β2x~2it+⋯+βkx~kit+u~it
用OLS估计 β \beta β,称为固定效应估计量(Fixed Effects Estimator),记为 β ^ F E \hat \beta_{FE} β^FE。
β ^ F E \hat \beta_{FE} β^FE主要使用了每个个体的组内离差信息,故也称为组内估计量(within estimator)
优势:即使个体效应与解释变量相关,也可得一致估计。
劣势:无法估计不随时间而变的变量之影响(如教育、性别、少数民族),即time invariant的变量没有得到估计
因为time invariant的变量,取时间平均前后的值相同,在第二步相减的过程中消去,所以这个变量没有得到估计。
将不可观测的个体效应 λ i \lambda_i λi看做待估计的参数, β 0 + λ i \beta_0+\lambda_i β0+λi就是个体 i i i的截距。估计 n n n个截距的方法就是引入 n − 1 n−1 n−1个虚拟变量(如果省略常数项 β 0 \beta_0 β0,则引入n个虚拟变量)。
y i t = λ 1 D 1 + ⋯ + λ n − 1 D n − 1 + β 0 + β 1 x 1 i t + ⋯ + β k i t x k i t + u i t y_{it}=\lambda_1D_1+\dots+\lambda_{n-1}D_{n-1}+\beta_0+\beta_1x_{1it}+\dots+\beta_{kit}x_{kit}+u_{it} yit=λ1D1+⋯+λn−1Dn−1+β0+β1x1it+⋯+βkitxkit+uit
对于个体 i i i, D i = 1 D_i=1 Di=1,否则取0。
再进行OLS估计
结果:每个截面的每个个体的截距项都是一个随机变量
(复杂,不太会考,略)
结果:设所有的横截面个体在不同时期的截距和斜率都是相同的
H 0 : λ 1 = λ 2 = ⋯ = λ n − 1 = 0 H_0:\lambda_1=\lambda_2=\dots=\lambda_{n-1}=0 H0:λ1=λ2=⋯=λn−1=0,即 λ i = 0 ( i = 1 , 2 … , n − 1 ) \lambda_i=0(i=1,2\dots,n-1) λi=0(i=1,2…,n−1),所有的个体效应都为0,即不存在个体效应。
有一个独立的常数项 β 0 \beta_0 β0,所以对于有 n n n个个体,引入 n − 1 n-1 n−1个虚拟变量。
未受约束模型(Unrestricted Model):固定效应模型(引入虚拟变量 D i D_i Di)
y i t = λ 1 D 1 + ⋯ + λ n − 1 D n − 1 + β 0 + β 1 x 1 i t + ⋯ + β k i t x k i t + u i t y_{it}=\lambda_1D_1+\dots+\lambda_{n-1}D_{n-1}+\beta_0+\beta_1x_{1it}+\dots+\beta_{kit}x_{kit}+u_{it} yit=λ1D1+⋯+λn−1Dn−1+β0+β1x1it+⋯+βkitxkit+uit
受约束的模型(Restricted Model):混合回归模型
y i t = β 0 + β 1 x 1 i t + ⋯ + β k i t x k i t + u i t y_{it}=\beta_0+\beta_1x_{1it}+\dots+\beta_{kit}x_{kit}+u_{it} yit=β0+β1x1it+⋯+βkitxkit+uit
F F F统计量大于临界值,拒绝原假设,则通过F检验,个体效应显著,应该选用固定效应模型;否则个体效应不显著,选用混合回归模型。
H 0 : C o v ( λ i , x k i t ) = 0 H_0:Cov(\lambda_i,x_{kit})=0 H0:Cov(λi,xkit)=0,模型误差项与解释变量之间正交,即个体效应(异质性)与解释变量不相关
H 1 : C o v ( λ i , x k i t ) ≠ 0 H_1:Cov(\lambda_i,x_{kit})\neq0 H1:Cov(λi,xkit)=0,即个体效应(异质性)与解释变量相关
拒绝原假设,选择固定效应模型;接受原假设,选择随机效应模型。(可以根据固定效应和随机效应模型的假设定义来记忆)
如果 C o v ( λ i , x k i t ) = 0 Cov(\lambda_i,x_{kit})=0 Cov(λi,xkit)=0,FE 和 RE 都是一致的,但RE更有效;则FE与RE估计量将共同收敛于真实的参数值,但选择效率更高的RE;
如果 C o v ( λ i , x k i t ) ≠ 0 Cov(\lambda_i,x_{kit})\neq0 Cov(λi,xkit)=0,FE仍然一致,但RE是有偏的;两者的差距过大,选择FE。
该检验的缺点:不适用于异方差情形,若随机误差项存在异方差,RE不是最有效的。
H 0 : σ u 2 = 0 H_0:\sigma_u^2=0 H0:σu2=0
H 1 : σ u 2 ≠ 0 H_1:\sigma_u^2\neq0 H1:σu2=0
Two-way(双向效应):同时考虑个体效应和时间效应
通过该模型可以比较某一政策对不同组别的样本的影响。双重差分用于检验某一外生事件产生的影响,如:金融危机、政策变化等。
Y i t = β 0 + β 1 T r e a t i + β 2 A f t e r t + β 3 T r e a t i × A f t e r t + e i t Y_{it}=\beta_0+\beta_1Treat_i+\beta_2After_t+\beta_3Treat_i\times After_t+e_{it} Yit=β0+β1Treati+β2Aftert+β3Treati×Aftert+eit
T r e a t i Treat_i Treati:处理组(受到事件影响的样本)=1,控制组(不受事件影响的样本)=0;
A f t e r t After_t Aftert:事件发生后=1,事件发生前=0.
事件发生前After=0 | 事件发生后After=1 | Difference | |
---|---|---|---|
处理组Treat=1 | β 0 + β 1 \beta_0+\beta_1 β0+β1 | β 0 + β 1 + β 2 + β 3 \beta_0+\beta_1+\beta_2+\beta_3 β0+β1+β2+β3 | ⇒ Δ Y T r e a t = β 2 + β 3 \Rightarrow\Delta Y_{Treat}=\beta_2+\beta_3 ⇒ΔYTreat=β2+β3 |
控制组Treat=0 | β 0 \beta_0 β0 | β 0 + β 2 \beta_0+\beta_2 β0+β2 | ⇒ Δ Y C o n t r o l = β 2 \Rightarrow\Delta Y_{Control}=\beta_2 ⇒ΔYControl=β2 |
Difference | Dif-In-Dif ⇓ Δ Δ Y = β 3 \Downarrow\\\Delta\Delta Y=\beta_3 ⇓ΔΔY=β3 |
要检验的是 β 3 \beta_3 β3是否显著。
Y i t = β 0 + β 3 T r e a t i × A f t e r t + λ i + μ t + u i t Y_{it}=\beta_0+\beta_3Treat_i\times After_t+\lambda_i+\mu_t+u_{it} Yit=β0+β3Treati×Aftert+λi+μt+uit