随机误差项与一个或多个解释变量有关, C o v ( x k , u ) ≠ 0 Cov(x_k,u)\neq0 Cov(xk,u)=0
注意和自相关(序列相关)问题的区分
如果遗漏的变量不随时间变化,则直接使用固定效应模型。
否则,用代理变量替代不可观测重要变量(直接加一个变量进去)
条件:
选取变量 Z Z Z作为内生解释变量 X j X_j Xj的工具变量, Z Z Z是外生的:
C o v ( X j , u ) ≠ 0 C o v ( Z , u ) = 0 Cov(X_j,u)\neq0\\ Cov(Z,u)=0 Cov(Xj,u)=0Cov(Z,u)=0
工具变量与内生解释变量需高度相关(同时不能与模型中其他变量有过高的相关性):
C o v ( Z , X j ) ≠ 0 Cov(Z,X_j)\neq0\\ Cov(Z,Xj)=0
矩估计时的总体矩条件与对应的样本矩条件(矩条件将在工具变量法中发挥作用):
E ( μ i ) = 0 ⇒ 1 n ∑ ( Y i − β ^ 0 − β ^ 1 X i ) = 0 ; E ( X i μ i ) = 0 ⇒ 1 n ∑ ( Y i − β ^ 0 − β ^ 1 X i ) X i = 0. \mathrm{E}(\mu_i)=0\Rightarrow \frac{1}{n}\sum(Y_i-\hat\beta_0-\hat\beta_1X_i)=0;\\ \mathrm{E}(X_i\mu_i)=0\Rightarrow \frac{1}{n}\sum(Y_i-\hat\beta_0-\hat\beta_1X_i)X_i=0. E(μi)=0⇒n1∑(Yi−β^0−β^1Xi)=0;E(Xiμi)=0⇒n1∑(Yi−β^0−β^1Xi)Xi=0.
考虑总体矩条件,此时 E ( X j u ) ≠ 0 \mathrm{E}(X_ju)\ne 0 E(Xju)=0,(若总体矩不为0,则 X j X_j Xj为内生解释变量)故通过引入的外生变量 Z Z Z直接代替 X j X_j Xj,有另一个矩条件 E ( Z u ) \mathrm{E}(Zu) E(Zu),从而得到相应的样本矩条件,推导可以得到:
β ~ 1 = ∑ z i y i ∑ z i x i β ~ 0 = Y ˉ − β ~ 1 X ˉ . \tilde\beta_1=\frac{\sum z_iy_i}{\sum z_ix_i}\\ \tilde \beta_0=\bar{Y}-\tilde\beta_1\bar{X}. β~1=∑zixi∑ziyiβ~0=Yˉ−β~1Xˉ.
对多元矩阵模式,用工具变量矩阵 Z \pmb{Z} ZZZ替换掉 X j X_j Xj所在的列得到的新数据矩阵记作 Z Z Z,则 β ~ = ( Z ′ X ) − 1 Z ′ Y \tilde\beta=(Z'X)^{-1}Z'Y β~=(Z′X)−1Z′Y。
工具变量法小样本下仍然有偏,大样本下是一致估计量。
局限性在于,一个内生变量只能有一个工具变量。
IV估计的方差总是大于OLS的方差, X j X_j Xj与 Z Z Z的相关性越大,IV方差越接近于OLS方差。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZD1KtkdX-1657072619207)(…/…/Documents/Tencent%20Files/894860754/Image/C2C/22E9C2290B0E55713793474CE5BAE076.png)]
第一阶段:内生解释变量关于其所有工具变量以及原模型中的外生解释变量做OLS回归,记录 X i X_i Xi的拟合值 X i ^ \hat{X_i} Xi^:
X ^ i = α ^ 0 + α ^ 1 Z i , \hat X_i=\hat \alpha_0+\hat \alpha_1Z_i, X^i=α^0+α^1Zi,
第二阶段:用 X ^ i \hat X_i X^i代入 X i X_i Xi放回原模型回归:
Y i = β 0 + β 1 X ^ i + μ i , β ~ 1 = ∑ y i z i ∑ x i z i . Y_i=\beta_0+\beta_1\hat X_{i}+\mu_i,\\ \tilde\beta_1=\frac{\sum y_iz_i}{\sum x_iz_i}. Yi=β0+β1X^i+μi,β~1=∑xizi∑yizi.
注意,在第一阶段中,如果模型中含有其他的外生变量,要将其他外生变量加入回归,这适用于多元回归的情形。
多重共线性下,2SLS的方差大于OLS的方差:
思路:解释变量的内生性检验,内生性的存在与否决定了2SLS是否有必要。
X X X的外生性未知,但明确知道 Z 1 Z_1 Z1外生,即
Y i = β 0 + β 1 X i + β 2 Z i 1 + μ i , Y_i=\beta_0+\beta_1X_i+\beta_2Z_{i1}+\mu_i, Yi=β0+β1Xi+β2Zi1+μi,
如果 X X X是内生变量,则需寻找一外生变量 Z 2 Z_2 Z2作为工具变量,并对原模型进行工具变量法估计,看两者差异是否显著,如果显著差异,就说明 X X X内生。
第一步:类似2SLS,作辅助回归
X i = α 0 + α 1 Z i 1 ( 外 生 变 量 ) + α 2 Z i 2 ( 工 具 变 量 ) + ν i , X_i=\alpha_0+\alpha_1Z_{i1}(外生变量)+\alpha_2Z_{i2}(工具变量)+\nu_i, Xi=α0+α1Zi1(外生变量)+α2Zi2(工具变量)+νi,
得到残差项 ν ^ i \hat \nu_i ν^i.
第二步:把残差项加入原模型,即
Y i = β 0 + β 1 X i + β 2 Z i 1 + δ ν ^ i + ε i . Y_i=\beta_0+\beta_1X_i+\beta_2Z_{i1}+\delta\hat\nu_i+\varepsilon_i. Yi=β0+β1Xi+β2Zi1+δν^i+εi.
如果认为 X X X外生,那么第一步辅助回归应当没有什么帮助,所以原假设是 H 0 : δ = 0 H_0:\delta=0 H0:δ=0,用 t t t统计量检验原假设。
如果拒绝该假设,就认为 X X X是内生变量。
说明: