1.面板数据模型理论--变截距面板数据模型

变截距面板数据模型

变截距面板数据模型理论介绍

混合效应模型

背景思想

回归公式可以忽略个体与时间变化的差异,因此所有的数据特征可以通过一个公式进行刻画。进行数据的大杂烩、乱炖。为什么采取这么直接粗暴的方式呢?因为每个品种的菜(个体与时间维度)都很少,每一个品种的菜都不能够做出完整一盘菜,只能将所有的菜杂七杂八的混合起来乱炖。乱炖虽说精度不高,可是总比没法处理要好很多。

模型假定

1. E ( ε i t ) = 0 E(\varepsilon_{it})=0 E(εit)=0;
2. v a r ( ε ) = σ ε 为 常 数 var(\varepsilon)=\sigma_\varepsilon为常数 var(ε)=σε
3. ε i t 与 X i t 不 相 关 \varepsilon_{it}与X_{it}不相关 εitXit;

公式:

Y i t = α + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T

项目 含义
i i i 个体标志序数
t t t 时间序数
X i t X_{it} Xit 观测变量, K ∗ 1 K*1 K1向量, ( X 1 i t , , X 2 i t , . . , X k i t ) ′ (X_{1it,},X_{2it},..,X_{kit})' (X1it,,X2it,..,Xkit)
β \beta β 参数, K ∗ 1 K*1 K1向量, ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk)
α \alpha α 截距项
ε i t \varepsilon_{it} εit 随机扰动项
估计方法展示
数据结构展示:

1.面板数据模型理论--变截距面板数据模型_第1张图片

估计方法:

这个模型是将所有的数据 ( y , x 1 , x 2 , x 3 , x 4 ) (y,x_1,x_2,x_3,x_4) (y,x1,x2,x3,x4)直接导入公式 Y i t = α + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T进行回归,只能求出一组 ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk),意味着 β \beta β在不同个体、不同时点上都是同一组,它不会因为时间或个体而发生变动。

固定效应模型

背景思想

有一些影响因素A随着一些条件的改变而改变,但是这个因素A并未通过 X X X观测变量纳入模型,比如说我们研究消费函数, C = α + β Y + ε C = \alpha + \beta Y + \varepsilon C=α+βY+ε, 这里的 α \alpha α叫做自发消费,这个自发性消费是可能和个人特征、所处的社会文化、教育等未观测变量有关,换句话说,截距项 α \alpha α 和个体某些未观测到的特质有关,而不和 Y Y Y有关。 α \alpha α ε \varepsilon ε都是代表了不可观测因素的影响,前者的影响因素是有趋势的(常数也是一种趋势),后者的影响因素是无趋势的。更简单的理解就是, α \alpha α存在的意义就是为了使 ε \varepsilon ε拥有零均值。

  • 当这个截距项与个体特征相关时,我们称为个体固定效应模型。
  • 当这个截距项与时间特征有关时,我们称为时间固定效应模型。
  • 同理,和A潜在变量有关,我们就可以称它为A的固定效应模型。
  • 当这个截距项与个体特征和时间特征都相关时,我们称为双固定效应模型。
  • 同理,也可以同时依据三种或三种以上的变量进行分类,回归得出它们影响的截距项的估计值。
个体固定效应模型
模型假设

1. E ( ε i t ) = 0 E(\varepsilon_{it})=0 E(εit)=0;
2. v a r ( ε ) = σ ε 为 常 数 var(\varepsilon)=\sigma_\varepsilon为常数 var(ε)=σε
3 ε i t 与 X i t 不 相 关 \varepsilon_{it}与X_{it}不相关 εitXit;
4. α i 与 X i t 相 关 \alpha_i 与X_{it}相关 αiXit
5. E ( α i ) = 0 E(\alpha_i)=0 E(αi)=0

模型公式

Y i t = α 0 + α i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha_0 +\alpha_i + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α0+αi+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T

项目 含义
i i i 个体标志序数
t t t 时间序数
X i t X_{it} Xit 观测变量, K ∗ 1 K*1 K1向量, ( X 1 i t , , X 2 i t , . . , X k i t ) ′ (X_{1it,},X_{2it},..,X_{kit})' (X1it,,X2it,..,Xkit)
β \beta β 参数, K ∗ 1 K*1 K1向量, ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk)
α 0 \alpha_0 α0 常数项
α i \alpha_i αi 个体效应
α 0 + α i \alpha_0+\alpha_i α0+αi 截距项
ε i t \varepsilon_{it} εit 随机扰动项

补充:也写为
Y i t = u i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=u_i+ X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=ui+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T
u i = α 0 + α i , E ( u i ) = α 0 , E ( α i ) = 0 u_i = \alpha_0 +\alpha_i, E(u_i)= \alpha_0,E(\alpha_i)=0 ui=α0+αi,E(ui)=α0,E(αi)=0

估计方法展示

数据结构如下:
1.面板数据模型理论--变截距面板数据模型_第2张图片

1.组内(within)估计(离差估计)
离差估计就是剔除常数项,然后进行估计,首先明白我们的目标:分别计算 a , b , c , d , e a,b,c,d,e a,b,c,d,e组内的截距和各自的组内 β \beta β .其实,不需要离差就可以回归。将a,b,c,d,e组的数据分别带入 Y i t = α 0 + α i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha_0 +\alpha_i + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α0+αi+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T,就可以得到结果。

  • 离差方差推导
    原方程:
    Y i t = α 0 + α i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha_0 +\alpha_i + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α0+αi+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T
    求均值方程:
    Y ˉ i = α 0 + α i + X ˉ i ′ β + ε ˉ i , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T \bar Y_{i}=\alpha_0 +\alpha_i + \bar X_{i}' \beta + \bar \varepsilon_{i},i = 1,2,3,...,N;t=1,2,3,...,T Yˉi=α0+αi+Xˉiβ+εˉi,i=1,2,3,...,N;t=1,2,3,...,T
    离差变换(原方程减均值方程):
    Y i t − Y ˉ i = α 0 + α i − ( α 0 + α i ) + X i t ′ β − X ˉ i ′ β + ε i t − ε ˉ i = X i t ′ β − X ˉ i ′ β + ε i t − ε ˉ i , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}-\bar Y_{i}=\alpha_0 +\alpha_i -(\alpha_0 +\alpha_i)+ X_{it}' \beta - \bar X_{i}' \beta+ \varepsilon_{it}-\bar \varepsilon_{i}= X_{it}' \beta - \bar X_{i}' \beta+ \varepsilon_{it}-\bar \varepsilon_{i},i = 1,2,3,...,N;t=1,2,3,...,T YitYˉi=α0+αi(α0+αi)+XitβXˉiβ+εitεˉi=XitβXˉiβ+εitεˉi,i=1,2,3,...,N;t=1,2,3,...,T
    Y ˉ i = 1 T ∑ t = 1 T ( Y i t ) \bar Y_i= \frac{1}{T}\displaystyle\sum_{t=1}^T(Y_{it}) Yˉi=T1t=1T(Yit)
    X ˉ i = 1 T ∑ t = 1 T ( X i t ) \bar X_i= \frac{1}{T}\displaystyle\sum_{t=1}^T(X_{it}) Xˉi=T1t=1T(Xit)

  • 带入离差数据求解,文字描述
    通过 ( y , x 1 , x 2 , x 3 , x 4 ) (y,x_1,x_2,x_3,x_4) (y,x1,x2,x3,x4)计算组内时间上的均值 ( y , x 1 , x 2 , x 3 , x 4 ) ˉ \bar{(y,x_1,x_2,x_3,x_4)} (y,x1,x2,x3,x4)ˉ,然后计算离差 ( y , x 1 , x 2 , x 3 , x 4 ) − ( y , x 1 , x 2 , x 3 , x 4 ) ˉ (y,x_1,x_2,x_3,x_4)- \bar{(y,x_1,x_2,x_3,x_4)} (y,x1,x2,x3,x4)(y,x1,x2,x3,x4)ˉ,带入离差方程 Y i t − Y ˉ i = X i t ′ β − X ˉ i ′ β + ε i t − ε ˉ i , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}-\bar Y_{i}= X_{it}' \beta - \bar X_{i}' \beta+ \varepsilon_{it}-\bar \varepsilon_{i},i = 1,2,3,...,N;t=1,2,3,...,T YitYˉi=XitβXˉiβ+εitεˉi,i=1,2,3,...,N;t=1,2,3,...,T进行估计。

  • 利用估计出的 β \beta β带入均值方程 Y ˉ i = α 0 + α i + X ˉ i ′ β + ε ˉ i , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T \bar Y_{i}=\alpha_0 +\alpha_i + \bar X_{i}' \beta + \bar \varepsilon_{i},i = 1,2,3,...,N;t=1,2,3,...,T Yˉi=α0+αi+Xˉiβ+εˉi,i=1,2,3,...,N;t=1,2,3,...,T,求解组内的( α 0 + α i \alpha_0 +\alpha_i α0+αi)

  • 通过上一步 N N N个组的( α 0 + α i \alpha_0 +\alpha_i α0+αi),求解 α 0 = 1 N ∑ t = 1 N ( α 0 + α i ) \alpha_0 = \frac{1}{N}\displaystyle\sum_{t=1}^N(\alpha_0 +\alpha_i) α0=N1t=1N(α0+αi),依据假设5: E ( α i ) = 0 E(\alpha_i)=0 E(αi)=0

  • 再求解 α i = ( α 0 + α i ) − α 0 \alpha_i = (\alpha_0 +\alpha_i) - \alpha_0 αi=(α0+αi)α0

2.一阶差分估计
原理: 因为 α 0 + α i \alpha_0 +\alpha_i α0+αi是不受时间影响的,所以我们可以使用差分方法消去常数项

  • 差分方程推导
    原方程:
    Y i t = α 0 + α i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha_0 +\alpha_i + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α0+αi+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T
    上一期方程:
    Y i , t − 1 = α 0 + α i + X i , t − 1 ′ β + ε i , t − 1 , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{i,t-1}=\alpha_0 +\alpha_i + X_{i,t-1}' \beta + \varepsilon_{i,t-1},i = 1,2,3,...,N;t=1,2,3,...,T Yi,t1=α0+αi+Xi,t1β+εi,t1,i=1,2,3,...,N;t=1,2,3,...,T
    原方程减上一期方程:
    Y i t − Y i , t − 1 = α 0 + α i + X i t ′ β + ε i t − α 0 − α i − X i , t − 1 ′ β − ε i . t − 1 = X i t ′ β − X i , t − 1 ′ β + ε i t − ε i , t − 1 Y_{it}-Y_{i,t-1}=\alpha_0 +\alpha_i + X_{it}' \beta + \varepsilon_{it}-\alpha_0 - \alpha_i - X_{i,t-1}' \beta - \varepsilon_{i.t-1} = X_{it}' \beta -X_{i,t-1}' \beta + \varepsilon_{it}- \varepsilon_{i,t-1} YitYi,t1=α0+αi+Xitβ+εitα0αiXi,t1βεi.t1=XitβXi,t1β+εitεi,t1
  • 数据代入求解即可。
  • 此方法无法求解截距项。

3.LSDV(最小二乘虚拟变量法)
学过计量的小伙伴们应该熟悉虚拟变量法,将个体差异以截距项形式的虚拟变量加入。
估计方程形式:
Y = D α + X β + ε Y = D \alpha+X\beta + \varepsilon Y=Dα+Xβ+ε
D = ( D 1 D 2 D 3 . . . D N ) D=\begin{pmatrix} D_1 & D_2&D_3&...&D_N \end{pmatrix} D=(D1D2D3...DN)
其中:
D N = { 1 if  为 N 组 0 if  不 为 N 组 D_N=\begin{cases} 1 &\text{if } 为N组 \\ 0 &\text{if } 不为N组 \end{cases} DN={10if Nif N

时点固定效应模型
模型假设

1. E ( ε i t ) = 0 E(\varepsilon_{it})=0 E(εit)=0;
2. v a r ( ε ) = σ ε 为 常 数 var(\varepsilon)=\sigma_\varepsilon为常数 var(ε)=σε
3 ε i t 与 X i t 不 相 关 \varepsilon_{it}与X_{it}不相关 εitXit;
4. λ t 与 X i t 相 关 \lambda_t 与X_{it}相关 λtXit

模型公式

Y i t = λ 0 + λ t + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\lambda_0 +\lambda_t + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=λ0+λt+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T

项目 含义
i i i 个体标志序数
t t t 时间序数
X i t X_{it} Xit 观测变量, K ∗ 1 K*1 K1向量, ( X 1 i t , , X 2 i t , . . , X k i t ) ′ (X_{1it,},X_{2it},..,X_{kit})' (X1it,,X2it,..,Xkit)
β \beta β 参数, K ∗ 1 K*1 K1向量, ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk)
λ 0 \lambda_0 λ0 常数项
λ t \lambda_t λt 时间效应
λ 0 + λ t \lambda_0+\lambda_t λ0+λt 截距项
ε i t \varepsilon_{it} εit 随机扰动项
估计方法展示

数据结构如下:
1.面板数据模型理论--变截距面板数据模型_第3张图片

LSDV(最小二乘虚拟变量法)
学过计量的小伙伴们应该熟悉虚拟变量法,将时间段以截距项形式的虚拟变量加入。
估计方程形式:
Y = D λ + X β + ε Y = D\lambda+X\beta + \varepsilon Y=Dλ+Xβ+ε
D = ( D 1 D 2 D 3 . . . D T ) D=\begin{pmatrix} D_1 & D_2&D_3&...&D_T \end{pmatrix} D=(D1D2D3...DT)
其中:
D T = { 1 if  为 T 时 期 0 if  不 为 T 时 期 D_T=\begin{cases} 1 &\text{if } 为T时期 \\ 0 &\text{if } 不为T时期 \end{cases} DT={10if Tif T

个体时点固定效应模型
模型假设

1 E ( ε i t ) = 0 E(\varepsilon_{it})=0 E(εit)=0;
2 v a r ( ε ) = σ ε 为 常 数 var(\varepsilon)=\sigma_\varepsilon为常数 var(ε)=σε
3 ε i t 与 X i t 不 相 关 \varepsilon_{it}与X_{it}不相关 εitXit;
4 λ t 与 X i t 相 关 \lambda_t 与X_{it}相关 λtXit
5 α i 与 X i t 相 关 \alpha_i 与X_{it}相关 αiXit
6 E ( α i ) = 0 E(\alpha_i)=0 E(αi)=0
7 E ( λ i ) = 0 E(\lambda_i)=0 E(λi)=0

这里我们设定:
α ~ i = α 0 + α i ; λ ~ t = λ 0 + λ t \tilde{\alpha}_i=\alpha_0+\alpha_i;\tilde{\lambda}_t=\lambda_0+\lambda_t α~i=α0+αi;λ~t=λ0+λt;
8 E ( α ~ i ) = α 0 E(\tilde{\alpha}_i)=\alpha_0 E(α~i)=α0;
9 E ( λ ~ i ) = λ 0 E(\tilde{\lambda}_i)=\lambda_0 E(λ~i)=λ0;

模型公式

Y i t = ( α 0 + λ 0 ) + α i + λ t + X i t ′ β + ε i t Y_{it}=(\alpha_0 +\lambda_0)+\alpha_i +\lambda_t + X_{it}' \beta + \varepsilon_{it} Yit=(α0+λ0)+αi+λt+Xitβ+εit
= α 0 + α i + λ 0 + λ t + X i t ′ β + ε i t =\alpha_0 +\alpha_i + \lambda_0 +\lambda_t + X_{it}' \beta + \varepsilon_{it} =α0+αi+λ0+λt+Xitβ+εit
= α ~ i + λ ~ i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T =\tilde{\alpha}_i+\tilde{\lambda}_i+X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T =α~i+λ~i+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T

项目 含义
i i i 个体标志序数
t t t 时间序数
X i t X_{it} Xit 观测变量, K ∗ 1 K*1 K1向量, ( X 1 i t , , X 2 i t , . . , X k i t ) ′ (X_{1it,},X_{2it},..,X_{kit})' (X1it,,X2it,..,Xkit)
β \beta β 参数, K ∗ 1 K*1 K1向量, ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk)
λ 0 \lambda_0 λ0 时间效应的常数项
λ t \lambda_t λt 时间效应
α 0 \alpha_0 α0 个体特征的常数项
α i \alpha_i αi 个体效应
α 0 + α i + λ 0 + λ t \alpha_0+\alpha_i+\lambda_0+\lambda_t α0+αi+λ0+λt 截距项
ε i t \varepsilon_{it} εit 随机扰动项
估计方法

数据结构展示:
1.面板数据模型理论--变截距面板数据模型_第4张图片
LSDV(最小二乘虚拟变量法)
学过计量的小伙伴们应该熟悉虚拟变量法,将时间段以截距项形式的虚拟变量加入。

  • 估计方程形式:
    Y = D λ λ + D α α + X β + ε Y = D_{\lambda}\lambda + D_\alpha\alpha+X\beta + \varepsilon Y=Dλλ+Dαα+Xβ+ε
    D λ = ( D 1 D 2 D 3 . . . D T ) D_{\lambda}=\begin{pmatrix} D_1 & D_2&D_3&...&D_T \end{pmatrix} Dλ=(D1D2D3...DT)
    其中:
    D T = { 1 if  为 T 时 期 0 if  不 为 T 时 期 D_T=\begin{cases} 1 &\text{if } 为T时期 \\ 0 &\text{if } 不为T时期 \end{cases} DT={10if Tif T
    D α = ( D 1 D 2 D 3 . . . D N ) D_\alpha=\begin{pmatrix} D_1 & D_2&D_3&...&D_N \end{pmatrix} Dα=(D1D2D3...DN)
    其中:
    D N = { 1 if  为 N 组 0 if  不 为 N 组 D_N=\begin{cases} 1 &\text{if } 为N组 \\ 0 &\text{if } 不为N组 \end{cases} DN={10if Nif N

  • 也可以将时间与个体效应混合
    Y = D h + X β + ε Y = Dh + X\beta + \varepsilon Y=Dh+Xβ+ε
    D = ( D 1 D 2 D 3 . . . D N ∗ T ) D=\begin{pmatrix} D_1 & D_2&D_3&...&D_{N*T} \end{pmatrix} D=(D1D2D3...DNT)
    其中:
    D = { 1 if  为 第 N 个 体 的 T 时 期 0 if  不 为 第 N 个 体 的 T 时 期 D=\begin{cases} 1 &\text{if } 为第N个体的T时期 \\ 0 &\text{if } 不为第N个体的T时期 \end{cases} D={10if NTif NT

个体时点双固定效应,控制区域、行业等模型
模型假设

1 E ( ε i t ) = 0 E(\varepsilon_{it})=0 E(εit)=0;
2 v a r ( ε ) = σ ε 为 常 数 var(\varepsilon)=\sigma_\varepsilon为常数 var(ε)=σε
3 ε i t 与 X i t 不 相 关 \varepsilon_{it}与X_{it}不相关 εitXit;
4 λ t 与 X i t 相 关 \lambda_t 与X_{it}相关 λtXit
5 α i 与 X i t 相 关 \alpha_i 与X_{it}相关 αiXit
6 E ( α i ) = 0 E(\alpha_i)=0 E(αi)=0
7 E ( λ t ) = 0 E(\lambda_t)=0 E(λt)=0

这里我们设定:
α ~ i = α 0 + α i ; λ ~ i = λ 0 + λ t \tilde{\alpha}_i=\alpha_0+\alpha_i;\tilde{\lambda}_i=\lambda_0+\lambda_t α~i=α0+αi;λ~i=λ0+λt;
8 E ( α ~ i ) = α 0 E(\tilde{\alpha}_i)=\alpha_0 E(α~i)=α0;
9 E ( λ ~ t ) = λ 0 E(\tilde{\lambda}_t)=\lambda_0 E(λ~t)=λ0;

模型公式

Y i t = α ~ i + λ ~ t + D t y p e γ + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\tilde{\alpha}_i+\tilde{\lambda}_t+D_{type}\gamma+X_{it}' \beta + \varepsilon_{it}, i = 1,2,3,...,N;t=1,2,3,...,T Yit=α~i+λ~t+Dtypeγ+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T

这个方程为了方便理解而设定,其中 α ~ i 与 D t y p e \tilde{\alpha}_i与D_{type} α~iDtype存在共线性问题,毕竟类型属性也是个体特征的一部分嘛!

项目 含义
i i i 个体标志序数
t t t 时间序数
X i t X_{it} Xit 观测变量, K ∗ 1 K*1 K1向量, ( X 1 i t , , X 2 i t , . . , X k i t ) ′ (X_{1it,},X_{2it},..,X_{kit})' (X1it,,X2it,..,Xkit)
β \beta β 参数, K ∗ 1 K*1 K1向量, ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk)
λ 0 \lambda_0 λ0 时间效应的常数项
λ t \lambda_t λt 时间效应
α 0 \alpha_0 α0 个体特征的常数项
α i \alpha_i αi 个体效应
α 0 + α i + λ 0 + λ t \alpha_0+\alpha_i+\lambda_0+\lambda_t α0+αi+λ0+λt 截距项
ε i t \varepsilon_{it} εit 随机扰动项
D t y p e D_{type} Dtype 类型的虚拟变量
估计方法展示

数据展示
1.面板数据模型理论--变截距面板数据模型_第5张图片
估计方法:同上,将类型变量按照虚拟变量加入方程即可。

随机效应模型

背景思想:每组估计值的截距项的变动不与X的特征有关。

个体随机效应
模型假设

1. E ( ε i t ) = 0 E(\varepsilon_{it})=0 E(εit)=0;
2. v a r ( σ ε ) 为 常 数 var(\sigma_\varepsilon)为常数 var(σε)
3 ε i t 与 X i t 不 相 关 \varepsilon_{it}与X_{it}不相关 εitXit;
4. α i 与 X i t , ε i t 不 相 关 \alpha_i 与X_{it},\varepsilon_{it}不相关 αiXit,εit;
5. α i ∼ i . i . d ( 0 , σ α 2 ) \alpha_i \thicksim i.i.d(0,\sigma_\alpha^2) αii.i.d(0,σα2);

公式:

Y i t = α 0 + α i + X i t ′ β + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T Y_{it}=\alpha_0 +\alpha_i + X_{it}' \beta + \varepsilon_{it},i = 1,2,3,...,N;t=1,2,3,...,T Yit=α0+αi+Xitβ+εit,i=1,2,3,...,N;t=1,2,3,...,T
= α 0 + X i t ′ β + ( α i + ε i t ) , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T =\alpha_0 + X_{it}' \beta +(\alpha_i+ \varepsilon_{it}),i = 1,2,3,...,N;t=1,2,3,...,T =α0+Xitβ+(αi+εit),i=1,2,3,...,N;t=1,2,3,...,T
= α 0 + X i t ′ β + v i t , v i t = α i + ε i t , i = 1 , 2 , 3 , . . . , N ; t = 1 , 2 , 3 , . . . , T =\alpha_0 + X_{it}' \beta + v_{it}, v_{it}=\alpha_i + \varepsilon_{it}, i = 1,2,3,...,N;t=1,2,3,...,T =α0+Xitβ+vit,vit=αi+εit,i=1,2,3,...,N;t=1,2,3,...,T

项目 含义
i i i 个体标志序数
t t t 时间序数
X i t X_{it} Xit 观测变量, K ∗ 1 K*1 K1向量, ( X 1 i t , , X 2 i t , . . , X k i t ) ′ (X_{1it,},X_{2it},..,X_{kit})' (X1it,,X2it,..,Xkit)
β \beta β 参数, K ∗ 1 K*1 K1向量, ( β 1 , β 2 , . . , β k ) ′ (\beta_{1},\beta_{2},..,\beta_{k})' (β1,β2,..,βk)
α 0 \alpha_0 α0 常数项
α i \alpha_i αi 随机效应
α 0 + α i \alpha_0+\alpha_i α0+αi 截距项
ε i t \varepsilon_{it} εit 随机扰动项
v i t = α i + ε i t v_{it}=\alpha_i + \varepsilon_{it} vit=αi+εit 新的随机扰动项

根据 v i t = α i + ε i t v_{it}=\alpha_i + \varepsilon_{it} vit=αi+εit α i ∼ i . i . d ( 0 , σ α 2 ) \alpha_i \thicksim i.i.d(0,\sigma_\alpha^2) αii.i.d(0,σα2); α i 与 X i t , ε i t 不 相 关 \alpha_i 与X_{it},\varepsilon_{it}不相关 αiXit,εit; v a r ( ε ) = σ ε 为 常 数 var(\varepsilon)=\sigma_\varepsilon为常数 var(ε)=σε
推导:
c o v ( v i t , v i s ) = c o v ( α i + ε i t , α i + ε i s ) = c o v ( α i , α i + ε i s ) + c o v ( ε i t , α i + ε i s ) = c o v ( α i , α i ) + c o v ( α i , ε i s ) + c o v ( ε i t , α i ) + c o v ( ε i t ,   ε i s ) = { σ α 2 if  t ≠ s σ α 2 + σ ε if  t = s cov(v_{it},v_{is})=cov(\alpha_i + \varepsilon_{it},\alpha_i + \varepsilon_{is})=cov(\alpha_i ,\alpha_i + \varepsilon_{is})+cov(\varepsilon_{it},\alpha_i + \varepsilon_{is})=cov(\alpha_i ,\alpha_i )+cov(\alpha_i ,\varepsilon_{is})+cov(\varepsilon_{it},\alpha_i )+ cov(\varepsilon_{it},\ \varepsilon_{is}) =\begin{cases} \sigma_\alpha^2 &\text{if } t \neq s \\ \sigma_\alpha^2 + \sigma_\varepsilon &\text{if } t=s \end{cases} cov(vit,vis)=cov(αi+εit,αi+εis)=cov(αi,αi+εis)+cov(εit,αi+εis)=cov(αi,αi)+cov(αi,εis)+cov(εit,αi)+cov(εit, εis)={σα2σα2+σεif t=sif t=s
所以不满足古典假定,存在异方差与自相关问题。

估计方法展示
  • 可行的广义最小二乘法(FGLS)
    在这里插入图片描述
    1.面板数据模型理论--变截距面板数据模型_第6张图片
    1.面板数据模型理论--变截距面板数据模型_第7张图片

模型设定检验

F检验(chow’s test)

原假设:混合回归模型
备择假设:其他模型

以个体固定效应模型为例: Y i t = u i + X i t ′ β + ε i t Y_{it}=u_i+X_{it}'\beta+ \varepsilon_{it} Yit=ui+Xitβ+εit

原假设: u 1 = u 2 = . . . = u N u_1=u_2=...=u_N u1=u2=...=uN (存在约束,截距不会变)
Y i t = u i + X i t ′ β + ε i t Y_{it}=u_i+X_{it}'\beta+ \varepsilon_{it} Yit=ui+Xitβ+εit
计算回归的 R S S r RSS_r RSSr
备择假设: u 1 , u 2 , . . . , u N 不 全 相 等 u_1,u_2,...,u_N不全相等 u1u2...uN (无约束,截距会变)
Y i t = u i + X i t ′ β + ε i t Y_{it}=u_i+X_{it}'\beta+ \varepsilon_{it} Yit=ui+Xitβ+εit
计算回归的 R S S u RSS_u RSSu

F统计量构造:
F = ( R S S r − R S S u ) / [ ( N T − k − 1 ) − ( N T − k − N ) ] R S S u / ( N T − k − N ) ∼ F ( N − 1 , N T − k − N ) F=\cfrac{(RSS_r-RSS_u)/[(NT-k-1)-(NT-k-N)]}{RSS_u/(NT-k-N)} \thicksim F(N-1,NT-k-N) F=RSSu/(NTkN)(RSSrRSSu)/[(NTk1)(NTkN)]F(N1,NTkN)

项目 含义
R S S r RSS_r RSSr 有约束模型的残差平方和(混合模型,有约束)
R S S u RSS_u RSSu 无约束模型的残差平方和(变截距模型)
k k k 解释变量个数

LR检验

原假设:混合回归模型
备择假设:其他模型

以个体固定效应模型为例: Y i t = u i + X i t ′ β + ε i t Y_{it}=u_i+X_{it}'\beta+ \varepsilon_{it} Yit=ui+Xitβ+εit

原假设: u 1 = u 2 = . . . = u N u_1=u_2=...=u_N u1=u2=...=uN (存在约束,截距不会变)
Y i t = u i + X i t ′ β + ε i t Y_{it}=u_i+X_{it}'\beta+ \varepsilon_{it} Yit=ui+Xitβ+εit
计算回归的最大似然函数值的对数 l n ( L r ) ln(L_r) ln(Lr)
备择假设: u 1 , u 2 , . . . , u N 不 全 相 等 u_1,u_2,...,u_N不全相等 u1u2...uN (无约束,截距会变)
Y i t = u i + X i t ′ β + ε i t Y_{it}=u_i+X_{it}'\beta+ \varepsilon_{it} Yit=ui+Xitβ+εit
计算回归的最大似然函数值的对数 l n ( L u ) ln(L_u) ln(Lu)

LR统计量构造:
L R = − 2 ( l n L r − l n L u ) 渐 近 服 从 χ 2 ( 约 束 条 件 的 个 数 : N − 1 ) LR=-2(lnL_r-lnL_u)渐近服从\chi^2(约束条件的个数: N-1) LR=2(lnLrlnLu)χ2(:N1)

豪斯曼检验(Hauseman’s test)

原假设:个体随机效应模型(个体效应与回归变量无关)
备择假设:个体固定效应模型(个体效应与回归变量有关)

检验的原理:
利用组内估计(within),无论是随机效应模型的参数估计值还是固定效应模型的参数估计值,估计参数值都是一致的
利用广义最小二乘法,对随机效应模型的参数估计值是一致的,对于随机效应模型的参数估计值是不一致的

真实模型 组内估计 β ^ w \hat\beta_w β^w 广义最小二乘法 β r e ~ \tilde{\beta_{re}} βre~
随 机 效 应 模 型 随机效应模型 一致估计量 非一致估计量
固 定 效 应 模 型 固定效应模型 一致估计量 一致估计量

检验逻辑图:

不拒绝原假设,意味着截距项不变动
拒绝原假设,意味着截距项变动
不拒绝原假设
拒绝原假设
F检验 or LR检验
使用混合回归
豪斯曼检验
选择个体随机效应模型
选择个体固定效应模型

变截距面板数据模型建模步骤

数据非平稳
数据平稳
数据平稳
不拒绝原假设,意味着截距项不变动
拒绝原假设,意味着截距项变动
不拒绝原假设
拒绝原假设
输入数据
描述性统计分析
面板单位根检验
面板协整分析
F检验 or LR检验
变系数检验
使用混合回归
豪斯曼检验
选择个体随机效应模型
选择个体固定效应模型

你可能感兴趣的:(stata数据处理)