高级计量经济学 17:面板二值选择模型

高级计量经济学 17:面板二值选择模型


此文内容为《高级计量经济学及STATA应用》的笔记,陈强老师著,高等教育出版社出版。

我只将个人会用到的知识作了笔记,并对教材较难理解的部分做了进一步阐述。为了更易于理解,我还对教材上的一些部分(包括证明和正文)做了修改。

仅供学习参考,请勿转载,侵删!


目录

  • 17 非线性面板
    • 17.1 面板二值选择模型
    • 17.2 面板二值选择模型的 RE 估计
    • 17.3 面板二值选择模型的 FE 估计
    • 17.4 二值选择 FE 模型的估计方法:充分统计量


17.1 面板二值选择模型

对于面板数据,如果被解释变量为虚拟变量,则称为面板二值选择模型(binary choice model for panel data)。对于二值选择行为,通常可以通过一个潜变量(latent variable)来概括该行为的净收益(收益减去成本)。如果净收益大于0,则选择做;否则选择不做。假设净收益为:

其中,净收益 为不可观测的潜变量, 为个体效应(individual effects),而解释变量 不含常数项。个体的选择规则为:

给定 , , ,则有:
\begin{aligned} \mathrm{P}\left(y_{i t}=1 \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right) &=\mathrm{P}\left(y_{i t}^{*}>0 \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right) \nonumber \\ \nonumber &=\mathrm{P}\left(\boldsymbol{x}_{i i}^{\prime} \boldsymbol{\beta}+u_{i}+\varepsilon_{i t}>0 \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right) \\ \nonumber &=\mathrm{P}\left(\varepsilon_{i t}>-u_{i}-\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta} \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right) \\ \nonumber &=\mathrm{P}\left(\varepsilon_{i t}<u_{i}+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta} \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right) \\ \nonumber &=F\left(u_{i}+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right) \nonumber \end{aligned}
其中, 为误差项 的累积分布函数(cdf),并假设 的密度函数关于原点对称。如果 则为 Probit 模型:

如果 服从逻辑分布,则为 Logit 模型:
\mathrm{P}\left(y_{i t}=1 \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right)=\Lambda\left(u_{i}+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right)=\frac{\mathrm{e}^{u_{i}+x_{i j}^{\prime} \boldsymbol{\beta}}}{1+\mathrm{e}^{u_{i}+x_{i i}^{\prime} \boldsymbol{\beta}}}
面板二值选择模型主要估计方法包括:

  • 混合回归
  • 随机效应估计
  • 固定效应估计

在方程 中,如果 ,即没有个体效应,则为混合回归(pooled probit or pooled logit),可将此面板数据作为横截面数据处理(参考《高级计量16》),此时,只需要使用截面数据的相关 Stata 命令即可进行混合回归。然而,由于同一个体不同时期的扰动项可能存在自相关,故应使用以面板为聚类的聚类稳健标准误(cluster-robust standard error)。


17.2 面板二值选择模型的 RE 估计

更一般地,我们允许个体效应存在,即不同的个体拥有不同的 。如果 与所有解释变量 均不相关,则称为随机效应模型(Random Effect Model, RE, 见《高级计量16》);否则为固定效应模型(Fixed Effect Model, FE)。

首先考虑 RE 模型。对于线性面板的 RE 模型,一般使用广义最小二乘法(GLS)进行估计。但非线性面板不便使用GLS,故转而使用最大似然估计(MLE)。假设 ,记密度函数为 。以 Logit 模型为例,给定 ,则个体 的条件分布为(参考《高级计量14》):
f\left(y_{i 1}, y_{i 2}, \cdots, y_{i T} \mid \boldsymbol{x}_{i t}, \boldsymbol{\beta}, u_{i}\right)=\prod_{i=1}^{r}\left[\Lambda\left(u_{i}+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right)\right]^{y_{i}}\left[1-\Lambda\left(u_{i}+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right)\right]^{1-\gamma_{i}}
然而,上式的 不可观测,为此,记 的联合密度为 ,并进行如下分解:

在 的联合密度重,将 积分去掉,即可得到 的边缘密度:
\begin{aligned} f\left(y_{i 1}, y_{i 2}, \cdots, y_{i T}\right) &=\int_{-\infty}^{+\infty} f\left(y_{i 1}, y_{i 2}, \cdots, y_{i r}, u_{i}\right) \mathrm{d} u_{i} \\ &=\int_{-\infty}^{+\infty} f\left(y_{i 1}, y_{i 2}, \cdots, y_{i r} \mid u_{i}\right) \cdot g\left(u_{i}\right) \mathrm{d} u_{i} \\ &=\int_{-\infty}^{+\infty}\left\{\prod_{i=1}^{r}\left[\Lambda\left(u_{i}+\boldsymbol{x}_{i i}^{\prime} \boldsymbol{\beta}\right)\right]^{y_{i}}\left[1-\Lambda\left(u_{i}+\boldsymbol{x}_{i i}^{\prime} \boldsymbol{\beta}\right)\right]^{1-\gamma_{i}}\right\} \cdot g\left(u_{i}\right) \mathrm{d} u_{i} \end{aligned}
上面的积分没有解析解,可以通过数值求解的方法求解,这里就不再叙述了。

假设不同个体的观测值相互独立,则可以写出整个样本的似然函数。最大化此似然函数即得到 的RE Logit 估计量 。如果将上述方程的逻辑分布 改为正态分 ,那么就是 RE Probit 估计量。由于不同个体的观测值相互独立,故不同个体的扰动项也不相关,但由于 的存在,同一个体不同时期的扰动项之间仍存在相关:
\operatorname{Cov}\left(u_{i}+\varepsilon_{i t}, u_{i}+\varepsilon_{i s}\right)=\left\{\begin{array}{ll} \sigma_{u}^{2} & \text { 若 } t \neq s \\ \sigma_{u}^{2}+\sigma_{\varepsilon}^{2} & \text { 若 } t=s \end{array}\right.


\begin{split} \operatorname{Cov}\left(u_{i}+\varepsilon_{i t}, u_{i}+\varepsilon_{i s}\right) &= \operatorname{Cov}\left(u_{i}+\varepsilon_{i t}, u_{i}\right) + \operatorname{Cov}\left(u_{i}+\varepsilon_{i t}, \varepsilon_{i s}\right) \\ &= \operatorname{Cov}\left(u_{i}, u_{i}\right) + \underbrace{\operatorname{Cov}\left(\varepsilon_{i t}, u_{i}\right) }_{=0}+ \underbrace{\operatorname{Cov}\left(u_{i}, \varepsilon_{i s}\right)}_{=0} + \underbrace{\operatorname{Cov}\left(\varepsilon_{i t}, \varepsilon_{i s}\right)}_{取决于t=s}\\ & = \sigma_u^2 + \sigma_\varepsilon^2 \end{split}
即为所求

如果 ,那么自相关系数为:

如果 越大,就表示复合扰动项 中个体效应 的部分比较大,不能忽视个体效应;极端地,如果 ,就表示复合扰动项中 ,个体效应接近没有,故应该使用混合回归模型。


17.3 面板二值选择模型的 FE 估计

在面板二值选择模型中,如果个体效应 与解释变量 相关,那么就是 FE 模型,

其中, 可以是 或者 。此时,如果使用 RE 模型或混合回归则得不到一致估计。

  • 对于线性面板数据模型,参考《高级计量16》,一般采用组内估计量或者一阶差分来消去固定效应 ,然后就可以正确估计 。但对于非线性面板数据而言,这些变换一般不起作用,因为无法建立可观测的 与不可观测的 (即潜变量 的组内离差)之间的对应关系。

  • 就算使用虚拟变量法(LSDV法),对于二值选择的固定效应模型,也仍然得不到一致估计(除非 * ),这是因为,当 时,待估计的个体效应 的个数也随之增加。这些 被称为伴生参数(incidental parameters)。另一方面,每一个 只能由个体 的 个观测值来估计,而 并不增加。对于现实的数据, 通常很小,从而 且 有限时, 不会收敛。更重要的问题是,对 的不一致估计还会使得 的估计也不一致,这被称为伴生参数问题

在线性面板模型中,可以通过组内变换或差分变换解决伴生参数问题,但对于固定效应的面板 Probit 模型,目前尚无法解决此类伴生参数问题。


17.4 二值选择 FE 模型的估计方法:充分统计量

对于固定效应的面板 Logit 模型,可以通过寻找 的充分统计量(sufficient statistic),然后在给定此充分统计量的条件下进行条件最大似然估计(conditional MLE)。

充分统计量是统计学的一个概念。考虑总体参数 与统计量 。如果统计量 包含了样本中所有可以用来估计 的信息,则称 是参数 的充分统计量。

换言之,给定 以后,任何根据样本计算的其他统计量都不可能提供关于 的额外信息。

对于 Logit 模型,Chamberlain(1980)提出使用

作为 的充分统计量,并计算在给定 情况下的条件似然函数(根据充分统计量的性质,此似然函数不再依赖于 ),然后进行条件似然最大估计。然而,对于 Probit 模型,却找不到 的充分统计量。

以最简单的两期模型为例进行说明,即 。此时,对于个体 ,只有以下三种可能: 。下面分别考虑着三种情形:

(1)

,此时必然 ,从而 ,其对数似然函数为 ,故对整个样本的似然函数没有贡献。

直观来看,由于此条件似然函数的取值为常数,故此观测值不包含任何可以用于估计 的信息,因此,在进行条件似然估计时,是否包含这些观测值并不影响估计结果。

事实上,等于损失了这些样本的观测值。

(2)

,此时必然 ,从而 ,同理,这些观测值并不包含任何有助于估计 的信息,应该忽略

(3)

此时,或者 或者 ,分别计算其条件概率为:
\begin{array}{l} P\left(y_{i 1}=0, y_{i 2}=1 \mid n_{i}=1\right)=\frac{P\left(y_{i 1}=0, y_{i 2}=1\right)}{P\left(y_{i 1}=0, y_{i 2}=1\right)+P\left(y_{i 1}=1, y_{i 2}=0\right)} \quad (17.12)\nonumber \\ P\left(y_{i 1}=1, y_{i 2}=0 \mid n_{i}=1\right)=\frac{P\left(y_{i 1}=1, y_{i 2}=0\right)}{P\left(y_{i 1}=0, y_{i 2}=1\right)+P\left(y_{i 1}=1, y_{i 2}=0\right)} \quad (17.13)\nonumber \end{array}
假设给定 和 的条件下, 和 相互独立,则:
\begin{array}{l} P\left(y_{i 1}=0, y_{i 2}=1\right)=\frac{1}{1+e^{u_{i}+x_{i 1}^{\prime}\boldsymbol\beta}} \cdot \frac{e^{u_{i}+x_{i 2}^{\prime} \boldsymbol\beta}}{1+e^{u_{i}+x_{i 2}^{\prime}\boldsymbol\beta}} \quad (17.14)\nonumber\\ P\left(y_{i 1}=1, y_{i 2}=0\right)=\frac{e^{u_{i}+x_{i 1}^{\prime} \boldsymbol\beta}}{1+e^{u_{i}+x_{i 1}^{\prime} \boldsymbol\beta}} \cdot \frac{1}{1+e^{u_{i}+x_{i2}^{\prime}\boldsymbol\beta}}\quad (17.15)\nonumber \end{array}
将表达式 和 代入 中,可得:
\begin{aligned} \mathrm{P}\left(y_{i 1}=0, y_{i 2}=1 \mid n_{i}=1\right) &=\frac{\mathrm{e}^{u_{i}+x_{i} \beta}}{\mathrm{e}^{u_{i}+x_{i 1} \beta}+\mathrm{e}^{u_i+x_{i} \beta}} \nonumber \\ &=\frac{\mathrm{e}^{x_{i2}^\prime \beta}}{\mathrm{e}^{x_{i 1} ^\prime\beta}+\mathrm{e}^{x_{i2}^\prime \beta}}=\frac{\mathrm{e}^{\left(x_{i2}-x_{i 1}\right)^\prime \cdot \beta}}{1+\mathrm{e}^{\left(x_{i 2}-x_{i 1}\right)^{\prime} \beta}}=\Lambda\left[\left(x_{i 2}-x_{i 1}\right)^{\prime} \beta\right] \quad (17.16) \nonumber \end{aligned}
注意到, 在分子分母都有 项,于是被消除了。同理,将 和 代入 可得:
\mathrm{P}\left(y_{i 1}=1, y_{i 2}=0 \mid n_{i}=1\right)=\Lambda\left[-\left(\boldsymbol{x}_{i 2}-\boldsymbol{x}_{i 1}\right)^{\prime} \boldsymbol{\beta}\right]=1-\Lambda\left[\left(\boldsymbol{x}_{i 2}-\boldsymbol{x}_{i 1}\right)^{\prime} \boldsymbol{\beta}\right] \quad (17.17)
如果定义虚拟变量:如果 则 否则 ,那么就可以把 和 写在一起,并将个体 的条件对数似然函数写为:
\ln L_{i}(\boldsymbol{\beta})=\left\{d_{i} \ln \Lambda\left[\left(\boldsymbol{x}_{i2}-\boldsymbol{x}_{i 1}\right)^{\prime} \boldsymbol{\beta}\right]+\left(1-d_{i}\right) \ln \{ 1-\Lambda\left[\left(\boldsymbol{x}_{i 2}-\boldsymbol{x}_{i 1}\right)^{\prime} \boldsymbol{\beta}\right\}\right\} \cdot \boldsymbol 1\left(n_{i}=1\right) \quad (17.18)
其中 为示性函数,表示仅考虑 的观测值。上式对 加总,即可得到整个样本条件对数似然函数。

从 我们发现:

  • 给定 的条件似然函数不再依赖于

  • 此条件似然函数仍为 Logit 模型,只是解释变量变为

  • 不随时间变化的变量将无法识别其系数,因为其

  • 固定效应似然函数并不包含积分,不需要进行积分计算

更一般地,对于 ,可以计算给定 或 的条件似然函数。固定效应模型的缺点是,将损失所有 或 的观测值,导致样本容量减少;并且由于 消去了,也无法估计个体效应 ,也无法预测 发生的概率或解释变量对 的边际效应。解决的方法是假设

你可能感兴趣的:(高级计量经济学 17:面板二值选择模型)