stata F值缺失_stata面板数据回归操作之GMM

新手面板数据回归之GMM 的 stata 操作步骤

广义矩估计( Generalized Method of Moments 即 GMM )

原理就是回归!就是一种高级点的回归!

我也是新手,也有很多不太懂的地方。断断续续学习了两个月,看了很多文献和公众号拼凑整理的,放到这里就是大家可以一起修正和补充。

数据情况:

样本:31个省份的面板数据

年份:2009-2016年 八年数据

因变量Y

自变量:八个X

一、数据整理、导入和保存

第一步:整理数据:

以X1 CPI为例 最好数据原始整理的时候,就注意形式,整理成这样

stata F值缺失_stata面板数据回归操作之GMM_第1张图片

首先,stata不识别字符,所以建议把省份换成1-31。以免后续麻烦。也可以后续将字符修改为数值型,语法:egen pro=group(var1)//将var1变量转化为新的非字符串变量,并命名为pro。

(缺失数据:多重插补用的较多,这需要你根据自身情况去学习,学问多多。我是按照Landerman 等( 1997) 建议当缺失比例小于2%时, 用均数替代; 当缺失比例在2%—5%之间时, 用最大似然估计替代; 而当缺失比利大于5%时, 用多项回归替代(multiple imputation)。(Landerman, L .R . Land, K .C ., and Pieper , C .F . ( 1997) . An Empirical Evaluation of the Predictive Mean Matching Method for Imputing Missing Values . Sociological Methods and Research, 26( 1) : 3—33 .))

再从数据的第三行即具体数据开始,开始复制粘贴到stata的数据编辑器中,如右下图。

(ps:如果把第二行也纳入,stata会默认地区也是一个样本,后面2009-2016是数据,观测值变为32,年份9,错误如左下图,不要地区省份和具体年份!)

stata F值缺失_stata面板数据回归操作之GMM_第2张图片

stata F值缺失_stata面板数据回归操作之GMM_第3张图片

第二步:调整数据

开始在stata里面输入命令

第一:将第一列中的样本var1重命名

语法:rename var1 样本名

本例:rename var1 province

然后你就会看到var1变成province

第二:转换为数据,继续识别时间变量

语法:reshape long var,i(样本名)

本例:reshape long var,i(province)

stata F值缺失_stata面板数据回归操作之GMM_第4张图片

其他的var就会变成年份顺序

Stata语法界面可以看到:一共31个样本,248个观测值。J variable 有8个值。

第三:重命名 语法: rename _j year ;rename var 变量名称

本例就是: rename _j year ;rename var CPI

就得到下图:其中province 1-31个省份。2-9就是2009-2016年,八年

stata F值缺失_stata面板数据回归操作之GMM_第5张图片

为防止数据不符合排序问题,我们可以再来个排序:sort 样本名称 时间

本例:sort province year 一般是没有问题的。

最后保存一下,方便后续导入使用。

注:其他变量也全部都这样导入,导入前先clear一下。stata也可以直接打开Excel,前提你的格式记得修改好。如果变量较多,一定记得保存到一个文件夹,后续导入需要一直使用这个文件路径。

第三步:合并数据

从因变量Y开始。其他变量也是要一个个导入合并。看起来一个个来很麻烦,操作熟练了,几分钟的事情,所以不要担心。

打开因变量Y的数据库。先合并CPI。

语法:merge 1:1 province year u

你可能感兴趣的:(stata,F值缺失,stata,将数据集变量名称导出,stata行业变量怎么赋值)