复刻顶刊实证论文!思路梳理+全数据源+python代码

参考文献

标题:家庭背景、代际传递与教育不平等《中国工业经济》

复刻顶刊实证论文!思路梳理+全数据源+python代码_第1张图片

作者:邹薇 马占利

数据概况

数据来源:1989—2011年九次中国健康与营养调查(CHNS)家庭非平衡面板数据库

数据处理:

(1) 本文选择 18—65 岁成年人的样本,剔除 18—25 岁之间职业为学生或者没有工作的样本;

(2) 从 CHNS 数据中可以观测到个体教育的外在表现,本文按个体在调查年度所获得的最高教育程度分为四类:小学、初中、高中(包括中专)、大 学(包括大专及以上),分别赋值 1、2、3、4。

处理后数据共6360条

变量说明:

复刻顶刊实证论文!思路梳理+全数据源+python代码_第2张图片

数据及相关材料预览:

复刻顶刊实证论文!思路梳理+全数据源+python代码_第3张图片

复刻顶刊实证论文!思路梳理+全数据源+python代码_第4张图片

复刻顶刊实证论文!思路梳理+全数据源+python代码_第5张图片

复刻顶刊实证论文!思路梳理+全数据源+python代码_第6张图片

复刻顶刊实证论文!思路梳理+全数据源+python代码_第7张图片

实证分析及相关代码

1、 部分描述性统计代码

复刻顶刊实证论文!思路梳理+全数据源+python代码_第8张图片

复刻顶刊实证论文!思路梳理+全数据源+python代码_第9张图片

 2、 父母亲的教育程度对子代教育的影响有何差异?

(1)利用代际教育回归系数来测算父代和子代之间教育程度的变动状况(数据集1)

整体回归代码如下(分性别、城乡等代码略): 

复刻顶刊实证论文!思路梳理+全数据源+python代码_第10张图片

汇总结果如下:

复刻顶刊实证论文!思路梳理+全数据源+python代码_第11张图片

(2)考察教育代际传递的持久性(数据集2)

复刻顶刊实证论文!思路梳理+全数据源+python代码_第12张图片

汇总结果如下:

复刻顶刊实证论文!思路梳理+全数据源+python代码_第13张图片

(3)父母教育不同匹配模式下的代际教育回归系数(代码略)(数据集3)

复刻顶刊实证论文!思路梳理+全数据源+python代码_第14张图片

 3、个体教育决策的排序选择模型

复刻顶刊实证论文!思路梳理+全数据源+python代码_第15张图片

其中, 代表个体 的潜在最优教育程度,而为随机干扰项,估计方程中  代表父亲的教育程度, 代表母亲的教育程度,代表其他影响子代教育程度的个体特征和家庭背景等控制变量。

复刻顶刊实证论文!思路梳理+全数据源+python代码_第16张图片

主要回归模型代码如下:

复刻顶刊实证论文!思路梳理+全数据源+python代码_第17张图片

汇总结果如下:

复刻顶刊实证论文!思路梳理+全数据源+python代码_第18张图片

回归1可以看出父母各层次教育均影响为正且显著,并随着父母教育程度的增加,子代进一步接受教育的概率也加大。

回归2可以看出家庭收入和社会地位的影响为正,父亲职业越高,其对子代教育程度的影响越大;且随着收入的加入,父母教育程度对子代教育的影响有所减弱。

回归3可以看出改革开放后出生的群组相比于改革开放前出生子代,其教育程度上升的概率加大;兄弟姐妹对子代教育程度均有负向影响,且存在性别差异,当子代有兄弟时,子代受教育程度降低的概率比“子代有姐妹”的情形下更大。

回归4可以看出子代教育程度受城乡差异影响,相比农村,城市地区子代教育程度上升的概率更大。

回归4和回归5的对比可以看出,随着努力因素的加入,子代的性别影响变得不显著,这一定程度上说明通过努力,女性子代部分地改变了其教育上的性别劣势。

经典文章实证复现!思路梳理+全数据源+python代码

数据整理来源于公众号“数据皮皮侠”,可关注公众号查看完整版!

你可能感兴趣的:(python,大数据)