stata面板数据回归

使用工具:Stata,该工具是一个回归工具

数据:面板数据

回归函数:

面板数据展示:

回归过程

将数据导入stata:会在变量窗口看到刚刚导入的四种数据

stata面板数据回归_第1张图片

根据我们的公式,需要lnrank和lnsize

所以进行计算:得到新的两个变量

gen ln_size = log(城市区域人口)
gen ln_rank = log(rank)

stata面板数据回归_第2张图片

由于需要进行面板数据回归,所以先需要设置面板数据结构:

xtset city_name 年份

由于xtset 命令用于指定面板数据结构时,需要将个体标识符(如城市名称)设置为数值变量。city_name是城市名称,是字符串,所以这个命令是会报错的,所以,就为city_name对应生成一个唯一的city_id,就可以解决:

encode city_name, gen(city_id)

所以最后看到的变量窗口会是这样的:stata面板数据回归_第3张图片

回归结果

接下来就可以进行面板数据回归了,面板数据回归分两种:1.固定效应模型 2.随机效应模型

固定效应模型:固定效应模型认为,每个个体(如城市)都有其独特的属性,这些属性可能会影响因变量,并且这些属性在个体间是不同的。FE模型会为每个个体估计一个唯一的截距,从而控制了这些不随时间变化的个体特定因素。这意味着FE模型只在每个个体内部进行比较,剔除了所有个体间的比较。

适用情况:如果个体特有的不变特征可能与解释变量相关,并且这些特征对因变量有影响,应该使用固定效应模型。

回归命令:

xtreg ln_rank ln_size, fe

随机效应模型:随机效应模型假设个体特有的不变特征与其他变量不相关,并且是随机分布的。这些随机效应被包含在误差项中。RE模型通过假设个体特定效应和解释变量之间没有相关性来考虑个体效应。

适用情况:如果个体特有的不变特征被认为与其他变量无关,或者这些特征对研究的重要性较小,可以选择随机效应模型。

回归命令:

xtreg ln_rank ln_size, re

补充说明:reg默认是最小二乘回归

你可能感兴趣的:(科学软件专栏,回归,数据挖掘,人工智能)