实证论文|数据处理问题合集

目录

1stata 如何留下至少有连续5年的观测?

 2stata如何剔除13年及以后公司样本 python

3stata如何根据文本数据生成新数据



发现在处理数据时会遇到很多各种各样无法明确表达的需求,整理出来以供参考:

1stata 如何留下至少有连续5年的观测?

解决方法:

tsset stkcd year
xtpattern, gen(pp)                 // 记录每家公司的样本形态
gen p5 = strpos(pp, "11111")
drop if p5 == 0                 // 仅保留连续五年有资料的公司
tsset, clear

 2stata如何剔除13年及以后公司样本 python

实证论文|数据处理问题合集_第1张图片

3stata如何根据文本数据生成新数据

参考stata中如何将字符型变量分类生成数值型新分类变量 - Stata专版 - 经管之家(原人大经济论坛)

 stata 如何处理文本信息进行赋值?

可以用 strmatch

假如医疗机构的名称的变量是name,新变量叫new

gen new = .

replace new = 1 if strmatch(name, "*医院*")

replace new = 2 if strmatch(name, "*疾控*")

也可以直接使用

gen pol=.
replace pol = 2013 if 所属省份=="重庆市"

 如果表示属于北京省或安徽省

replace pol = 2014 if 所属省份=="北京市" | 所属省份=="安徽省"

|表示或

如果表示属于广东省但并不属于深圳市

replace pol = 2015 if 所属省份=="广东省" & var23 !="深圳市"

你可能感兴趣的:(问题解决集合,人工智能,python,开发语言)