Stata导入数据,批量贴标签

导入数据

一般从数据库下载常用的格式为csv或txt

导入csv文件

cd 文件路径
clear
insheet using 文件名.csv

导入txt文件

首先需要打开txt文件,改变文字编码格式为utf-8并保存。

cd 文件路径
clear 
insheet using 文件名.txt

批量贴标签

以国泰安下载的资产负债表数据为例,从变量说明文件中复制中英文对照名称到Excel中。
Stata导入数据,批量贴标签_第1张图片
选中A列,点击菜单栏,数据→分列→下一步→勾选其他方框,设置分隔符号为“ ] ”→下一步→完成;
再选择A列,点击菜单栏,数据→分列→下一步→勾选其他方框,设置分隔符号为“ [ ”→下一步→完成;
Stata导入数据,批量贴标签_第2张图片
通过Excel基本运算,生成Stata代码;
Stata导入数据,批量贴标签_第3张图片
其实也可以通过Stata代码完成上述过程

cd 路径
clear
////导入变量说明txt文件
insheet using describe.txt
///使用空格作为标识符进行分割
split v1,p(" ")  
keep v11 v12
g l="label"
g v="var"
g name=substr(v12,2,length(v12)-2)
order l v v11 name
///标签名的引号最好加上

Stata导入数据,批量贴标签_第4张图片

label	var	stkcd 	"证券代码"
label	var	accper 	"会计期间"
label	var	typrep 	"报表类型"
label	var	a001101000 	"货币资金"
label	var	a0d1101101 	"其中:客户资金存款"
label	var	a0d1102000 	"结算备付金"
label	var	a0d1102101 	"其中:客户备付金"
label	var	a0b1103000 	"现金及存放中央银行款项"
label	var	a0b1104000 	"存放同业款项"
label	var	a0b1105000 	"贵金属"
label	var	a0f1106000 	"拆出资金净额"
label	var	a001107000 	"交易性金融资产"
label	var	a0f1108000 	"衍生金融资产"
label	var	a001109000 	"短期投资净额"
label	var	a001110000 	"应收票据净额"
label	var	a001111000 	"应收账款净额"
label	var	a001112000 	"预付款项净额"
label	var	a0i1113000 	"应收保费净额"
label	var	a0i1114000 	"应收分保账款净额"
label	var	a0i1115000 	"应收代位追偿款净额"
label	var	a0i1116000 	"应收分保合同准备金净额"
label	var	a0i1116101 	"其中:应收分保未到期责任准备金净额"

你可能感兴趣的:(Stata,Stata贴标签)