【stata】基础指令——学习教程全记录(01)

开一文记录和总结stata的学习,不断更新中~

拿到一个数据集,首先要全局了解一下这个数据集的情况:

【describe】查看这个数据集的简要介绍,包括了样本数量(obs:)、变量数量(vars:)、大小(size:)、以及每个标量的简要介绍。

【stata】基础指令——学习教程全记录(01)_第1张图片

【describe[varlist]】:可以单独选择某个变量查看,[]表示可选。

【describe,short】:只看整个数据集的总体概况,即截图显示的上半部分。

【count】:number of rows

【count if missing() 】:设置条件

【isid()】:check if an variable uniquely id entifies the data.检查变量是否唯一标识数据,相当于判断主属性。

【unique】先安装,指令【ssc install unique】

重复值数据量(所有数据量)和唯一值(不重复的数据)数据量。

 

【codebook】:适合初次接触一个数据集时查看一些信息

类型(numeric: )、标签(label)、范围(range)、单位(units)、特异值(unique)、缺失值(missing)、以及一些统计量。这样,我们对于该变量有一个初步的了解。

【stata】基础指令——学习教程全记录(01)_第2张图片

【codebook [varlist][if][in][,options]】

varlist:变量名单(>=1)

if:逻辑判断

in:第几个到第几个观测值    

eg: in 10/100 指第10到第100个观测

    in 10  第10个

    in 10/l    第10个到最后一个

    in f/10    第一个到第10个

options:一些自定义的选项

更多详情:【help codebook】

【stata】基础指令——学习教程全记录(01)_第3张图片

 

【summarize[varlist] [if] [weight] [,options]】:print summary statistics  (mean,stdev,min,max) for varible 变量的摘要统计信息(平均值、标准偏差、最小值、最大值)

注:【summarize】=【sum】=【summ】

与【codebook】的一些不同请参考help

 

 

 

你可能感兴趣的:(数据处理)