2018-03-22

如何认识数据

S1:打开数据

首先,打开stata,你会看到这样的一个界面。


2018-03-22_第1张图片
Stata操作界面

面对全英文的界面,需要知道每一块位置代表着什么,方便以后的操作。

中下"Command"(命令窗口):你可以在此窗口输入想要执行的stata命令。
左上"Review"(历史窗口):自动记录stata自启动以来执行过的所有命令。
中上"Results"(结果窗口):显示执行stata命令以后的输出结果。
右上"Variables"(变量窗口):显示stata当前数据的所有变量。
右下"Properties"(性质窗口):显示当前数据文件与变量的性质。

2018-03-22_第2张图片
Stata操作界面图示

知道命令该如何输入以后,那么问题来了,数据怎么导入Stata呢?其实也很简单。

Method1:只需要你找的需要打开的数据文件,右键打开方式选择Stata即可。(前提是你已经正确安装好了Stata哈)

当然还有别的教科书般的做法,但是我认为直接找到数据再打开的方式是最简单的。这里也顺便介绍一下。

Method2:打开Stata软件以后,点击Data Editor图标(看上去是一个表格上面有只笔,排在所有图标的倒数第五个),然后用Excel打开目标表格,将所有数据复制,然后粘贴到刚刚打开的Data Editor中。此时Stata会询问“第一行是数据还是变量名”,根据实际情况选择即可。
Method3:点击菜单"File"---"Import",然后导入各种格式的数据。

好的,我就按照上面的Method1打开了一个数据。

S2:描述数据

stata提供了一系列命令帮助我们快速简单了解数据,最主要的有describe, list,summarize,tabulate等,下面介绍它们的使用方法。

describe:显示数据的变量名单和标签等信息。可简写为des或者d

代码:

des
2018-03-22_第3张图片
hhh

list:列出目标变量的具体数据

代码:

list lnw s in 1/10

解释:lnw和s是我打开的数据中的两个变量,in 1/10表示显示1值10行的lnw和s的值。


2018-03-22_第4张图片
image.png

summarize和tabulate的使用方法也是一样,按照stata语言规定的格式输入即可,此处不再赘述。
不会的可以输入以下命令行,查看标准手册进行使用。

help summarize

手册是自学的最好老师,一定要合理运用。
通过S1和S2就可以对Stata和数据有初步的了解了,想要更加深入了解数据,作图是很好的选择。

S3:绘制图像

通过理论分析,往往可以知道数据的因变量是谁,自变量可能比较复杂,为了大致知道自变量和因变量是否存在相关关系,就需要用到作图法了。

输入命令:

scatter lnw s

scatter代表散点图,适用于观察两个变量之间是否存在相关关系。
还有很多图会经常用到,具体可以输入命令help twoway(双向图)查询到。这里也简单罗列了一些:

  • scatter ——scatterplot
  • line —— line plot
  • connected ——connected-line plot
  • scatteri —— scatter with immediate arguments
  • area ——line plot with shading
  • bar —— bar plot
  • spike ——spike plot
  • dropline —— dropline plot
  • dot —— dot plot
    学习到这里,相信你已经对Stata有了初步的掌握,如果有任何问题欢迎留言一起探讨。

你可能感兴趣的:(2018-03-22)