第2章:Stata入门

2.1-2.2 为什么使用stata、stata的窗口

Stata窗口.png

2.3 stata操作示例

2.3.1 导入数据

(1)导入excel数据:

  • 导入excel数据:打开“数据编辑器”→复制→粘贴→“第一行为变量名还是数据?”→选择

  • 在file下边导入数据:file→import→选择导入文件的类型

(2)保存stata格式数据

  • 直接选择“save图标”,保存文件格式为.dta

(3)打开stata数据集

  • 从“打开文档(ctrl+o)”命令打开

  • 命令 use E:\grilic_small.dta,clear

2.3.2 变量的标签

(1)点击“变量管理器”按钮,在编辑器那里自己定义,提醒自己变量的含义

(2)建议用小写标记变量名

2.3.3 审视数据

describe→简写 d

含义:这个命令对数据做简单描述,多少个变量、多少个样本,占了多大内存等等

list s linw→简写l

含义:这个命令的作用:罗列某个变量

备注:可能会出现more,这是结果在下一页的意思

set more off

含义:不用一直点more,直接显示所有罗列的内容

set more on

含义:回复分页显示

list s lnw in 11/15

含义:只罗列从11到15个s和lnw

list s lnw if s>=16

含义:运用逻辑语句

备注:其他逻辑符号,==(等于)=(赋值)~=(不等于)!=(不等于)

drop if s>=16

含义:删除数据(删除以后就不能撤回了哦~)

keep if s>=16

含义:保留部分数据

sort s

list

含义:就是把s按照从小到大来排序

gsort -s

List

含义:根据s的取值,从大到小降序排列

2.3.4 画图

histogram s, width(1) frequency

含义:①histogram表示直方图,缩写是hist②width表示宽度,如果不选的话,stata会自己根据数据特点进行判断③frequency表示将纵坐标定位频数,缩写freq,就是在这个区间的有几个人

help hist

含义:可以了解hist的语法

scatter lnw s

含义:做lnw与s的散点图,简写sc,这个图有缺陷,不知道哪个点对应哪个样本,所以可以打标签

gen n=_n

sc lnw s,mlabel(n)

含义:首先产生一个新变量,然后作带有标签的散点图

2.3.5 统计分析

summarize s

含义:简写是su,查看变量数量,均值,最大值,最小值等

备注:如果不指明哪个变量,就会显示所有变量的内容

tabulate s

含义:简写是ta,可以画出变量s的经验累积分布函数

pwcorr lnw s wxper,sig star(.05)

含义:pwcorr表示“pairwise correlation”,可以用来计算两两之间的相关性,sig表示要把显著相关系数的显著性水平(p值)列在相关系数下边,star(.05)表示要给显著性水平小于0.05的打上星星

2.3.6 生成新变量

g lns=log(s)

含义:定义教育年限的对数

g s2=s^2

含义:定义s的平方项

g exprs=s*expr

含义:定义教育年限s与经验expr的交互项

g w=exp(lnw)

含义:根据工资对数lnw计算工资水平w

g colleg=(s>=16)

含义:g可以用来定义虚拟变量,即s≥16的人是受过高等教育,colleg=1;否则,celleg=0

rename colleg college

含义:对变量colleg重新命名,且重新命名后,之前的colleg的数据无法保存

备注:重命名也可以使用变量管理器

drop college

g college=(s>=15)

含义:风险s≥16定义错了,现在是重新定义s≥15为college

replace college=(s>=15)

含义:和上一个命令可以实现一样的功能

drop s*

含义:可以同时去掉内存中的s1,s2,s3,且drop后无法恢复

s1-s5

含义:可以同时代表s1 s2 s3 s4 s5这五个变量

2.3.7 stata****的计算器的功能

display log(2)

含义:展示log(2)的数值

dis 2^0.5

含义:展示2开根号的结果

2.3.8 调用命令与终止命令

· 直接在命令窗口单击就可以重新在命令窗口出现;双击就会再次执行

· 中途要终止某个命令的执行,点击红底白色叉叉,或者“Ctrl+Break”

2.3.9 stata****的日志

命令太多了,就保存:

方法1:File→log→Begin,即保存log文档

方法2:点击日记本保存就好了

方法3:log using today(建立日志文件)/log off(暂时关闭日志文件)/log on(回复日志记录功能)/log close(彻底关闭日志文件)

2.4 Stata命令库的更新

update all

含义:更新所有的命令

ssc install newcommandplus

含义:newscommand是新命令的名称,这个命令是从ssc平台下载新命令

sysdir

含义:现实stata的ado\plus\personal等文件的路径系统

将下载的新命令文件复制到所指示的文件夹即可

search keyword

含义:keyword是你自己想要的东西,让stata去stata的公司自动搜索相关命令

findit keyword

含义:进一步的去搜索

2.5 进一步学习Stata的资源

图1.png

图2.png
  • 备注:要经常看help 菜单,以及常看Stata手册(每个命令都有自己的手册)

你可能感兴趣的:(第2章:Stata入门)