用 Stata 做实证论文的第一步,就是要把「食材」倒腾到锅内,也就是先要明白如何导入不同类型的原始数据。
️除了 Stata 专属数据格式 .dta
外,原始数据中最常见的文件格式是 Excel、CSV、TXT 三种,这个知识点很基础,却是必须要知道的!
知识点:import excel
、import delemited
、appendfile
、openall
- 导入 DAT 格式(Stata 数据文件的专属格式)
-
use
:后接本地路径或者网络 URL -
sysuse
:系统自带数据 -
webuse
:从 Stata 个官网中获取数据
-
- 导入 Excel 文件
-
import excel
- 例如:
import excel "filename.xlsx", clear sheet(sheetname) firstrow
-
firstrow
:第一行作为变量名
- 例如:
-
xls2dta
- 可批量导入 Excel 文件,不仅局限于
xls
格式,xlsx
格式同样支持 - 除了可合并多个 Excel 文件外,还给批量合并一个 Excel 里的不同 Sheet
- 可批量导入 Excel 文件,不仅局限于
-
- 导入 TXT/CSV 文件
-
import delemited
等价于insheet
- 例如:
import delimited using "filename", clear varnames(1) delimiter(tab) encoding(gb18030)
-
varnames(1)
:第一行作为变量名 -
delemiter()
:分隔符号,有 tab 分隔、或者空格、逗号等形式。 -
encoding()
:如果文件含有非英文字符,为使中文字符可以正常显示,需要选择正确的编码格式
- 例如:
-
csvconvert
支持批量导入 CSV 文件csvconvert "D:/file", replace input_file("a.csv" "b.csv" "c.csv") output_file("all.dta")
-
- 导入 SPSS 数据
usespss
-
importsav
:需要提前安装 R 语言
- 这几个命令不算是数据导入的 command,但是用好了却可以省下大忙
-
appendfile
:将一个文本文件追加到另一个文本文件尾部 -
openall
:一次性打开指定文件夹下的所有文件并纵向合并
-