stata学习笔记(二):固定宽度型数据导入

一、何为固定宽度型数据

    有固定宽度的,某个或某几个数位上的数字表示某一类信息的数据。最简单明了的例子,你的身份证号。

    有rawtxt两种数据文件格式。

二、导入步骤

  1. 依据数据的特点编写.dct 文件,文件中需说明读入数据的路径和名称。
  2. 使用infile 命令读入.dct 文件,一般为:
.infile using dfilename[if][in][, options]  //dfilename 就是.dct 文件,需要带路径;

例子(dct文件和do-file文件):

1 dictionary using D:\Stata12.0\data.txt {//表明这是个.dct 文件,同时using 后面是表示对应读入的数据是D 盘Stata12.0目录下的data.txt 文件

2 _lines(2)  //每两行作为一条记录读入

3 _line(1)  //表明先从第1 行读起

4 _column(1)  //表明先从第1 列开始读

5 long idnumb %9f "Identification number"  //读入9 个宽度的长整型

6 str6 sex %6s "Sex"  //6 个宽度的字符型

7 int age %2f "Age"  //2 个宽度的整数型数据

8 _column(24)  //表明让光标直接跳到第24 列,这通常是因为中间有空格而采取的做法

9 float income %6f "Income"  //:双引号部分是对变量的补充说明,我们称之为“加标签”

10 _line(2)  //跳到数据文件第2 行开始读

11 str9 eval %9s "Evaluation"

12 }

13 //:.dct文件的最后一行需要空出来,否则会报错。数据文件的最后一行也要空出来
1 infile using score.dct, clear

2 list

 

stata学习笔记(二):固定宽度型数据导入

 

你可能感兴趣的:(学习笔记)