R语言 导入其他统计软件文件

使用R中的foreign包可以较方便地读取其他统计软件的数据文件,比如SPSS、SAS等数据文件等

函数 描述
read.arff 从ARFF文件中读取文件,著名的数据挖掘开源软件weka的数据就是这种格式
read.dbf 读取DBF文件,DBF文件就是数据库文件
read.dta 读取Stata中的数据集
read.epiinfo 读取Epi Info的数据集
read.mtp 读取Minitab中的数据集
read.octave 读取Octave的文本数据
read.spss 读取SPSS的数据文件
read.ssd 读取SAS的永久数据集
read.systat 读取systat格式的数据

导入其他统计软件文件-foreign包

foreign包中常用读取其他格式文件的函数

统计软件 读取数据的函数格式
SPSS read.spss(file,to.data.frame=TRUE
SAS read.ssd(libname,sectionnames,tmpXport=tempfile(),tmpProgLoc=tempfile(),sascmd=“sas”)
Minitab read.mtp(file)
STATA read.dta(file,convert.dates=TRUE,convert.factors=TRUE,missing.type=FALSE,convert.underscore=FALSE,warm.missing,labels=TRUE
SYSTAT read.systat(file,to.data.frame=TRUE)

导入SPSS软件文件

通过foreign包中的read.spss()函数导入到R中

使用Hmisc包中的spss.get()函数导入

R语言 导入其他统计软件文件_第1张图片

程序示例:

install.packages("Hmisc")
library(Hmisc)
test<-spss.get("test.sav",use.value.labels = TRUE) #use.value.labels=TRUE表示让函数将带有值标签的变量导入为R中水平对应相同的因子
View(test)

导入SAS软件文件

通过foreign包中的read.ssd()函数导入到R中

  • R对于SAS的较新版本支持的不好
  • 解决办法:在SAS中使用PROC EXPORT将SAS数据集保存为一个逗号分隔的文本文件,然后将导出的文件读取到R中

R语言 导入其他统计软件文件_第2张图片

SAS程序:

proc export data=mydata
outfile="mydata.csv"
dbms=csv
run;

R语言:

mydata<-read.table("mydata.csv",header=TRUE,sep=",")

你可能感兴趣的:(数据挖掘,csv,大数据,r语言,数据分析)