R语言学习三 各种格式数据集的导入

R支持大多数的数据分析软件和数据库文件,自由无缝切换,哈哈哈
R语言学习三 各种格式数据集的导入_第1张图片
1、keyboard直接创建数据
#创建一个数据编辑器
> mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
#编辑数据
> mydata<-edit(mydata)
R语言学习三 各种格式数据集的导入_第2张图片

2、读取文本类文件
格式:mydataframe <- read.table( file, header=logical_value,
 sep=" delimiter", row.names=" name")
#读取.csv的表格
>grades <- read.table("studentgrades.csv", header=TRUE, sep=",",
row.names="STUDENTID")


3、导入excel表格
#安装所需程序包
>install.packages("RODBC")

#加载程序包
> library(RODBC)

#odbcConnect( dsn)打开Excel文件功能,其中dsn用于指定Excel文件路径
>channel <- odbcConnectExcel("myfile.xls")

#sqlFetch(channel, sqltable)指定读取Excel文件的某个sheet内的数据内容。参数channel是odbcConnectExcel函数的返回值,参数sqtable是Excel文件内的sheet名称
>mydataframe <- sqlFetch(channel, "mysheet")

#关闭文件
>odbcClose(channel)

4、导入excel表格(xlsx)
RODBC不支持xlsx,若有导入excel2007以上版本,需使用xlsx程序包。
> library(xlsx)
> workbook <- "c:/myworkbook.xlsx"
> mydataframe <- read.xlsx(workbook, 1)


5、导入XML代码
> library(XML)
> f = system.file("exampleData", "mtcars.xml", package="XML")
> xmlParseDoc(f)

 
................


6、直接读取网页

> myHttpheader <- c(

"User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ",

"Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",

......................

)

temp <- getURL("http://.....com/",httpheader=myHttpheader)




7、spss的文件
> install.packages("Hmisc")
> library(Hmisc)
> mydataframe <- spss.get("mydata.sav", use.value.labels=TRUE)


8、SAS的文件
sas可同样适用Hmisc包的read.ssd()和 sas.get()函数,当SAS的版本9.1或以上的话就不能使用,可以在SAS里将数据输出为csv格式:
proc export data=mydata
outfile="mydata.csv"
dbms=csv;
run;


然后导入R中:
> mydata <- read.table("mydata.csv", header=TRUE, sep=",")

9、Stata文件
> library(foreign)
> mydataframe <- read.dta("mydata.dta")

10、netCDF
> library(ncdf)
> nc <- nc_open("mynetCDFfile")
> myarray <- get.var.ncdf(nc, myvar)


11、数据库管理系统
> library(RODBC) 
> myconn <-odbcConnect("mydsn", uid="Rob", pwd="aardvark")
> crimedat <- sqlFetch(myconn, Crime) 
> pundat <- sqlQuery(myconn, "select * from Punishment")
> close(myconn)

#odbcConnect( dsn,uid="",pwd="") 打开数据库的链接
#sqlFetch( channel,sqltable)读取表格

#sqlQuery( channel,query)提交查询并返回结果
#sqlSave( channel,mydf, tablename =sqtable, append=FALSE)写入或者更新(append=TRUE)数据
#sqlDrop( channel,sqtable)删除表格









你可能感兴趣的:(R语言,r语言)