R语言readr包的使用

R语言readr包的使用


  1. readr包中的读写函数比正常R语言数据的读写快了很多倍
  2. 主要的包有两个,一个数readr包,一个是readxl 包
  • readr包中的主要的函数有:read_csv,read_delim,read_table,write_delim,write_csv,write_excel_csv,write_delim函数,其中read_table中分隔符是指定为固定空格的,不能修改分隔符,函数read_delim可以指定分隔符
  • readxl包中有两个函数,一个是read_excel,可以用来读取excel的xls和xlsx文件,另外一个是excel_sheets可以查看excel文件中的表的名字
  1. 例子
# readxl包读excel文件挺快,但是不能直接写入xlsx文件中,此时可以使用xlsx包
#(此包需要java支持)

x <- read_excel("x.xlsx",sheet=2);
write_excel_csv(x,path = "x1.csv",append=T)


#用read_delim函数读写179M文件
system.time(x <- read_delim("数据样本.txt",delim="|",col_names = c("type","userid","region","city","action"),append=T))

#耗时大概5秒,delim参数为指定的分隔符,相当于sep函数,append参数设置文件

你可能感兴趣的:(R语言readr包的使用)