《R语言实战》自学笔记9-数据输入

2.3 数据输入

R可从键盘、文本文件、Microsoft Excel和Access、流行的统计软件、特殊格式的文件,以及多种关系型数据库中导入数据。

image.png

2.3.1 使用键盘输入

函数edit()会自动调用一个允许手动输入数据的文本编辑器。
示例:
1、创建一个空的数据框。
f <- data.frame(ID = character(0), pattern = character(0), values = numeric(0))
2、通过调用edit()手动录入数据。编辑的对象需要赋值回对象,若不赋值,所有编辑将不会保存。
f <- edit(f)

image.png

fix()函数用于直接编辑数据对象。
fix(a)
这里直接调出了数据a,可以在调出的数据界面进行数据修改。

image.png

2.3.2 从带分隔符的文本文件导入数据

函数:read.table(file, header = FALSE, sep = "",stringsAsFactors,colClasses = NA)
read.table()函数内参数达十几个,以上为常用参数,其中,File是带分隔符的ASCII文本文件;header表示文件是否在第一行包含了变量的逻辑型变量,简单理解就是是否有表头,TRUE为有表头,FALSE为无表头;sep用来指定分割数据的分隔符;stringsAsFactors可以设置字符变量与因子之间的转换。colClasses为每一列指定一个类型,也可以设置字符型变量和因子之间的转换。1

mydata <- read.table(file = "D:/Documents/R wd/mydata.csv", header = T, sep = ",", colClasses = c(year = "character", nitrogen = "character", pattern = "character", replicates = "character")) # 读入mydata.csv文件,有表头,分隔符为",",将数据框mydata中year,nitrogen,pattern和replicates列类型指定为字符型。注意mydata.csv若放置于工作目录下,可直接输入文件名,若不是,则要指定工作目录。

数据太长,这里不便展示了。

2.3.3 导入Excel数据

读取一个Excel文件的最好方式,就是在Excel中将其导出为一个逗号分隔文件(csv,txt),再将其导入R中。
xlsx包可以用来读取这种格式的电子表格。其最简单的调用格式是read.xlsx(file, n),其中file是Excel2007工作簿的所在路径,n则为要导入的工作表序号。

library(readxl) # 调用readxl包。
mydata1 <- read_excel("D:/Documents/R wd/mydata.xlsx", sheet=1) # 导入excel数据mydata.xlsx,数据表1的数据。赋值给mydata1。
mydata1 # 显示数据。
1.png

2.3.4 导入XML数据

对使用R存取XML文档感兴趣的读者可以参阅www.omegahat.org/RSXML,从中可以找到若干份优秀的软件包文档。

2.3.5 从网页爬取数据

请参考可在网站Programming with R(www.programmingr.com)上找到的"Webscraping using readLines and RCurl"一文。

2.3.6 导入SPSS数据

SPSS数据集可以通过foreign包中的函数read.spss()导入到R中,也可以使用Hmisc包中的spss.get()函数。

2.3.7 导入SAS数据

R中设计了若干用来导入SAS数据集的函数,包括foreign包中的read.ssd()和Hmisc包中的sas.get()
你可以在SAS中使用PROC EXPORT将SAS数据集保存为一个逗号分隔的文本文件,再导入R。

2.3.8 导入Stata数据

read.dta("要导入的文件.dat")

2.3.9 导入netCDF数据

2.3.10 导入HDF5数据

2.3.11 访问数据库管理系统

2.3.12 通过Stat/Transfer导入数据

2.4 数据集标注

2.4.1 变量标签

2.4.2 值标签

2.5 处理数据对象的实用函数

image.png

参考文献
R语言_read.table()函数用法,https://www.jianshu.com/p/90e1d430c9ef

你可能感兴趣的:(《R语言实战》自学笔记9-数据输入)