R语言自学笔记-----几种导入外部数据与保存数据的方法

R是一个数据分析的软件,外部数据进行数据分析的第一步就是将外部数据读入到R的数据对象之中,如果数据事先存放在文本文件中,我们可以将数据读入到R的向量或者数据框中,通常都是读入到数据框之中。

一、导入外部数据

1、read.table( )函数

read.table( )函数可以用于将纯文本数据读入到指定的数据框中,文件格式一般为csv,txt或者压缩包格式等等

最基本的书写格式为:read.table(file='文件名',header=TRUE/FALSE,sep='数据分隔符')

file参数表述读入的文件,如若文件不在R的当前工作目录之下,我们需要调用setwd( )函数来改变R的工作路径或通过文件的绝对路径来读取。

header参数表示是否将文本文件的第一行作为标题行

sep参数用于指定读入数据各列间的分隔符,省略时默认为空格、制表符、换行符或回车符

当然,我们也可以通过添加其它的参数来规范我们所读入的数据,例如:

stringsAsFactors=TRUE/FALSE,可以设置R是否自动将读入数据转换为因子,默认自动转换

skip=n,表示R读取数据时跳过数据的前n行的读取

nrows=n,表示R读取数据时可以读取n行数据

na.strings='NA'参数可以用来将读入数据中的缺失值转换为R可以识别的NA

这里列出了使用较多的一些参数,但并不齐全,更多的参数可以自行查阅R的帮助文档

#读入R工作目录下的车险数据.txt的文件并命名为x
x <- read.table('f:/RRR/车险数据.txt')
x <- read.table('车险数据.txt')
#在x的基础上将数据第一行作为标题行,并使R不自动将数据转换为因子
y <- read.table('车险数据.txt',header=T,stringsAsFactors=F)
#在y的基础上只读入前11行到110行的数据,并将缺失值转换为可识别的NA
z <- read.table('车险据.txt',header=T,stringsAsFactors=F,skip=10,nrows=100,na.strings='NA')

2、scan( )函数

基本书写格式为:scan('文件名',skip=n,what=存储类型)

实际运用中,scan函数要求被读入的各列数据有相同的存储类型,若不满足这个要求的数据则不能使用scan( )函数读入

#将车险数据文件从第二行开始读入,并强制转换为双精度类型
scan('车险数据.txt',skip=1,what=double()) 

3、excel文件的读取

我们可以通过将excel文件中的数据复制粘贴到一个csv或txt文件中,也可以通过调用readxl包中的函数read_excel( )来对excel文件进行读取

最基本的书写格式:read_excel('文件名',sheet=n,skip=n)

这里提一下read_excel( )函数中的几个参数的用法

skip=n:跳过工作表的前n行数据

sheet =n: 读取第n个工作表

n_max=n:读取多少行的数据

col_names=TRUE/FALSE:为真时表示将第一行数据作为标题行

read_excel('车险数据.xlsx',sheet=1)     #读取车险数据的第一个工作表
read_excel('车险数据.xlsx',sheet=1,skip=2,n_max=10,col_names=TRUE)
#读取车险数据文件的第一个工作表数据,跳过两行后的第一行数据作为标题行后读取十行数据

二、文件的保存

保存数据到文本文件中的函数是write.table( )函数,基本书写格式为:

write.table(数据对象名,'文本文件名',sep='分隔符',

quote=TRUE/FALSE,append=TRUE/FALSE,na='NA',row.names=TRUE/FALSE,col.names=TRUE/FALSE)

其中,row.names和col.names为真时表示将行编号和域名写入文本文件,quote为真时表示将文本文件中第一行的变量名即字符串型数据用双引号括起来,append为真时表示将数据最佳到文本文件的尾部,为假时表示全部覆盖。

write.table(y,'数据.csv',sep=',',append=TRUE,na='NA',row.namse=TRUE,col.names=TRUE)
#将前述所建立的车险数据数据框y写入名为数据.csv的文本文件中

你可能感兴趣的:(R,r语言,开发语言)