R的数据类型知多少:按对象类型来分是以下 6 种
- 向量(Vector):是R语言中的最基本类型,数据结构上看就是一个线性表,可以看成一个数组,在R中向量可以直接进行各类计算。
- 矩阵(Matrix):这种数据结构很类似于其它语言中的二维数组,但 R 提供了语言级的矩阵运算支持。
- 数组(Array):可以创建一维或多维数组。R 语言数组是一个同一类型的集合,前面我们学的矩阵 matrix 其实就是一个二维数组。下图可以理解向量、矩阵和数组的关系。
- 数据框(Data Frame):可以理解成我们常说的"表格",数据框每一列都有一个唯一的列名,长度都是相等的,同一列的数据类型需要一致,不同列的数据类型可以不一样。
- 列表(List):可以用来保存不同类型的数据,可以是数字、字符串、向量、另一个列表等,当然还可以包含矩阵和函数。
- 因子(Factor):用于存储不同类别的数据类型,例如人的性别有男和女两个类别等。
向量---今日重点数据类型
(1) 创建一个向量
x <- 3 #单元素向量,也成为标量
x <-c(1, 3, 5, 7) #多个元素向量
x <-1:10 #创建1~10之间的整数向量
x <-seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数
x <-rep(1:3, times=2) #创建1~3,并重复2次
(2) 如何选取向量中的元素
x[9] #取第9个元素
x[-9] #取第9个以外的其它元素
x[2:9] #取第2~9个元素
x[-(2:4)] #取第2~9个以外的其它元素
x[c(2,9)] #取第2和第9个元素
(3) 按照条件筛选出元素
x[x == 9] #筛选出x等于9的元素
x[x > 5] #筛选出x大于5的元素
x[x %in% c(1,2,5)] #存在于向量c(1,2,5)中的元素
数据框---今日重点数据类型
(1) 读取本都数据框
read.table(file="huahua.txt", sep= "\t", header = T) #file="huahua.txt"读取文件名为“huahua.txt”的文件,sep= "\t"该文件以制表符为分隔标准,header = T表示有表头。
a <- read.table(file="huahua.txt", sep= "\t", header = T) #将读入的数据赋值给a
(2) 设置列名和行名
X <-read.csv('doudou.txt') #读取本地数据
colnames(X) #查看列名
rownames(X) ##查看行名,默认值的行名就是行号,1.2.3.4...
colnames(X)[1]<-"bioplanet" #公司返回数据有可能左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1) #row.names=1的意思是修改第一列为行名
(2) 导出数据框
write.table(X,file = "yu.txt",sep = ",", quote=F)#分隔符改为逗号,quote=F表示字符串不加双引号
(3) 变量的保存与重新加载:针对没有处理完的数据
save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(X,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加载命令
(4) 提取数据框中的元素
X[x,y] #提取第x行第y列
X[x,] #提取第x行
X[,y]或X[y]或X$列名 #提取第y列
X[x:y] #提取第x列到第y列
X[c(x,y)] #提取第x列和第y列
(5) 如何优雅的引用数据框中的变量:
方案一、attach函数:
attach(DataFrame) #将数据框加载到环境中,每次引用数据框中的变量时只要直接输变量名就可以了
plot(bioplanet,bioinformation)
注意事项:
- 做完后将a删除出搜索环境 detach(a)
- 两个以上数据框的列名有冲突时,同时attach会报错。
方案二、with函数:
with(DataFrame,{
plot(bioplanet,bioinformation)
x<<-summary(bioinformation)
}) #求和并赋值给x,<<-的意思是作为全局变量,也就是出了大括号仍有效。注意括号要成对,另外对变量赋值的时候采用<<-符号,避免出了大括号变量失效
x #运行完后打印x
这句代码: save(X,file="test.RData")
,如果报错object X not found,是为什么,应该怎么解决?
R和Linux一样,是区分大小写的,加载的变量中没有“X”,而加载的变量是“x”,把代码改为save(x,file="test.RData")可以解决问题。