2021-05-25-Day5-R的两个重要数据结构-zhw

R的数据类型知多少:按对象类型来分是以下 6 种

  1. 向量(Vector):是R语言中的最基本类型,数据结构上看就是一个线性表,可以看成一个数组,在R中向量可以直接进行各类计算。
  2. 矩阵(Matrix):这种数据结构很类似于其它语言中的二维数组,但 R 提供了语言级的矩阵运算支持。
  3. 数组(Array):可以创建一维或多维数组。R 语言数组是一个同一类型的集合,前面我们学的矩阵 matrix 其实就是一个二维数组。下图可以理解向量、矩阵和数组的关系。
    2039-08-06Done.png, 图片源自菜鸟教程
  4. 数据框(Data Frame):可以理解成我们常说的"表格",数据框每一列都有一个唯一的列名,长度都是相等的,同一列的数据类型需要一致,不同列的数据类型可以不一样。
  5. 列表(List):可以用来保存不同类型的数据,可以是数字、字符串、向量、另一个列表等,当然还可以包含矩阵和函数。
  6. 因子(Factor):用于存储不同类别的数据类型,例如人的性别有男和女两个类别等。

向量---今日重点数据类型

(1) 创建一个向量

x <- 3  #单元素向量,也成为标量
x <-c(1, 3, 5, 7) #多个元素向量
x <-1:10 #创建1~10之间的整数向量
x <-seq(1,10,by = 0.5)  #1-10之间每隔0.5取一个数
x <-rep(1:3, times=2) #创建1~3,并重复2次

(2) 如何选取向量中的元素

x[9]  #取第9个元素
x[-9] #取第9个以外的其它元素
x[2:9] #取第2~9个元素
x[-(2:4)] #取第2~9个以外的其它元素
x[c(2,9)] #取第2和第9个元素

(3) 按照条件筛选出元素

x[x == 9] #筛选出x等于9的元素
x[x > 5] #筛选出x大于5的元素
x[x %in% c(1,2,5)] #存在于向量c(1,2,5)中的元素

数据框---今日重点数据类型

(1) 读取本都数据框

read.table(file="huahua.txt", sep= "\t", header = T) #file="huahua.txt"读取文件名为“huahua.txt”的文件,sep= "\t"该文件以制表符为分隔标准,header = T表示有表头。
a <- read.table(file="huahua.txt", sep= "\t", header = T) #将读入的数据赋值给a

(2) 设置列名和行名

X <-read.csv('doudou.txt') #读取本地数据
colnames(X) #查看列名
rownames(X) ##查看行名,默认值的行名就是行号,1.2.3.4...
colnames(X)[1]<-"bioplanet" #公司返回数据有可能左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1) #row.names=1的意思是修改第一列为行名

(2) 导出数据框

write.table(X,file = "yu.txt",sep = ",", quote=F)#分隔符改为逗号,quote=F表示字符串不加双引号

(3) 变量的保存与重新加载:针对没有处理完的数据

save.image(file="bioinfoplanet.RData")  #保存当前所有变量
save(X,file="test.RData")  #保存其中一个变量
load("test.RData")  #再次使用RData时的加载命令

(4) 提取数据框中的元素

X[x,y] #提取第x行第y列
X[x,]  #提取第x行
X[,y]或X[y]或X$列名  #提取第y列
X[x:y]  #提取第x列到第y列
X[c(x,y)]  #提取第x列和第y列

(5) 如何优雅的引用数据框中的变量:

方案一、attach函数:

attach(DataFrame)  #将数据框加载到环境中,每次引用数据框中的变量时只要直接输变量名就可以了
plot(bioplanet,bioinformation)

注意事项:

  1. 做完后将a删除出搜索环境 detach(a)
  2. 两个以上数据框的列名有冲突时,同时attach会报错。

方案二、with函数:

with(DataFrame,{
 plot(bioplanet,bioinformation)
x<<-summary(bioinformation)  
})  #求和并赋值给x,<<-的意思是作为全局变量,也就是出了大括号仍有效。注意括号要成对,另外对变量赋值的时候采用<<-符号,避免出了大括号变量失效
x #运行完后打印x

这句代码: save(X,file="test.RData"),如果报错object X not found,是为什么,应该怎么解决?

R和Linux一样,是区分大小写的,加载的变量中没有“X”,而加载的变量是“x”,把代码改为save(x,file="test.RData")可以解决问题。

你可能感兴趣的:(2021-05-25-Day5-R的两个重要数据结构-zhw)