学习小组Day5 数据类型

参考 生信星球 公众号教程

  1. 向量
  2. 从向量中提取元素
  3. 数据框

1.向量

c( ) 你可以理解为combine 把几个元素合一起

向量:多个元素组成的变量
a<- c(6,8,8)
a<- c('wo','帅气', '1')

标量:一个元素组成的变量

b<-'帅气'
b<-'2'
x<-c(1,2,3) #常用的向量定义写法,意为将x定义为由元素1,2,3组成的向量。

x<-(1:8) #1到8 : 1 2 3 4 5 6 7 8
x<-seq(1,6,by = 2) #1到6,间隔是2 : 1 3 5

x<-rep(1:2,times=2) #1到2重复2次 : 1 2 1 2

你赋值的变量 都在Rstudio右上角看得到

右上角

2. 从向量中提取元素

(1)根据元素位置

x<-c(1:10) # 先让赋值给x ,10个元素
#这里的x是你刚才赋值的变量名,根据自己的情况来修改

x[4]  # x第4个元素 
x[-4] # 排除法,除了第4个元素之外剩余的元素 
x[2:4] # 第2到4个元素  
x[-(2:4)] # 除了…… 
x[c(1,5)]  # 第1个和第5个元素   
(2)根据值的大小
x<-c(-1,0,1,2,10)  #先给x个赋值

x[x==10] # 返回等于10的元素
x[x<0]   # 返回<0的元素
x[x %in% c(1,2,5)]  # 存在于向量c(1,2,5)中的元素

3. 数据框

(1)读取本地数据

在公众号【生信星球】后台回复:“数据类型”即可获得 示例数据
读取要记得 设置你文件所在的目录

setwd('C:\\Users\\XFY\\Desktop\\生信\\豆花分享')   #设置工作目录

read.table(file = "huahua.txt",sep = "\t",header =T) #读取文件,分隔符为Tab,有表头 

a<-read.table(file = "huahua.txt",sep = "\t",header =T)#把这个数据框赋给一个变量a 

NA表示空值


点击Rstudio右上角 数据框 a 显示此界面
(2)设置行名和列名

1.读取csv文件,查看行列名

#在示例数据里有doudou.txt 注意这里的变量X是一个数据框
X<-read.csv('doudou.txt') 
  
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号,1.2.3.4...
读取csv文件,查看行列名
(3)修改行名 、列名
# 将 【列名】 第一个修改为 ‘bioplanet’
colnames(X)[1]<-"bioplanet"  
# 修改 行名, 改第二行
rownames(X)[2]<-'试一试'
(4) 读取csv时 row.names=F 或T 感受一下
#最后row.names的意思是修改第一列为行名
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)
row.names=T 时
(5)数据框的导出

导出txt格式:
分隔符是逗号 sep = ","
引号不要 quote=F

#分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 
write.table(X,file = "yu.txt",sep = ",",quote=F)
(6)变量的保存与重新加载

学会保存和重新加载
有的数据是代码运行很久得到的,可以保存,下次直接调用
保存的格式是RData。

save.image(file="bioinfoplanet.RData") # 保存当前所有变量

save(a,file="自己命名.RData")  # 保存其中一个变量
load("自己命名.RData") # 再次使用RData时的加载命令
(7)提取元素

x [x,y] 逗号左边x代表行,逗号右边代表列

 X[1, 2 ] # 第1行第2列
 X[2,] # 第2行

 X[ , 3] # 第3列
 X[ 3]   # 也是第3列

X[2:4]  # 第2列到第4列
X[ ,2:4] 

X[c(6,8)] # 第6列和第8列

X$ 列名   # 也可以提取列 美元符号$ 提取

最后 代码记得保存

你可能感兴趣的:(学习小组Day5 数据类型)