首先,你需要一个Rstudio,其次每一个项目需要一个文件夹以方便自己且路径中不要出现中文和空格,如果需要请用下划线替代。
1.安装R包
if(!require("tidyr")) install.packages("tidyr",update = F,ask = F)
#或者选择安装Bioconductor上的R包
if(!require("limma")) BiocManager::install("limma",update = F,ask = F)
#一般情况下可选择
install.packages("png")##需要注意的是括号里面的R包必须用双引号,否则会报错
2.逻辑运算
a<-3
b<-4
a==b #判断a是否等于b,输出为FALSE
a!=b #判断a是否不等于b,输出为TRUE
a>=b #判断a是否大于等于b
a<=b #判断a是否小于等于b
3. 数据类型
c <-1>10 #c为FALSE
d <- 1:10 #d为1,2,3...10,当然产生序列也可以用seq(1,10,by=1),请注意rep(1,2,times=3)产生的是1,2,1,2,1,2,而rep(1,2,each=3)产生的是1,1,1,2,2,2
e<- "apple"
#查看数据类型
class(a)输出为"numeric"(数字)
class(c)输出为"logical" (逻辑)
class(e)输出为"character" (字符串)
#改变数据类型(用as.)
b <- as.character(b) #将b改为字符串类型,输出为"4",这里的"4"不能用于计算,因为是字符串
需要注意的是,as.factor()非常重要,是用来分类或排序的!但要注意因子变数字的时候要先变字符串后变数字。
在排序的时候可以这样做:
a<- rep(18:21,3) #18,19,20,21,18,19,20,21,18,19,20,21
a<- factor(a) #把a变成了因子,如果要调整顺序,就需要以下代码
aa<-factor(a, levels=c("21","18","19","20")) #输出的levels就变成了21,18,19,20
4.数据结构
4.1 向量(vector,一维)# c(1,2,3) c("a","b","c")
4.2 矩阵(matrix,二维):数据类型必须一样,如都是数字
a<- matrix(1:10,nrow=5,ncol=2) #5行2列
1 6
2 7
3 8
4 9
5 10
默认是先竖着排(byrow=FALSE),不够时会从头开始循环,要注意进行GEO差异分析的时候要求的数据类型就是矩阵matrix
改变列名:colnames(a)<-c("a","b")
数据框(data.frame,二维):真正意义上的excel,里面啥类型都可以,一列一列创建
dim(a) 输出3 3表示3行3列
names(a)输出为列名,rownames为行名
4.3 数组(array,三维)
4.4 列表(list):包括以上所有,储存不同长度的数据