R学习笔记(1):几个小知识点

查看或更改R包的存储路径
创建连续数值的向量
创建矩阵
is. & as.系列函数
数据导入,导出
挑选符合条件的行记录
read.table(comment.char="!")
行名rownames()
数据框的简单统计
写一个函数
左右合并两个数据框

查看或更改R包的存储路径

#查看
> .libPaths()
[1] "E:/LINUXlearning/learning/R/R-3.5/R-3.5.1/library"

#更改
.libPaths("文件夹路径")
#或
install.packages("包",lib="文件夹路径")

创建连续数值的向量

a = 1:10
b = seq(1,10)
c = seq(1,10,2)

创建矩阵

# dim()改变维度
> x <- 1:12 ; dim(x) <- c(3,4)
> x
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12

is. & as.系列函数

#is.系列函数,判断变量是否为某种类型,返回布尔值
> is.matrix(x)
[1] TRUE
#as.系列函数,转换变量类型,并返回变量
> y <- as.data.frame(x)
> y
  V1 V2 V3 V4 #数据框有行列名,没有设置行列名也会自动加上
1  1  4  7 10
2  2  5  8 11
3  3  6  9 12
> str(y) #查看内部结构
'data.frame':   3 obs. of  4 variables:
 $ V1: int  1 2 3
 $ V2: int  4 5 6
 $ V3: int  7 8 9
 $ V4: int  10 11 12

#与矩阵x的对比
> x
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> str(x)
 int [1:3, 1:4] 1 2 3 4 5 6 7 8 9 10 ...

数据导入,导出

#把RStudio编辑界面中的变量导出来
save(y,file = "y.Rdata")
#将外部数据导入
load(file = "y.Rdata")

write.csv(数据框变量,“名称.csv”)
read.csv(“名称.csv”)

还有read.xxx系列

对于数据框的某一列,如何针对该列挑选出符合条件的行记录

#以"grep"为例
index1=grep("W-type",data_f$V1) #返回索引
index2=grepL("W-type",data_f$V1) #返回布尔值
wanted=data_f[index1,]
wanted=data_f[index2,]

#还有filter函数

read.table(comment.char="!")这个参数指定注释行的开头字符

read.table("GSE17215_series_matrix.txt",comment.char = "!",sep = "\t",header = T,row.names=1)

指定某一列为行名后,删除该列

rownames(数据框变量)=数据框变量[,1]
数据框变量=数据框变量[,-1]

数据框的简单统计

max(b$GSM431121)
min(b$GSM431121)
fivenum(b$GSM431121) #最大、最小及四分位数
table(b$GSM431121 > 10000) #统计>10000和<=10000各有多少

> mean(a[1,])
[1] NA
Warning message:
In mean.default(a[1, ]) : 参数不是数值也不是逻辑值:回覆NA
> mean(as.numeric(a[1,]))
[1] 1955.593
#原因如下,数据框不能直接求均值
> str(a[1,])
'data.frame':   1 obs. of  6 variables:
 $ GSM431121: num 482
 $ GSM431122: num 597
 $ GSM431123: num 2722
 $ GSM431124: num 2566
 $ GSM431125: num 2738
 $ GSM431126: num 2629
> str(as.numeric(a[1,]))
 num [1:6] 482 597 2722 2566 2738 ...

#求行均值
##简单方法
rowMeans(a)
##for循环
for (i in 1:nrow(a)) {
  print(mean(as.numeric(a[i,])))
}
##第三种,x表示as.numeric(a[i,])
apply(a,1,function(x){
  mean(x)
})
##第四种
apply(a,1,mean)

#同理,求最大值
for (i in 1:nrow(a)) {
  print(max(as.numeric(a[i,])))
}
##
apply(a,1,function(x){
  max(x)
})
##
apply(a,1,max)

写一个函数

hsy <- function(x){
  for (i in 1:nrow(x)) {
    a=as.numeric(x[i,])
    b=a[1]+a[2]
    print(b)
  }
}
hsy(a)

左右合并两个数据框

cbind(a1,a2)

这一部分的学习内容来源于生信技能树,在此表示感谢!!!

你可能感兴趣的:(R学习笔记(1):几个小知识点)