数据处理-5(基于R语言)

  1. merge函数的all参数用法
merge(ink1,ink2,by="id",all=T)  #所有数据列都放进来,空缺的补值为NA
merge(ink1,ink2,by="id",all=F)  #默认,只取两者的共有的部分
  1. runif(n, min = 0, max = 1)
  2. dplyr里的各种“集合”
    image.png
  3. 像excel表一样查看data frame
sample_ann <- as.data.frame(colData(fluidigm))
DT::datatable(sample_ann)
  1. 从结果里提取p值和相关系数
res$p.value  # Extract the p.value 
res$estimate # Extract the correlation coefficient 
  1. 批量创建变量名
paste("A", 1:6, sep = "",collapse=",”) 
#> [1] "A1,A2,A3,A4,A5,A6" 
  1. match函数的常见用法:固定某一个字段排序,匹配其它字段
user_id <- c(1,2,3,4)

u1 <- c(2,3,4,1)
e1 <- c('a1','a2','a3','a4')

m1 <- data.frame(u1,e1)
m1

#  u1 e1
# 1  2 a1
# 2  3 a2
# 3  4 a3
# 4  1 a4

t1<- m1[match(user_id,m1$u1),]
t1

#   u1 e1
# 4  1 a4
# 1  2 a1
# 2  3 a2
# 3  4 a3
  1. 画ROC曲线时,横坐标有时会莫名其妙显示科学计数法,解决办法: options(scipen = 3)
  2. 满足两个条件的unique值:
dim(unique(mydata[,c("Age","Gender")])) %in% print 
  1. ctr +shift + R:快捷加入章节标签

你可能感兴趣的:(数据处理-5(基于R语言))