学习小组Day6笔记--慧美

一、思维导图

学习小组Day6笔记--慧美_第1张图片
思维导图

二、准备工作

  1. 获取R包小抄(cheatsheet)
    去百度/谷歌XX小抄
    找Rstudio的cheatsheet网站
    教程里用到的包都可以到生信星球公众号回复相应的包名来获取

  2. 初步了解tidyr

  • 安装R包
  • 新建数据框(这里直接把新建的数据框赋值给了a)
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
  • 认识Tidy Data
    每个变量(variable)占一列,每个情况(case,姑且这么翻译)和观测值(observation)占一行。
  • 1.Reshape Data
    gather
    spread
  • 2.Handle Missing Values

三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。

X<-read.csv('doudou.txt')

导入:X<-read.csv('doudou.csv')
导出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行删除掉
括号里填数据框名,依据的列名(有空值那一列的列名)
fill(),根据上一行的数值填充上
replace_na(),空值填进去特定的一个数值
complete(把空值的位置补全)
expand(列出每列值所有可能的组合)
separate:按列分割
separate_rows:按行分割
unite:分割完了再合并回去

你可能感兴趣的:(学习小组Day6笔记--慧美)