学习小组day6笔记---lee

准备R包

方法1:去百度/谷歌XX小抄
方法2:
https://www.rstudio.com/resources/cheatsheets/
安装包裹-极简安包
1 Rstudio控制台输入library(tidyr),检查是否已经安装过
2-1安装过:congratulation!
2-2没安过:键入install.packages("tidyr")自动安装,再加载tidyr看一下

初步了解tidyr

它的功能主要有:
(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并
  这个包是把你要用的数据处理成标准而统一的数据框(Tidy Data,下面有解释)

数据框的小常识

新建数据框

Reshape Data

第一步建立数据
a<-data.frame(country=c("A","B","C"),"1999"=paste(c(0.7,37,212),"K"),"2000"=paste(c(2,80,213),"K"))

新建数据

gather(a,"year","cases",X1999,X2000)
gather(a,X1999,X2000,key = "year",value = "cases")
gather(a,year,cases,-country)排除法修改

Handle Missing Values

处理丢失的数据。就是某些单元格有空值的情况。

三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。

X<-read.csv('doudou.csv')导入数据
write.csv(X,'doudou.csv')导出数据

导入导出数据

删除空值行:drop_na(X,X2)
删除空值行

根据上一行填空值:fill(X,X2)
空值填特定值:replace_na(X,list(X2=2))

Expand Tables

complete(把空值的位置补全)

complete(X,nesting(X1),fill = list(X2=5))

补全

expand
expand(pin2,GeneId,SampleName,Expression)
expand

xmind

这两天学的太抽象了,,需要静心琢磨几个名词概念

你可能感兴趣的:(学习小组day6笔记---lee)