学习小组Day6笔记---飞天小朱

今天的学习内容

关于R包的(cheatsheet),如图,可以很好的帮助自己学习。


cheatsheet

接下俩是学习今天的新内容-tidyr,这个过程中需先构架一个数据框。

在tidyr包中需要注意两个函数gather spread。
重点 gather用法:括号里的分别是:数据框名,需合并的列名(两个),合并后的key列名,value列名。

Handle Missing Values

这个讲解中有三个问题需要注意

  1. 删除整行
  2. 根据上下文(瞎)蒙一个
  3. 同一列的空值填上同一个数。

以及需要注意的函数

drop_na()#有空值的,整行删除掉
fill()#根据上一行的数值填充上
repalce_na#空值填进去特定的一个数

第三项需要学习的是Expand tables

complete(data,....,fill=list())
expand(data,...)

对于expand函数我不是很了解于是我就?了呀。


图片6.png

一般来说就是用来显示可能缺失的组合的。

接下来推荐我最喜欢的函数

separate()
separate_row()

separate(data, col, into, sep = “[^[:alnum:]]+”, remove = TRUE,
convert = FALSE, extra = “warn”, fill = “warn”, …)
data:为数据框
col:需要被拆分的列
into:新建的列名,为字符串向量
sep:被拆分列的分隔符
remove:是否删除被分割的列
需要说明的是,分割要注明以那种形式为分割标准。


学习小结

你可能感兴趣的:(学习小组Day6笔记---飞天小朱)