用R处理数据的结构性问题

和Python对应,用R如何清理数据呢?
R主要用到两个包:tidyrdplyr

library(tidyr)
?gather
?spread
用R处理数据的结构性问题_第1张图片
效果示意

一、单独表的“长宽互变”

依旧按场景来看。

(一)“省份—年份”式

用R处理数据的结构性问题_第2张图片
宽表变长表
gather(pf, 'year', 'n', 2:4)
用R处理数据的结构性问题_第3张图片
用gather函数

(二)“省份—分类”式

用R处理数据的结构性问题_第4张图片
长表变宽表
spread(pf, size, amount)
用R处理数据的结构性问题_第5张图片
用spread()函数

(三)时间式

类似时间这样的数据分割和合并


用R处理数据的结构性问题_第6张图片
用sepatate()分割

用R处理数据的结构性问题_第7张图片
unite()合并

二、多表的“增宽加长”

用R处理数据的结构性问题_第8张图片
“绑”列增宽
用R处理数据的结构性问题_第9张图片
“绑”行加长
用R处理数据的结构性问题_第10张图片
合并新增
用R处理数据的结构性问题_第11张图片
找重叠
用R处理数据的结构性问题_第12张图片
找差异
用R处理数据的结构性问题_第13张图片
按条目增宽
用R处理数据的结构性问题_第14张图片
按多条件增宽
用R处理数据的结构性问题_第15张图片
增宽并舍弃无数据对象

你可能感兴趣的:(用R处理数据的结构性问题)