R语言学习(六)——dplyr包常用函数

filter():筛选满足条件的行

例:
利用R中自带包“survey”进行数据处理
代码
等同于:
代码
这种方法产生的数据框可能带有缺失值

arrange():排序

当排序列有多个,前面的列有更高的排序优先级,默认从小到大的顺序,逆序要指定desc(var)或-var,var表示要排序的变量名。
例:
arrange(survey,Height,-Wr.Hnd)或arrange(survey,Height,desc(Wr.Hnd))
将survey先按Height升序,再按Wr.Hnd降序

select():选择变量列

例:
(1)a=select(survey,Sex,Wr.Hnd,NW.Hnd,Height)选择
等同于:
a=survey[,c(1:3,10)]
(2)b=select(a,-Height)剔除
等同于:
b=a[,-4]

mutate():添加新变量

直接使用列名计算得到新变量
例:
mutate(survey,new=Wr.Hnd-NW.Hnd)

summary():描述数据

例:
图片

sample_n():获取随机样本

例:
R语言学习(六)——dplyr包常用函数_第1张图片
对固定数字使用sample_n(),对固定分数使用sample_frac()。

group_by():按分类型变量拆分数据

取消分组:ungroup()

你可能感兴趣的:(R语言学习)