dplyr

1. filter 函数

data<-iris 

根据给定的逻辑判断,筛选符合条件的子集。
data1<-filter(data,Sepal.Length>7)  #筛选Sepal.Length(花萼长度)大于7的数据

data2<-filter(data,Species=="versicolor")  #筛选物种为“versicolor”的数据

data3<-filter(data,Species!="versicolor" & Petal.Length>4.5)  #筛选物种不为“versicolor”且Petal.Length(花瓣长度)大于4.5的数据

2. arrange() 函数

按给定的列名对行进行排序。
data4<-arrange(data,Sepal.Length)  #按Sepal.Length进行排序,默认为升序

data5<-arrange(data,desc(Sepal.Length))  #加desc参数,按Sepal.Length进行降序排序

3. select 函数

用列名做参数选择子数据集。
data6<-select(data,Sepal.Width:Petal.Width)  #选择Sepal.Width(花萼宽度)到Petal.Width(花瓣宽度)的列

data7<-select(data,starts_with("P"))  #结合starts_with函数,选择变量名以P开头的列

4. mutate() 函数

对现有的列进行运算,并作为新列添加。
data8<-mutate(data,S.L=10*Sepal.Length)  #增加S.L列为Sepal.Length列的10倍

data9<-mutate(data,L.W=Sepal.Length/Sepal.Width)  #增加L.W列为Sepal.Length除以Sepal.Width的数值

5. summarise() 函数

对数据框调用其它函数进行汇总操作,返回一维的结果。
data10<-summarise(data,mean(Sepal.Length))  #求Sepal.Length的平均值

6. group_by() 分组函数

添加了group_by()分组信息后就可对数据执行分组操作,常与summarise() 结合使用。

data11<-summarise(group_by(data,Species),mean(Sepal.Length))  #对数据按Species分组,计算Sepal.Length平均值
dplyr_第1张图片
image.png

你可能感兴趣的:(dplyr)