R语言筛选出不重复的行的几种方法

在做项目的过程中遇到筛选不重复的会员信息进行匹配,本次介绍五种筛选不重复行的数据:


五种方法如下:

>>> library(dplyr)
>>> library(sqldf)

方法一:

>>> data1 <- data7_0 %>% 
             group_by(CELLPHONE,MEMBERID) %>%
             filter(row_number() == 1) %>%
             ungroup()

方法二:

>>> data2 <- data7_0 %>% 
             distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)

方法三:

>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")

方法四:

>>> data4 <- base::unique(data7_0)

方法五:

>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ]) 

你可能感兴趣的:(get小技巧)