R语言【dplyr】——n_distinct() 计算一个或多个向量集合中唯一/唯一组合的数量。它比 nrow(unique(data.frame(...))更快、更简洁。

Package dplyr version 1.1.4


Parameters

n_distinct(..., na.rm = FALSE)

参数【...】:未命名向量。如果提供多个向量,它们的长度应相同。

参数【na.rm】:如果为 TRUE,则从计数中排除缺失的观测值。如果参数【...】中有多个向量,则如果其中任何值缺失,都将排除该观测值。


Value

一个数字。


Example

> x <- c(1, 1, 2, 2, 2)

> n_distinct(x)
[1] 2
> y <- c(3, 3, NA, 3, 3)

> n_distinct(y)
[1] 2

> n_distinct(y, na.rm = TRUE)
[1] 1
> n_distinct(x, y)
[1] 3
> n_distinct(x, y, na.rm = TRUE)
[1] 2
> n_distinct(data.frame(x, y))
[1] 3

你可能感兴趣的:(R语言,r语言)