Python是一种用于进行数据分析的优秀语言,主要是因为它有很多以数据为中心的packages可以使用,Pandas就是其中一个软件包,可以更轻松地导入和分析数据。
在分析数据时,很多时候用户想要查看特定列中的唯一值。 Pandas nunique() 用于获取唯一值的统计次数。
dropna 默认参数设置为True,因此在计算唯一值时排除了NULL值。
例子1# : nunique() 用法
在此示例中,nunique() 方法用于获取 'Team’列中所有唯一值的数量。
# importing pandas package
import pandas as pd
# 下载 employees.csv的地址
#https://cdncontribute.geeksforgeeks.org/wp-content/uploads/employees.csv
data = pd.read_csv("employees.csv")
# 统计“Team”列中不同值的个数,不包括null值
unique_value = data["Team"].nunique()
# printing value
print(unique_value)
#Output:10
例子2# :
>>> import pandas as pd
>>> df=pd.DataFrame({'A':[1,2,3],
'B':[4,5,6]})
>>> df.nunique()
A 3
B 3
dtype: int64
>>> df=pd.DataFrame({'A':[1,1,2],
'B':[4,5,6]})
>>> df.nunique()
A 2
B 3
dtype: int64
从例子可以清楚看出,nuinque()这个函数分别统计每一列属性各自有多少个不同值。