pandas统计函数count,unique,nunique的区别

原始数据准备

import pandas as pd
df1=pd.DataFrame()
df2=pd.DataFrame()
df1['name']=['a','b','c','d','e','f','g']
df2['name']=['a','b','c','d','e','f']
df1['class']=['1','1','2','2','3','3','2']
df2['grade_state']=['1','1','1','','','3']
df3=df1.merge(df2,how='left')   #产生NaN空值

pandas统计函数count,unique,nunique的区别_第1张图片

统计不同班级所有成绩等级的个数(使用count,nunique,unique不同结果如图)
pandas统计函数count,unique,nunique的区别_第2张图片

结论:count是统计非空数值个数(过滤掉nan,但会统计空字符串’‘)
unique是返回去重后所有元素(包含nan以及空字符串’‘)
nunique是统计去重后元素的个数(过滤掉nan,但会统计空字符串’‘)

你可能感兴趣的:(pandas,python)