Series.value_counts(normalize=False,sort=True,ascending=False, bins=None, dropna=True)
作用:返回一个包含值和该值出现次数的Series对象,次序按照出现的频率由高到低排序.
参数:
normalize : 布尔值,默认为False,统计该值出现的频次,如果是True的话,就会包含该值出现次数的频率即百分比.
sort : 布尔值,默认为True.排序控制.
ascending : 布尔值,默认为False,以升序排序
bins : integer, optional
Rather than count values, group them into half-open bins, a convenience for pd.cut, only works with numeric data
dropna : 布尔型,默认为True,表示不包括NaN
train['A3'].value_counts(normalize=True, dropna=False)
###输出结果为:
405.0 0.957020
NaN 0.030086
270.0 0.008596
340.0 0.004298
Name: A3, dtype: float64
输出的结果应该是该column的值与之对应的该值在该columns出现的百分比。