Python数据统计_pd.DataFrame各列数值统计

Python数据统计,对pd.DataFrame各列数值统计,如下:

.count()   #非空元素计算
.min() a   #最小值
.max()   #最大值
.idxmin()   #最小值的位置
.idxmax()   #最大值的位置
.quantile(0.75) #75%分位数
.sum()   #求和
.mean()   #均值
.median()   #中位数
.mode()   #众数
.var()   #方差
.std()   #标准差
.mad()   #平均绝对偏差
.skew()   #偏度
.kurt()   #峰度
.describe()  #一次性输出多个描述性统计指标

# 统计各个列大于0的元素个数
data[data>0].count()
# 统计列A大于0的元素个数
data[data['A']>0].count()

这里说明,data的数据格式必须是DataFrame

pd.Series().value_counts(),会统计各个类的统计值。

什么时候value_counts(),什么时候count()

前面是Series数据,用value_counts(),前面数据是DataFrame,用count()。

你可能感兴趣的:(Python相关,python,pandas,开发语言)