Pandas统计函数整理

本文永久链接: https://tnanko.github.io/posts/4417afb5.html

引言

在使用pandas做数据预处理(解决缺失值问题)的时候,需要用到一些统计函数。额,然后百度、谷歌、看大神博客,以下是我的整理。

Pandas三个数据对象的轴参数

Series: 没有轴参数
DataFrame: “index” (axis=0, default),“columns” (axis=1)
Panel: “items” (axis=0),“major” (axis=1, default), “minor” (axis=2)

统计函数及描述

Function Description 描述
count Number of non-null observations 观测值的个数
sum Sum of values 求和
mean Mean of values 求平均值
mad Mean absolute deviation 平均绝对方差
median Arithmetic median of values 中位数
min Minimum 最小值
max Maximum 最大值
argmin Calculate the index position (integer) that can get the minimum value 计算能够获取到最小值的索引位置(整数)
argmax Calculate the index position where the maximum value can be obtained 计算能够获取到最大值的索引位置
idxmin Row index of each column minimum 每列最小值的行索引
idxmax Row index of the maximum value per column 每列最大值的行索引
mode Mode 众数
abs Absolute Value 绝对值
prod Product of values 乘积
std Bessel-corrected sample standard deviation 标准差
var Unbiased variance 方差
sem Standard error of the mean 标准误
skew Sample skewness (3rd moment) 偏度系数
kurt Sample kurtosis (4th moment) 峰度
quantile Sample quantile (value at %) 分位数
cumsum Cumulative sum 累加
cumprod Cumulative product 累乘
cummax Cumulative maximum 累最大值
cummin Cumulative minimum 累最小值
cov() covariance 协方差
corr() correlation 相关系数
rank() rank by values 排名
pct_change() time change 时间序列变化

参考链接

1.Pandas 描述统计函数
2.pandas的汇总和计算描述统计
3.官网文档

本文作者: 赵赟
本文链接: https://tnanko.github.io/posts/4417afb5.html
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 许可协议。转载请注明出处!

你可能感兴趣的:(数据挖掘)