Pandas库:从入门到应用(四)--数学函数

一、测试数据
import numpy as np
import pandas as pd

## 5行3列 0到100的数据
df = pd.DataFrame(data=np.random.randint(0, 100, size=(5, 3)))
df

Pandas库:从入门到应用(四)--数学函数_第1张图片

二、基础聚合函数
2.1、count()函数
df.count()  # 统计每列的行数(非空),默认axis=0
df.count(axis=1) # 统计每行的列数(非空)

Pandas库:从入门到应用(四)--数学函数_第2张图片

2.2、max()与min()函数
df.max()  # 默认求在每一列中不同行之间的最大值
df.min()  # 默认求在每一列中不同行之间的最小值

df.max(axis=1) # 默认求在每一行中不同列之间的最大值
df.min(axis=1) # 默认求在每一行中不同列之间的最小值

Pandas库:从入门到应用(四)--数学函数_第3张图片

Pandas库:从入门到应用(四)--数学函数_第4张图片

2.3、median() 中位数
df.median()  # 求每列中位数
df.median(axis = 1)  # 求每行中位数

Pandas库:从入门到应用(四)--数学函数_第5张图片

2.4、sum() 求和
df.sum()  # 求每列和
df.sum(axis=1) #求每行和
df.values.sum()  # 求所有元素的和

Pandas库:从入门到应用(四)--数学函数_第6张图片

2.5、mean() 求平均值
df.mean() # 求每列平均值
df.mean(axis=1) # 求每行平均值

Pandas库:从入门到应用(四)--数学函数_第7张图片

2.6、value_counts() 统计元素出现次数
df[1].value_counts()  # 统计第1列元素出现次数
##添加参数 normalize=True
df[1].value_counts(normalize=True)  # 统计元素出现占比

Pandas库:从入门到应用(四)--数学函数_第8张图片

2.7、cumsum() 累加
df.cumsum()  # 累加 默认axis = 0 是列

Pandas库:从入门到应用(四)--数学函数_第9张图片

2.8、cumprod() 累乘
df.cumprod()  # 累乘 默认axis = 0 是列

Pandas库:从入门到应用(四)--数学函数_第10张图片

三、高阶函数
  • ​ 方差:
    • ​ 当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;
    • ​ 当数据分布比较集中时,各个数据与平均数的差的平方和较小。
    • ​ 因此方差越大,数据的波动越大;方差越小数据的波动就越小
  • ​ 标准差
    • ​ 标准差 = 方差的算术平方根
3.1、var()方差
df.var()  # 方差
df.var(axis = 1)  # 方差

Pandas库:从入门到应用(四)--数学函数_第11张图片

3.2、std()标准差
df.std()  # 标准差
df.std(axis = 1)  # 标准差

Pandas库:从入门到应用(四)--数学函数_第12张图片

  • ​ 协方差
  • ​ 两组数值中每对变量的偏差乘积的平均值
  • ​ 协方差>0 : 表式两组变量正相关
    • ​ 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;
  • ​ 协方差<0 : 表式两组变量负相关
    • ​ 如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
  • ​ 协方差=0 : 表式两组变量不相关
3.3、cov() 协方差
df.cov()  # 协方差
df[0].cov(df[1])   # 第0列和第1列的协方差

Pandas库:从入门到应用(四)--数学函数_第13张图片

  • 相关系数r
  • 相关系数 = X与Y的协方差 / (X的标准差 * Y的标准差)
  • 相关系数值的范围在-1和+1之间
  • r>0为正相关,r<0为负相关。r=0表示不相关
  • r 的绝对值越大,相关程度越高
3.4、corr() 所有特征相关系数
df.corr()  # 所有特征相关系数
df.corrwith(df[2])  # 单一特征相关系数

Pandas库:从入门到应用(四)--数学函数_第14张图片

你可能感兴趣的:(python,pandas)