【pandas】常用统计指标

1. 分位数

pandas 和 numpy中都有计算分位数的方法,pandas中是quantile,numpy中是percentile

两个方法其实没什么区别,用法上稍微不同,quantile的优点是与pandas中的groupby结合使用,可以分组之后取每个组的某分位数

  • quantile
import numpy as np
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import os,sys

os.chdir('/Users/cc/Documents/cc工作生意金/标准化平台/储蓄卡相关/储蓄卡变量分析/数据') 
data1=pd.read_csv('chuxuka_data.csv')

#将data按LOAN_MONTH分组
grouped=data1.groupby(['loan_month'])
#用quantile计算每个月份的第40%的分位数
grouped['trans_num_new'].quantile(0.4) 

【pandas】常用统计指标_第1张图片

  • PERCENTILE
    a=np.array(data1['trans_num_new']) np.percentile(a,0.4)
    【pandas】常用统计指标_第2张图片

2. 取整

向上取整ceil 向下取整FLOOR 四舍五入 round

你可能感兴趣的:(python,python---pandas)