python统计分析——多变量描述统计

资料来源:用Python动手学统计学

多变量的描述统计,通常利用pandas的groupby函数将数据进行分组处理,然后再计算各统计量。

0、导入库和原始数据

import numpy as np
import pandas as pd
import scipy as sp

data_set=pd.DataFrame(
    {"type":['A','A','A','B','B','B'],
     "data":[2,3,4,6,8,10]}
)

1、利用groupby函数对数据进行分组

group=data_set.groupby('type')
type(group)

现在group变量已经按照type对数据进行分组,后面对group进行统计处理,即可获得不同type的统计量。

2、平均数

group.mean()

python统计分析——多变量描述统计_第1张图片

3、标准差

group.std(ddof=1),ddof的用法参照:python统计分析——单变量描述统计-CSDN博客

python统计分析——多变量描述统计_第2张图片

4、最大值和最小值

最大值:group.max()

最小值:group.min()

python统计分析——多变量描述统计_第3张图片python统计分析——多变量描述统计_第4张图片

5、计数

group.count()

python统计分析——多变量描述统计_第5张图片

6、求和

group.sum()

python统计分析——多变量描述统计_第6张图片

7、中位数

group.median()

python统计分析——多变量描述统计_第7张图片

8、四分位数

下四分位数:group.quantile(q=0.25)

上四分位数:group.quantile(q=0.75)

python统计分析——多变量描述统计_第8张图片

9、一次性获取计数、均值、标准差、极值、四分位数、中位数

group.describe()

python统计分析——多变量描述统计_第9张图片

你可能感兴趣的:(python,开发语言)