python统计分析——直方图(df.hist)

使用dataframe.hist()或series.hist()函数绘制直方图

import numpy as np
import pandas as pd
from matplotlib import pyplot as plt.

df=pd.DataFrame(data={
    'type':['A','A','A','A','A','A','A','A','A','A','B','B','B','B','B','B','B','B','B','B'],
    'value':[2,3,3,4,4,4,4,5,5,6,5,6,6,7,7,7,7,8,8,9]
})
ser=pd.Series(data=[2,3,3,4,4,4,4,5,5,6])

 python统计分析——直方图(df.hist)_第1张图片

1、下面先介绍series.hist()函数中常用的几个重要参数(参数等号后为默认设置):

(1)by=None, 用于对数据进行分组,结构需要与数据源的结构一致。
(2)ax=None, 表示要引用的坐标系,当设置了多个坐标系时可以指定具体的坐标系。
(3)grid: 'bool' = True, 用于设置网格线,下图为grid=False的情况。

python统计分析——直方图(df.hist)_第2张图片

(4)bins: 'int | Sequence[int]' = 10, 设置数据桶的数目。
2、下面先介绍dataframe.hist()函数中常用的几个重要参数(参数等号后为默认设置):

(1)column: 'IndexLabel' = None, 用于指定需要作图的数据列。本例中只有一个数据列,故无需指定。
(2)by=None, 用于指定需要分组的列。

python统计分析——直方图(df.hist)_第3张图片

(3)grid: 'bool' = True, 用于设置网格线是否显示。
(4)sharex: 'bool' = False, sharey: 'bool' = False, 用于设置多个图是否共用x轴/y轴坐标系。
(5)layout: 'tuple[int, int] | None' = None, 用于设置多个图的布局。下图将布局设置为2行1列的形式。

python统计分析——直方图(df.hist)_第4张图片

(6)bins: 'int | Sequence[int]' = 10,用于设置数据桶的数目。

你可能感兴趣的:(python,开发语言)