import numpy as np
import pandas as pd
from matplotlib import pyplot as plt.
df=pd.DataFrame(data={
'type':['A','A','A','A','A','A','A','A','A','A','B','B','B','B','B','B','B','B','B','B'],
'value':[2,3,3,4,4,4,4,5,5,6,5,6,6,7,7,7,7,8,8,9]
})
ser=pd.Series(data=[2,3,3,4,4,4,4,5,5,6])
1、下面先介绍series.hist()函数中常用的几个重要参数(参数等号后为默认设置):
(1)by=None, 用于对数据进行分组,结构需要与数据源的结构一致。 (2)ax=None, 表示要引用的坐标系,当设置了多个坐标系时可以指定具体的坐标系。 (3)grid: 'bool' = True, 用于设置网格线,下图为grid=False的情况。
(4)bins: 'int | Sequence[int]' = 10, 设置数据桶的数目。 2、下面先介绍dataframe.hist()函数中常用的几个重要参数(参数等号后为默认设置): (1)column: 'IndexLabel' = None, 用于指定需要作图的数据列。本例中只有一个数据列,故无需指定。 (2)by=None, 用于指定需要分组的列。
(3)grid: 'bool' = True, 用于设置网格线是否显示。 (4)sharex: 'bool' = False, sharey: 'bool' = False, 用于设置多个图是否共用x轴/y轴坐标系。 (5)layout: 'tuple[int, int] | None' = None, 用于设置多个图的布局。下图将布局设置为2行1列的形式。
(6)bins: 'int | Sequence[int]' = 10,用于设置数据桶的数目。