pandas.DataFrame.hist函数bins参数的理解

最近在学习机器学习,就顺道把自己的一些理解记下来。

解释

bins 参数的含义是所画出的直方图的“柱”的个数;每个“柱”的值为其跨越的值的个数和。

代码(in Jupyter notebook)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

np.random.seed(42)
df = pd.DataFrame(data=np.random.randint(0, 8, size=(100,4)), columns=list('abcd'))
# print(df)
# print(df['a'].value_counts())
df.hist(bins=6, figsize=(20, 15))
plt.show()
hist函数bins参数说明

从图中可以看到‘柱’的个数为6,每个“柱”的值为其跨越的值的个数和。如第一个“柱”跨越了0和1,那么该柱的高度就是0和1出现的次数的总和。

你可能感兴趣的:(pandas.DataFrame.hist函数bins参数的理解)