matplotlib.pyplot直方图画起来还是非常方便的,思路还是准备好数据,然后设置参数即可。
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。
直方图是数值数据分布的精确图形表示。 这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。 为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 这些值通常被指定为连续的,不重叠的变量间隔。 间隔必须相邻,并且通常是(但不是必须的)相等的大小。
直方图是调用的matplotlib.pyplot.hist模块
matplotlib.pyplot.hist的参数:matplotlib.pyplot.hist(x,bins = None,range = None,density = None,weights = None,cumulative = False,bottom = None,
histtype =’bar’,align =’mid’,orientation =’vertical’,rwidth = None,log = False,color = None,label = None,
stacked = False,normed = None,hold = None,data = None,** kwargs )
hist的参数详解
x : (n,)数组或序列(n,)数组输入值,这需要单个数组或不需要具有相同长度的数组序列
bins : 整数或序列或’auto’可选,默认是没有如果一个整数,bins +1,则计算并返回bin边缘,与之一致numpy.histogram()
range : 元组或没有可选的,默认是没有箱子的上下范围。上下异常值将被忽略。如果没有提供,范围是(x.min(),x.max())。如果箱子是一个序列没有影响范围
如果指定箱是一个序列或范围,自动定量是基于指定本范围而不是x的范围。
density :可选布尔类型如果这是真的,返回第一个元素的元组将计数归一化形成一个概率密度,即。,面积(或积分)根据直方图将之和为1。这是通过将整个计算
观测的数量乘以本宽度,而不是除以总数量的观察。如果堆也是真的,直方图之和是标准化为1。
默认是没有赋范和密度。如果设置,那么将使用这个值。如果没有设置,那么参数将被视为错误的
weights:可选择相同的数据或者没有数组的重量、形状相同的x。每个值x只贡献相关重量对箱数(而不是1)。如果赋范或密度是真的,权重归一化,这样的积分密度范围是1。
cumulative:可选布尔类型如果True,则计算直方图,其中每个bin给出该bin中的计数加上较小值的所有bin。最后一个bin给出了数据点的总数。如果赋范或密度
也True然后直方图归一化,使得最后仓等于1。如果累计计算结果为小于0(例如,-1),累积的方向被反转。在这种情况下,如果赋范
和/或密度也是True,则直方图归一化,使得第一仓等于1。
默认是 False
bottom:相同数组,标量或者没有每个仓的底部基线的位置。如果是标量,则每个bin的基线移动相同的量。如果是一个数组,每个bin都是独立移动的,底部的长度必须
与bin的数量相匹配。如果为None,则默认为0。默认是 None
histtype : {‘bar’,’barstacked’,’step’,’stepfilled’},可选要绘制的直方图的类型
‘bar’是传统的条形直方图。如果给出多个数据,则条并排排列。
‘barstacked’是一种条形直方图,其中多个数据堆叠在一起。
‘step’生成一个默认未填充的线图。
‘stepfilled’生成一个默认填充的线图。
默认为’bar’
align : {‘left’,’mid’,’right’},可选控制直方图的绘制方式。
‘left’:条形图位于左边框边缘的中心。
‘mid’:条在bin边缘之间居中。
‘right’:条形图位于右侧边框的中心。
默认为’mid’
orientation : {‘horizontal’,’vertical’},可选如果是’horizontal’,barh将用于条形直方图,底部 kwarg将用于左边缘
log : 布尔值,可选如果True,直方图轴将设置为对数刻度。如果 log是True且x是1D数组,则将过滤掉空箱,并且仅 返回非空。(n, bins, patches).
默认是 False
color :颜色颜色规格或颜色规格序列,每个数据集一个。Default(None)使用标准线颜色序列.默认是 None
实例:import numpy as np
import matplotlib.pyplot as plt
np.random.seed(19680801)
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
n, bins, patches = plt.hist(x, 50, density=True, facecolor='g', alpha=0.75)
plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()
效果图: