Matplotlib是Python的绘图库,其中的pyplot包封装了很多画图的函数。
Matplotlib.pyplot 包含一系列类似 MATLAB 中绘图函数的相关函数。每个 Matplotlib.pyplot 中的函数会对当前的图像进行一些修改,例如:产生新的图像,在图像中产生新的绘图区域,在绘图区域中画线,给绘图加上标记,等等…… Matplotlib.pyplot 会自动记住当前的图像和绘图区域,因此这些函数会直接作用在当前的图像上。
绘制线图
plt.plot() 函数可以用来绘制线型图:
1、基本用法
指定x和y
plt.plot(x,y)
默认参数,x 为 0~N-1
plt.plot(y)
因此,在上面的例子中,我们没有给定 x 的值,所以其默认值为 [0,1,2,3]。
分别传入 x 和 y:
2、字符参数
和 MATLAB 中类似,我们还可以用字符来指定绘图的格式。
表示颜色的字符参数有:
表示类型的字符参数有:
例如我们要画出红色圆点:
可以看出,有两个点在图像的边缘,因此,我们需要改变轴的显示范围。
3、显示范围
与 MATLAB 类似,这里可以使用 axis 函数指定坐标轴显示的范围:
plt.axis([xmin, xmax, ymin, ymax])
4、传入Numpy参数
之前我们传给 plot 的参数都是列表,事实上,向 plot 中传入 numpy 数组是更常用的做法。事实上,如果传入的是列表,matplotlib 会在内部将它转化成数组再进行处理:
5、子图
figure() 函数会产生一个指定编号为 num 的图:
plt.figure(num)
这里,figure(1) 其实是可以省略的,因为默认情况下 plt 会自动产生一幅图像。
使用 subplot 可以在一副图中生成多个子图,其参数为:
plt.subplot(numrows, numcols, fignum)
当 numrows * numcols < 10 时,中间的逗号可以省略,因此 plt.subplot(211) 就相当于 plt.subplot(2,1,1)。
绘制柱状图
柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。
绘制每个国家或地区的电影数量的柱状图:
绘制散点图
用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。
散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。
根据电影时长和电影评分绘制散点图:
绘制饼图
饼图英文学名为Sector Graph, 有名Pie Graph。常用于统计学模块。2D饼图为圆形,手画时,常用圆规作图。
仅排列在工作表的一列或一行中的数据可以绘制到饼图中。饼图显示一个数据系列中各项的大小与各项总和的比例,数据点显示为整个饼图的百分比。
函数原型:
pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6,
shadow=False, labeldistance=1.1, startangle=None, radius=None)
参数: x (每一块)的比例,如果sum(x) > 1会使用sum(x)归一化
labels (每一块)饼图外侧显示的说明文字
explode (每一块)离开中心距离
startangle 起始绘制角度,默认图是从x轴正方向逆时针画起,如设定=90则从y轴正方向画起
shadow表示是否阴影
labeldistance label绘制位置,相对于半径的比例, 如<1则绘制在饼图内侧
autopct 控制饼图内百分比设置,可以使用format字符串或者format function
'%1.1f'指小数点前后位数(没有用空格补齐)
pctdistance 类似于labeldistance,指定autopct的位置刻度
radius 控制饼图半径
返回值: 如果没有设置autopct,返回(patches, texts)
如果设置autopct,返回(patches, texts, autotexts)
根据电影的长度绘制饼图:
绘制直方图
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。
直方图是数值数据分布的精确图形表示。这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。
为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。这些值通常被指定为连续的,不重叠的变量间隔。间隔必须相邻,并且通常是(但不是必须的)相等的大小。
直方图也可以被归一化以显示“相对”频率。然后,它显示了属于几个类别中的每个案例的比例,其高度等于1。
根据电影的评分绘制直方图:
hist的参数非常多,但常用的就这七个,只有第一个是必须的,其他是可选的。
arr: 需要计算直方图的一维数组
bins: 直方图的柱数,可选项,默认为10
normed: 是否将得到的直方图向量归一化。默认为0
facecolor: 直方图颜色
edgecolor: 直方图边框颜色
alpha: 透明度
histtype: 直方图类型,‘bar’, ‘barstacked’, ‘step’, ‘stepfilled’
返回值 :
n: 直方图向量,是否归一化由参数normed设定
bins: 返回各个bin的区间范围
patches: 返回每个bin里面包含的数据,是一个list