未明学院:Python可视化库Matplotlib绘图入门详解

Matplotlib是Python的绘图库,其中的pyplot包封装了很多画图的函数。

Matplotlib.pyplot 包含一系列类似 MATLAB 中绘图函数的相关函数。每个 Matplotlib.pyplot 中的函数会对当前的图像进行一些修改,例如:产生新的图像,在图像中产生新的绘图区域,在绘图区域中画线,给绘图加上标记,等等…… Matplotlib.pyplot 会自动记住当前的图像和绘图区域,因此这些函数会直接作用在当前的图像上。

未明学院:Python可视化库Matplotlib绘图入门详解_第1张图片

绘制线图

plt.plot() 函数可以用来绘制线型图:

未明学院:Python可视化库Matplotlib绘图入门详解_第2张图片

1、基本用法

指定x和y

plt.plot(x,y)

默认参数,x 为 0~N-1

plt.plot(y)

因此,在上面的例子中,我们没有给定 x 的值,所以其默认值为 [0,1,2,3]

分别传入 x 和 y:

未明学院:Python可视化库Matplotlib绘图入门详解_第3张图片

2、字符参数

和 MATLAB 中类似,我们还可以用字符来指定绘图的格式。

表示颜色的字符参数有:

未明学院:Python可视化库Matplotlib绘图入门详解_第4张图片

表示类型的字符参数有:

未明学院:Python可视化库Matplotlib绘图入门详解_第5张图片

例如我们要画出红色圆点:

未明学院:Python可视化库Matplotlib绘图入门详解_第6张图片

可以看出,有两个点在图像的边缘,因此,我们需要改变轴的显示范围。

3、显示范围

与 MATLAB 类似,这里可以使用 axis 函数指定坐标轴显示的范围:

plt.axis([xmin, xmax, ymin, ymax])

未明学院:Python可视化库Matplotlib绘图入门详解_第7张图片

4、传入Numpy参数

之前我们传给 plot 的参数都是列表,事实上,向 plot 中传入 numpy 数组是更常用的做法。事实上,如果传入的是列表,matplotlib 会在内部将它转化成数组再进行处理:

未明学院:Python可视化库Matplotlib绘图入门详解_第8张图片

5、子图

figure() 函数会产生一个指定编号为 num 的图:

plt.figure(num)

这里,figure(1) 其实是可以省略的,因为默认情况下 plt 会自动产生一幅图像。

使用 subplot 可以在一副图中生成多个子图,其参数为:

plt.subplot(numrows, numcols, fignum)

当 numrows * numcols < 10 时,中间的逗号可以省略,因此 plt.subplot(211) 就相当于 plt.subplot(2,1,1)。

未明学院:Python可视化库Matplotlib绘图入门详解_第9张图片

未明学院:Python可视化库Matplotlib绘图入门详解_第10张图片

绘制柱状图

柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。

绘制每个国家或地区的电影数量的柱状图:

未明学院:Python可视化库Matplotlib绘图入门详解_第11张图片

未明学院:Python可视化库Matplotlib绘图入门详解_第12张图片

绘制散点图

用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。

散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据

根据电影时长和电影评分绘制散点图:

未明学院:Python可视化库Matplotlib绘图入门详解_第13张图片

未明学院:Python可视化库Matplotlib绘图入门详解_第14张图片

绘制饼图

饼图英文学名为Sector Graph, 有名Pie Graph。常用于统计学模块。2D饼图为圆形,手画时,常用圆规作图。

仅排列在工作表的一列或一行中的数据可以绘制到饼图中。饼图显示一个数据系列中各项的大小与各项总和的比例,数据点显示为整个饼图的百分比。

函数原型:

pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6,

   shadow=False, labeldistance=1.1, startangle=None, radius=None)

参数: x (每一块)的比例,如果sum(x) > 1会使用sum(x)归一化

labels (每一块)饼图外侧显示的说明文字

explode (每一块)离开中心距离

startangle 起始绘制角度,默认图是从x轴正方向逆时针画起,如设定=90则从y轴正方向画起

shadow表示是否阴影

labeldistance label绘制位置,相对于半径的比例, 如<1则绘制在饼图内侧

autopct 控制饼图内百分比设置,可以使用format字符串或者format function

'%1.1f'指小数点前后位数(没有用空格补齐)

pctdistance 类似于labeldistance,指定autopct的位置刻度

radius 控制饼图半径

返回值: 如果没有设置autopct,返回(patches, texts)

如果设置autopct,返回(patches, texts, autotexts)

根据电影的长度绘制饼图:

未明学院:Python可视化库Matplotlib绘图入门详解_第15张图片

未明学院:Python可视化库Matplotlib绘图入门详解_第16张图片

绘制直方图

直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。

直方图是数值数据分布的精确图形表示。这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。

为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。这些值通常被指定为连续的,不重叠的变量间隔。间隔必须相邻,并且通常是(但不是必须的)相等的大小。

直方图也可以被归一化以显示“相对”频率。然后,它显示了属于几个类别中的每个案例的比例,其高度等于1。

根据电影的评分绘制直方图:

未明学院:Python可视化库Matplotlib绘图入门详解_第17张图片

hist的参数非常多,但常用的就这七个,只有第一个是必须的,其他是可选的。

arr: 需要计算直方图的一维数组

bins: 直方图的柱数,可选项,默认为10

normed: 是否将得到的直方图向量归一化。默认为0

facecolor: 直方图颜色

edgecolor: 直方图边框颜色

alpha: 透明度

histtype: 直方图类型,‘bar’, ‘barstacked’, ‘step’, ‘stepfilled’

返回值 :

n: 直方图向量,是否归一化由参数normed设定

bins: 返回各个bin的区间范围

patches: 返回每个bin里面包含的数据,是一个list

未明学院:Python可视化库Matplotlib绘图入门详解_第18张图片

你可能感兴趣的:(文章)