【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程

Python matplotlib绘制双柱状图以及绘制堆积柱状图

  • 双柱状图
    • 一、双柱状图的原理
    • 二、双柱状图的完善
      • 1. 增加图片标题
      • 2. 增加x轴y轴标题
      • 3. 增加x轴注释
    • 四、完整代码
  • 堆积柱状图
    • 一、堆积柱状图的绘制原理
    • 二、plt.bar参数介绍
    • 三、完整代码:

双柱状图

一、双柱状图的原理

绘制双柱状图的原理用最朴素的话来讲就是:

先绘制第一个系列的柱体(如先绘制男生柱体),然后在第一个系列柱状体的右边绘制第二个系列的柱体(如女生柱体)。

这时就需要解决一个问题:应该如何确定第二个系列的柱状体所应在的位置信息呢?要想解决这个问题,就需要了解绘制柱状图plt.bar()中的两个参数:x和width。

x:用于控制主体应该绘制在哪
width:柱状体的宽度

有了这两个参数,便可以知道柱体右侧的位置信息了:x+width

写一份简单的代码示意一下:

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = [u'SimHei'] 
plt.rcParams['axes.unicode_minus'] = False

boyNum=[2, 3, 4]
girlNum=[4, 5, 6]

width=0.4
plt.bar([i for i in range(len(boyNum))], boyNum, width=width, label='男生')
plt.bar([i+width for i in range(len(boyNum))], girlNum, width=width, label='女生')

plt.legend()
plt.show()

结果:
【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第1张图片
这里主要关注这两行代码:

plt.bar([i for i in range(len(boyNum))], boyNum, width=width, label='男生')
plt.bar([i+width for i in range(len(boyNum))], girlNum, width=width, label='女生')

第一行代码是绘制男生系列柱状体,它的位置是:[0, 1, 2],宽度width为0.4
第二行代码是绘制女生系列柱状体,它的位置是:[0+0.4, 1+0.4, 2+0.4],宽度仍为0.4

二、双柱状图的完善

1. 增加图片标题

plt.title('各班级人数')

结果:
【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第2张图片

2. 增加x轴y轴标题

plt.bar([i for i in range(len(boyNum))], boyNum, width=width, label='男生')
plt.bar([i+width for i in range(len(boyNum))], girlNum, width=width, label='女生')

结果:
【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第3张图片

3. 增加x轴注释

我们希望在每两个柱状图中间写上类似:班级一,班级二等,就像这样:

【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第4张图片
那么如何保证注释在两个柱状体之间呢?仔细观察可以发现,注释所在的位置=第一个系列柱体所在的位置+1/2*width

因此,可以使用如下代码解决:

plt.xticks([x+width/2 for x in range(3)], ['班级1', '班级2', '班级3'])

最终的效果图:

【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第5张图片

四、完整代码

import matplotlib.pyplot as plt

plt.rcParams["font.sans-serif"] = [u"SimHei"] 
plt.rcParams["axes.unicode_minus"] = False

totalWidth=0.8 # 一组柱状体的宽度
labelNums=2 # 一组有两种类别(例如:男生、女生)
barWidth=totalWidth/labelNums # 单个柱体的宽度
seriesNums=3 # 一共有3组(例如:3个班级)

plt.bar([x for x in range(seriesNums)], height=[4,5,6], label="男生", width=barWidth)
plt.bar([x+barWidth for x in range(seriesNums)], height=[2,3,4], label="女生", width=barWidth)

plt.xticks([x+barWidth/2*(labelNums-1) for x in range(seriesNums)], ["班级1","班级2","班级3"])
plt.xlabel("班级")
plt.ylabel("人数")
plt.title("班级人数占比")
plt.legend()
plt.show()

堆积柱状图

一、堆积柱状图的绘制原理

如何使用matplotlib绘制简单的柱状图,例如:

import matplotlib.pyplot as plt

plt.bar([1,2,3],[4,5,6])
plt.show()

结果:
【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第6张图片
但是当数据分组分类别的时候例如我们想绘制一下每个班级的男女生人数的时候,我们往往想出来类似这样的效果:
【数据处理】Python matplotlib绘制双柱状图以及绘制堆积柱状图——保姆级教程_第7张图片
那么这种图是怎么做的呢?其实它还是基于plt.bar(),但是更改了部分参数。

二、plt.bar参数介绍

让我们直接看一下matplotlib官方文档【1】是怎么介绍plt.bar()的参数的:

matplotlib.pyplot.bar(x, height, width=0.8, bottom=None, , align='center', data=None, *kwargs)

这里详细介绍bottom参数(堆积柱状图就是基于此参数):

bottom: float or array-like, default: 0

The y coordinate(s) of the bars bases

翻译成中文是什么意思呢?就是说,我们的每一个“柱子”的高度是从y轴的哪一个值开始往上长。还不明白?没关系,还是以班级男女为例:
一开始我们画了一个bar为各班级男性人数:[4,5,6],现在我们再画一个女生bar,但是这次女生bar不再是从0开始,而是分别从[4,5,6]开始,即:

bar1=plt.bar([1,2,3],[4,5,6], label='男生')
bar2=plt.bar([1,2,3],[1,2,3],color='g',bottom=[4,5,6], label='女生')

三、完整代码:

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = [u'SimHei'] 
plt.rcParams['axes.unicode_minus'] = False
bar1=plt.bar([1,2,3],[4,5,6], label='男生')
bar2=plt.bar([1,2,3],[1,2,3],color='g',bottom=[4,5,6], label='女生')
plt.xticks([1,2,3], ['班级1', '班级2', '班级3'])
plt.xlabel('班级')
plt.ylabel('人数')
plt.title('各班级男女人数对比')
plt.legend()
plt.show()

你可能感兴趣的:(数据处理,matplotlib,python,双柱状图,堆积柱状图,数据处理可视化)