一天一图学Python可视化(2):让条形图更高级

温故知新:

在昨天,我们学习了使用seaborn.lmplot()来绘制回归图,用来表示变量之间的线性关系。它主要是在散点图的基础上,绘制了一条直线,而这条直线(也可以是曲线)则表明了模型预测的变量之间的关系。忘记的同学可以回去再看一遍。

今天,我们的目标是从一个小案例中学习以下几点:

  1. 调色板
  2. 条形图
  3. 图形矩阵(多子图)

条形图矩阵

老规矩,我们先看代码和效果,然后再详解每一个细节。

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style="white", context="talk")
rs = np.random.RandomState(8)

# 设置matplotlib图形和坐标轴对象
f, (ax1, ax2, ax3) = plt.subplots(3, 1, figsize=(7, 5), sharex=True)

# 生成一些序列数据
x = np.array(list("ABCDEFGHIJ"))
y1 = np.arange(1, 11)
sns.barplot(x=x, y=y1, palette="rocket", ax=ax1)
ax1.axhline(0, color="k", clip_on=False)
ax1.set_ylabel("Sequential")

# 让数据围绕着0点发散
y2 = y1 - 5.5
sns.barplot(x=x, y=y2, palette="vlag", ax=ax2)
ax2.axhline(0, color="k", clip_on=False)
ax2.set_ylabel("Diverging")

# 随机调整数据的顺序,构造定性数据
y3 = rs.choice(y1, len(y1), replace=False)
sns.barplot(x=x, y=y3, palette="deep", ax=ax3)
ax3.axhline(0, color="k", clip_on=False)
ax3.set_ylabel("Qualitative")

# 调整图形细节
sns.despine(bottom=True)
plt.setp(f.axes, yticks=[])
plt.tight_layout(h_pad=2)

一天一图学Python可视化(2):让条形图更高级_第1张图片

可以看到,我们实现了一个3 * 1的图形矩阵,每个子图由一幅条形图占据,且他们被我们分别指定了不同的色彩组合。

那么接下来,我们就来看一下它们是如何一步步实现的吧!

  • 第一步,我们导入了必要的库numpyseabornmatplotlib.pyplot;设置seaborn的主题为white,设置背景风格为talk(这里不熟悉的同学可以去看我之前讲解Seaborn的文章中“让图形更美观”那一篇);然后使用numpy的随机工具设置了一个随机种子,在同样的随机种子下,可以保证大家生成的数据和这里的一致;

  • 第二步,我们用plt.subplots()生成了一个整体大小为(7,5)的图形对象,同时我们将它分割为三行一列的三张子图,并且设置它们共享同一个X轴。plt.subplots()对象在生成后会返回两个数据,第一个是这个图形对象,即figure对象;第二个则是以元组的方式返回所有的坐标轴对象axes,在这里有三个坐标轴对象,我们直接将其解析了出来。我们也可以使用fig, axes = plt.subplots(...),然后通过axes[0]、axes[1]这样的方式去调用每个坐标轴对象;

  • 第三步,我们先将A-J这样一串字符转换成numpy数组,作为x轴对应的分类数据;然后我们用numpy.arange(1, 11)生成一组整数数组,arangerange()类似,区别在于前者生成一个numpy数组,后者生成一个迭代器,需要使用list(range(1, 11))或者使用tuple等将其转化成序列类数据;然后我们用sns.barplot()ax1坐标轴上绘制了一个条形图,并且指定调色板为rocket,这是一个用于表现连续数据的调色板,他们色调一致,但是会根据数值的大小调整色彩的亮度和饱和度。我们用x / y参数指定了横坐标和纵坐标的数据;然后我们使用坐标轴对象的axhline()函数添加了一条纵坐标为0的水平参考线,并设置y轴标签为“Sequential”(这里不熟悉的可以去看我的从零开始学Python可视化系列的第一篇文章);

  • 第四步,我们将y轴数据调整为发散型(可以理解为围绕0点向两边发散的数据,事实上这里主要是对应了发散型的调色板,即正负值各对应一个色调,然后根据绝对值的大小调整亮度和饱和度);然后我们使用同样的方式在ax2上绘制了条形图,并设置了调色板为vlag;然后我们添加了参考线,设置纵轴标签为“Diverging”;

  • 第五步,我们使用刚才的随机对象将数据随机排了顺序,假装它们是一组定性数据(分类数据),然后用了一组分类(色调不同)的调色板,并将图形绘制在ax3,添加了参考线,设置总轴标签为“Qualitative”;

  • 第六步,我们用sns.despine(bottom=True)去掉了上、右和下边界。注意,这里despine()函数默认会去除上方和右侧的边界,如果想要去掉左边和下方的边界,就需要额外指定left=True, bottom=True;然后用plt.setp(f.axes, yticks=[])去除了所有的纵轴刻度尺,这里用plt.setp()是控制的整个图的属性,而非某个坐标轴的属性,然后我们指认了图中所有的坐标轴(通过f.axes)作为调整对象,并将他们的刻度设置为空列表;最后我们用plt.tight_layout()函数设置了每行坐标轴(子图)之间的间隔(用w_pad即可设置每列子图之间的间隔)。

好了,我们在今天尝试了条形图、调色板、子图(矩阵图)、参考线等知识点的使用,你学会了吗?

你可能感兴趣的:(一图胜千言,Python可视化教程)