第二章 数据可视化——6.21

在完成数据的清理和重构,为了使数据能够更加易于理解,需要将数据进行可视化处理,这里主要用到的是Python数据可视化库Matplotlib。

导入Matplotlib库的时候,有的时候需要加上%matplotlib inline,这句话的功能是:可以内嵌绘图,并且可以省略掉plt.show()这一步。最主要的matplotlib库的操作说明可以参考下图(作者是Datacamp,下载于Python程序员公众号):


以泰坦尼克号数据为例进行一定的数据可视化。

展示数据集中男女生存人数的分布情况:

用柱状堆积图表示不同性别的存活率:

用折线图表示数据集中不同仓位等级的人年龄分布情况:

综上,我觉得数据可视化目的永远不是图做得有多么炫酷,重点是让人能够一目了然知道可视化的图想要传达的信息,当然在这基础上将图做得炫酷和漂亮点是完全可以的。

你可能感兴趣的:(第二章 数据可视化——6.21)