pandas数据分析之数据可视化

从DataFrame表格中不易发现数据的特征,可以通过将数据制成图表的方式使数据更直观,从而更方便的分析数据。

pandas没有作图功能,但是可以适配matplotlib和seaborn之类的作图库。导入作图库进行数据类型转换,即可画出图像。

pandas内置的plot可以将DataFrame对象转换为制表数据,之后利用matplotlib的plt.show(),就可以作图。

pandas数据分析之数据可视化_第1张图片

之前学习了unstack函数与stack函数,其实unstack函数除了处理stack()函数返回的数据之外,还有一种用法可以配合GroupBy来使用。

GroupBy函数可以将数据进行多维分组,比如对Sex和Survived两组进行分组,分组之后就是类似Stack函数处理后的类似Series格式。

而这时使用unstack就可以把这个分组数据再转换为二维表,转换出来就像二维概率分布率表类似的那种行和列表示两个变量的格式。

pandas数据分析之数据可视化_第2张图片

pandas其实有多种作图方法,利用plot子类或者plot方法。plot子类包含了很多作图函数,bar()的意思就是作柱状图。

如果plot方法不指定kind,那么默认就是折线图,指定bar就是柱状图。使用matplotlib的方法就可以对图标进行加工,比如添加表头和网格等等。

pandas数据分析之数据可视化_第3张图片

研究两个变量之间相关关系的时候,经常使用分类的柱状图。研究船舱和生存人数关系,也可以先Groupby,再利用unstack()生成二维表再进行作图。

pandas数据分析之数据可视化_第4张图片

如果有多个绘图函数,使用plt.show()时所有的图线都会画在一个图标中。

因为年龄的分布与船舱,性别不同,并不是每个年龄段都有死亡与存活记录,可能有的年龄值只有存活,GroupBy后Unstack会产生空数据,需要分组后使用dropna()进行清洗,再分别作图。 

pandas数据分析之数据可视化_第5张图片

也可以使用更简单的方法制散点图实现

pandas数据分析之数据可视化_第6张图片

 

你可能感兴趣的:(python,数据分析,可视化)