04数据可视化

Matplotlib:

一个python版的matlab绘图接口,以2D为主,支持python、numpy、pandas基本数据结构

1、Matplotlib主要组成部分:

(1)Figure:在任何绘图之前,我们需要一个Figure对象,可以把他理解成我们需要的一张画布;fig = plt.figure()

(2)Axes:拥有画布后,在作画前我们还需要轴,没有轴的话就没有绘图基准,所以需要添加Axes,也称为轴域区,或者绘图区;

ax=fig.add_axes([0,0,1,1]):通过调用 add_axes() 方法能够将 axes 对象添加到画布中,该方法用来生成一个 axes 轴域对象,对象的位置由位置参数rect决定(由 4 个元素组成的浮点数列表,形如 [left, bottom, width, height] ,它表示添加到画布中的矩形区域的左下角坐标(x, y),以及宽度和高度)

subplot()函数:可以将一张画布划分为若干个子区域;

ax=fig.add_subplot(111)在画板的第1行第1列的第一个位置生成一个Axes对象来准备作画;

subplots()函数:subplots() 既创建了一个包含子图区域的画布,又创建了一个 figure 图形对象;fig , ax = plt.subplots(nrows, ncols)

(3)Axis:指坐标系中的垂直轴与水平轴,包含轴的长度大小、轴标签和刻度标签;

2、基本的绘图plt.plot()

plt.plot(kind='line', ax=None, figsize=None, use_index=True, title=None, grid=None, legend=False, style=None, logx=False, logy=False, loglog=False, xticks=None, yticks=None, xlim=None, ylim=None,rot=None, fontsize=None, colormap=None, table=False, yerr=None, xerr=None, label=None, secondary_y=False,等)

也可以plt.plot.

参数说明:

kind :默认折线图,line,bar...(折线图,柱状图...)

label : 图例标签,Dataframe格式以列名为label

style : 风格字符串,这里包括了linestyle(-),marker(.),color(g)

color : 颜色,有color指定时候,以color颜色为准

alpha : 透明度,0-1

use_index : 将索引用为刻度标签,默认为True

rot :旋转刻度标签,0-360

grid : 显示网格,一般直接用plt.grid

xlim,ylim :x,y轴界限

xticks,yticks : x,y轴刻度值

figsize:图像大小

title : 图名

legend : 是否显示图例,一般直接用plt.legend()


3.主要图表绘制

面积图:plt.plot.area()

填图:plt.fill(), plt.fill_between()

饼图:plt.pie()

直方图:plt.hist()

散点图:plt.scatter()

箱型图:plt.plot.box(),plt.boxplot()


4.实践任务

任务1:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)

任务2:计算出泰坦尼克号数据集中男女中死亡人数,并可视化展示

unstack()数据旋转

任务3:可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)

stacked='True' (柱子堆叠)

任务4:可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)

任务5:可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)

任务6:可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况。(不限表达方式)

直方图+密度图

任务7:可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。(用折线图试试)

你可能感兴趣的:(04数据可视化)