python数据可视化之matplotlib精进pdf_Python数据可视化之matplotlib

数据可视化能让人们更直观的传递数据所要表达的信息。Python 中有两个专用于可视化的库,matplotlib 和 seaborn ,本文将介绍matplotlib。Matplotlib:基于Python的绘图库,提供完全的 2D 支持和部分 3D 图像支持。

Seaborn:该 Python 库能够创建富含信息量和美观的统计图形。Seaborn 基于 matplotlib,具有多种特性,比如内置主题、调色板、可视化单变量数据、双变量数据,线性回归数据和数据矩阵以及统计型时序数据等,能让我们创建复杂的可视化图形。

一、python代码实现(matplotlib库)

1、导入数据库

import matplotlib.pyplot as plt

# 我们最常用matplotlib中的pyplot模块,别名设置为plt是约定俗称常用,也可以自己设置

2、作图

结合实际绘画过程,我们来理解一下用python作图,每一行代码的意义:

图形种类很多,根据实际项目需求,绘制不同类型的图像,很多时候我们会融合多种图像,从不同角度分析结果:数值型:散点图

时间序列:折线图

分类数据:柱状图

颜色:热图下面介绍一下常见的图以及常用的属性

2.1 散点图

x=[0.5,0.75,1,2,3,3.5,4,5.5] # 某学生不同科目的学习时间

y=[10,22,25,40,50,70,90,93] # 对应不同科目的分数

# 画散点图

plt.scatter(x,y,s=200) # s表示设置散点的大小

#设置图标标题

plt.title('学生分数情况',fontsize =24)

# 设置坐标轴标签

plt.xlabel('学习时间')

plt.ylabel('考试分数')

plt.show()

2.2 折线图

# 折线图

x=[1,2,3,4,5]

y=[10,20,20,35,30]

# 作图

'''

linewidth:修改线条宽度

color: 修改线条颜色

marker: 点的形状,o表示点为圆圈标记

linestyle:线条的形状,dash表示用虚线连接,也可以直接用'--'表示

label: 增加图例

'''

plt.plot(x,y,linewidth=3,color='red',marker='o',linestyle='--',label='我是图例')

# 显示图例

plt.legend(loc = 'upper left') # loc设置图例位置

# 设置图标的标题,并且给坐标轴加上标签

plt.title('我是标题',fontsize=20) #fontsize 修改标题大小

plt.xlabel('我是横轴')

plt.ylabel('我是纵轴')

我们希望x轴的刻度是0,1,2,3,4……,y轴的刻度是0,10,20,30……,所以我们需要手动设置。

# 修改坐标轴范围——方法1

plt.xticks([0,1,2,3,4,5,6]) # 直接以列表形式给出横轴

plt.yticks(np.linspace(0,40,5)) # 利用linspace()可以生成制定范围均匀分布的数,给出纵轴

# 修改坐标轴范围——方法2

'''

axis:坐标轴范围

语法:axis[xmin,xmax,ymin,ymax]

也就是axis[x轴最小值,x轴最大值,y轴最小值,y轴最大值,]

'''

plt.axis([0,6,0,40])

'''

使用数组同时绘制多个线性

'''

x= np.arange(0,20,0.2)

y1 = x

y2 = x**2

y3 = x**3

# 使用plot绘制线条

lineList = plt.plot(x,y1,x,y2,x,y3)

# 使用setp方法可以同时设置多个线条的属性

plt.setp(lineList,color='r')

plt.show()

如何在图上添加文本注释:

# 数据

x=[1, 2, 3, 4]

y=[1, 4, 9, 16]

# 作图

plt.plot(x,y ,color='r')

# 添加坐标轴名称

plt.xlabel('我是x轴')

plt.ylabel('我是y轴')

# 添加注释

'''

参数名xy:箭头注释中箭头所在位置,

参数名xytext:注释文本所在位置,

arrowprops在xy和xytext之间绘制箭头,

shrink表示注释点与注释文本之间的图标距离

# '''

plt.annotate('我是注释',xytext=(2,10) ,xy =(2,4.5),arrowprops=dict(facecolor='black',shrink=0.02))

如何将多个子图画在一个图板上:

# 数据

x= np.arange(0,8,0.2)

y1 = x

y2 = x**2

y3 = x**3

# 创建画板

plt.figure(figsize=(3*4,1*3)) # figsize(画板宽度,画板高度),宽度决定列数,高度决定行数

ax1 = plt.subplot(1,3,1)

plt.plot(x,y1)

plt.title('我是y1对应的图')

# 创建画纸2并作图

ax2 = plt.subplot(1,3,2)

plt.plot(x,y2)

plt.title('我是y2对应的图')

# 创建画纸3并作图

ax3 = plt.subplot(1,3,3)

plt.plot(x,y3)

plt.title('我是y3对应的图')

plt.show()

2.3 柱状图

2.3.1 单系列柱状图

# 柱状图

# 数据

x = np.array(list('ABCDEF'))

y = np.random.randint(1,100,6)

# 作图

# x,y参数:x,y值

# width:宽度比例

# facecolor柱状图里填充的颜色

plt.bar(x,y,width=0.5,facecolor='lightblue')

plt.show()plt.bar - 这个网站可出售。 - 最佳的Server monitoring 来源和相关信息。# 柱状图

# 数据

x = np.array(list('ABCDEF'))

y = np.random.randint(1,100,6)

# 作图

# x,y参数:x,y值

# width:宽度比例

# facecolor柱状图里填充的颜色

plt.bar(x,y,width=0.5,facecolor='lightblue')

plt.show()

2.3.2 多系列柱状图

之前我们都是用plt来作图,事实上pandas也可以直接作图,下面就展示一下如何用pandas作多系列柱状图:

# 数据

df = pd.DataFrame(np.random.rand(10,3)*20,columns=['a','b','c'])

df

# 之前都是用plt作图,其实DataFrame也可以作图

df.plot(kind='bar')

plt.show()

图以DataFrame的index为横轴,columns为纵轴,自动生成了图例。

# 柱状图的填充颜色也可以更改

df.plot(kind='bar',colormap='Blues_r',grid=True) # grid显示网格线

plt.show()

2.3.3 堆叠图

df.plot(kind='bar',grid = True,stacked=True)

# 多系列堆叠图

# stacked → 堆叠

plt.show()

2.4 热图

# 利用随机数生成一个二维数据(5*5)

data=[]

for i in range(5):

temp = list(np.random.randint(10,50,4))

data.append(temp)

data

# 作图并选择热图的颜色填充风格,这里选择hot

from matplotlib import cm

plt.imshow(data,cmap=plt.cm.hot_r)

#设置标题,横纵坐标

plt.title('我是标题')

# 增加右侧颜色进度条

plt.colorbar()

plt.show()

颜色越深,表明数字越大。

你可能感兴趣的:(python数据可视化之matplotlib精进pdf_Python数据可视化之matplotlib)