【机器学习】Python数据分析-图形绘制库Matplotlib

一、Matplotlib概述:

官网地址:Matplotlib: Python plotting — Matplotlib 3.4.3 documentation

【机器学习】Python数据分析-图形绘制库Matplotlib_第1张图片

  • Matplotlib是专门用于开发2D图标(包括3D图表)
  • 以渐进、交互式方式实现数据可视化

二、简单案例:

import matplotlib.pyplot as plt

# 1.创建画布:
plt.figure(figsize=(20,8),dpi=100)

# 2.绘制图像:
x = [1,2,3]
y = [4,5,6]
plt.plot(x,y)

#3.显示图像:
plt.show()

【机器学习】Python数据分析-图形绘制库Matplotlib_第2张图片


三、Matplotlib三层结构

1.容器层:

        容器层主要是由Canvas、Figure、Axes组成。

        Canvas是位于最低层得系统层,在绘图过程中充当画板得角色,即放置画布(Figure)的工具。

        Figure是Canvas上方的第一层,也是需要用户来操作的应用层的第一层,在绘图的过程中充当画布的角色。

        Axes是应用层的第二层,在绘图过程中相当于画布上的绘画区角色。

  • Figure:指整个图形(可以通过plt.figure()设置画布大小和分辨率等)
  • Axes(坐标系):数据的绘图区域
  • Axis(坐标轴):坐标系中的一条轴,包含大小限制、刻度和刻度标签

特点:

  • 一个Figure(图像)可以包含多个Axes(坐标系、绘图区),但是一个Axes只能属于一个Figure。
  • 一个Axes(坐标系、绘图区)可以包含多个Axis(坐标轴),包含2个Axis即为2D坐标系,包含3个即为3D坐标系。

2.辅助显示层:

        辅助显示层位Axes(绘图区)内的除了根据数据绘制出的图像以外的内容,主要包括Axes外观(facecolor)、边框线(spines)、坐标轴(Axis)、坐标轴刻度(tick)、坐标轴刻度标签(tick label)、网格线(grid)、标题(title)等内容。

        该层的设置可以使用图像显示更加直接更加容易被用户理解,但又不会对图像产生实质性的影响。

3.图像层:

        图像层是指Axes内通过plot、bar、histogram、pie等函数根据数据绘制出来的图像。

【机器学习】Python数据分析-图形绘制库Matplotlib_第3张图片


四、折线图(plot)与基础绘图功能:

1.折线图绘制与图片保存:

1.1 matplotlib.pypolt模块:

        matplotlib.pyplot包含了一系列类似于matlab的画图函数。它的函数作用于当前图形(Figure)的当前坐标系(Axes)

import matplotlib.pyplot as plt

1.2 折线图的绘制和显示:

import matplotlib.pyplot as plt

# 1.创建画布:
plt.figure(figsize=(10,10))

# 2.绘制折线图(图像层)
plt.plot([1,2,3,4,5,6,7],[17,17,28,24,23,12,32])

# 3.显示图层
plt.show()

#注意:show函数会自动释放内存资源!!!

【机器学习】Python数据分析-图形绘制库Matplotlib_第4张图片

1.3 设置画布属性与图片保存:

plt.figure(figuresize=(), dpi= )
	figsize:指定图的长度
    dpi:图像的清晰度
    返回fig对象
    
plt.savefig(path)
注意:plt.show()会释放figure资源,如果在显示图像之后保存图片,将会只能保存空图片。

# 2.1 保存绘制的图片
plt.savefig("./data/test.png")

注意:保存的路径需要存在!

2.完善原始折线图(辅助显示层)

案例:显示温度变化状况

需求:画出某城市11点到12点1小时每分钟的温度变化折线图,温度范围在15度~18度

效果:

【机器学习】Python数据分析-图形绘制库Matplotlib_第5张图片

2.1 准备数据并画出初识折线图:

import random

import matplotlib.pyplot as plt

# 定义数据集
x = range(60)
y_chongqing = [random.uniform(15, 18) for i in x]

# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)

# 2.绘制折线图
plt.plot(x, y_chongqing)

# 3.显示图像
plt.show()

【机器学习】Python数据分析-图形绘制库Matplotlib_第6张图片

2.2 添加自定义X,Y刻度:

  • plt.xticks(x, **kwargs):x:要显示的刻度值
  • plt.yticks(y, **kwargs):y:要显示的刻度值
# 增加以下两行代码

# 构造x轴刻度标签
x_ticks_label = ["11点{}分".format(i) for i in x]
# 构造y轴刻度
y_ticks = range(40)

# 修改x,y轴坐标的刻度显示
plt.xticks(x[::5], x_ticks_label[::5])
plt.yticks(y_ticks[::5])
import random

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 黑体

# 定义数据集
x = range(60)
y_chongqing = [random.uniform(15, 18) for i in x]

# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)

# 2.绘制折线图
plt.plot(x, y_chongqing)

# 添加x,y轴刻度
y_ticks = range(40)
x_ticks_able = ["11点{}分".format(i) for i in x]

plt.yticks(y_ticks[::5])
plt.xticks(x[::5], x_ticks_able[::5])

# 2.1 保存图片
plt.savefig('../img/demo05.png')

# 3.显示图像
plt.show()

【机器学习】Python数据分析-图形绘制库Matplotlib_第7张图片

解决坐标轴显示中文问题:

解决方案一:

下载中文字体(黑体,看准系统版本)

  1. 下载SimHei字体(或者其它支持中文显示的字体也行)
  2. 安装字体
    • Linux下:拷贝字体到usr/share/fonts下:
sudo cp ~/SimHei.ttf /usr/share/fonts/SimHei.ttf
    • Windows和mac下:双击安装
  1. 删除~/.matplotlib中的缓存文件
cd ~/.matplotlib
rm -r *
  1. 修改配置文件matplotlibrc
vi ~/.matplotlib/matplotlibrc

将文件内容修改为:

font.family         : sans-serif
font.sans-serif     : SimHei
axes.unicode_minus  : False

解决方案二:

在Python脚本中动态设置,这样也可以避免由于更改配置文件而造成的麻烦,具体代码如下:

# 设置坐标轴显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']

2.3 添加网格信息:

通过添加网格信息,能够更清楚地观察图形对应的值!

plt.grid(True, linestyle='--', alpha=0.7)

【机器学习】Python数据分析-图形绘制库Matplotlib_第8张图片

2.4 添加描述信息:

添加x轴、y轴描述信息及标题

通过fontsize参数可以修改图像中字体的大小

plt.xlabel("时间")
plt.ylabel("温度")
plt.title("中午11点0分到12点之间的温度变化图示", fontsize=20)

【机器学习】Python数据分析-图形绘制库Matplotlib_第9张图片

2.5 图像保存:

# 保存图片到指定路径
plt.savefig("test.png")

注意:plt.show()会释放figure资源,如果在显示图像之后保存图片将只能保存空图片。

import matplotlib.pyplot as plt
import random
from pylab import mpl

# 设置显示中文字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]
# 设置正常显示符号
mpl.rcParams["axes.unicode_minus"] = False

# 0.准备数据
x = range(60)
y_shanghai = [random.uniform(15, 18) for i in x]

# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)

# 2.绘制图像
plt.plot(x, y_shanghai)

# 2.1 添加x,y轴刻度
# 构造x,y轴刻度标签
x_ticks_label = ["11点{}分".format(i) for i in x]
y_ticks = range(40)

# 刻度显示
plt.xticks(x[::5], x_ticks_label[::5])
plt.yticks(y_ticks[::5])

# 2.2 添加网格显示
plt.grid(True, linestyle="--", alpha=0.5)

# 2.3 添加描述信息
plt.xlabel("时间")
plt.ylabel("温度")
plt.title("中午11点--12点某城市温度变化图", fontsize=20)

# 2.4 图像保存
plt.savefig("./test.png")

# 3.图像显示
plt.show()

五、在一个坐标系中绘制多个图像:

1.多次plot:

需求:再添加一个城市的温度变化

收集到北京当天温度变化情况,温度在1度到3度。怎么去添加另一个在同一坐标系当中的不同图形,其实很简单只需要再次plot即可,但是需要区分线条,如下显示

【机器学习】Python数据分析-图形绘制库Matplotlib_第10张图片

# 增加北京的温度数据
y_beijing = [random.uniform(1, 3) for i in x]

# 绘制折线图
plt.plot(x, y_shanghai)
# 使用多次plot可以画多个折线
plt.plot(x, y_beijing, color='r', linestyle='--')

我们仔细观察,用到了两个新的地方,一个是对于不同的折线展示效果,一个是添加图例。

2.设置图形风格:

颜色字符

风格字符

r 红色

- 实线

g 绿色

- - 虚线

b 蓝色

-. 点划线

w 白色

: 点虚线

c 青色

' ' 留空、空格

m 洋红

y 黄色

k 黑色

3.显示图例:

注意:如果只在plt.plot()中设置label还不能最终显示出图例,还需要通过plt.legend()将图例显示出来。

# 绘制折线图
plt.plot(x, y_shanghai, label="上海")
# 使用多次plot可以画多个折线
plt.plot(x, y_beijing, color='r', linestyle='--', label="北京")

# 显示图例
plt.legend(loc="best")

【机器学习】Python数据分析-图形绘制库Matplotlib_第11张图片

Location String

Location Code

'best'

0

'upper right'

1

'upper left'

2

'lower left'

3

'lower right'

4

'right'

5

'center left'

6

'center right'

7

'lower center'

8

'upper center'

9

'center'

10

4.完整代码:

import random
import matplotlib.pyplot as plt

# 设置坐标轴显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']

# 创建数据集
x = range(60)  # 范围值

y_beijing = [random.uniform(1, 3) for i in x]
y_chongqing = [random.uniform(15, 18) for i in x]

# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)

# 2.绘制折线图
plt.plot(x, y_chongqing, label="重庆")
plt.plot(x, y_beijing)
plt.plot(x, y_beijing, color='r', linestyle='--', label="上海")

# 设置网格
plt.grid(True, linestyle='--', alpha=0.5)

# 设置描述信息
plt.xlabel("时间")
plt.ylabel("温度")
plt.title("中午11点0分到12点之间的温度变化图示", fontsize=20)

# 显示图例
plt.legend(loc="best")

# 添加x,y轴刻度
y_ticks = range(40)
x_ticks_able = ["11点{}分".format(i) for i in x]

plt.yticks(y_ticks[::5])
plt.xticks(x[::5], x_ticks_able[::5])

# 2.1 保存图片
plt.savefig('../img/demo05.png')

# 3.显示图像
plt.show()

六、多个坐标系显示:

plt.subplots(面向对象的画图方法)

如果我们想要将上海和北京的天气图显示在同一个图的不同坐标系当中,效果如下:

【机器学习】Python数据分析-图形绘制库Matplotlib_第12张图片

可以通过subplots函数实现(旧的版本中有subplot,使用起来不方便),推荐subplots函数

  • matplotlib.pyplot.subplots(nrows=1, ncols=1, **fig_kw) 创建一个带有多个axes(坐标系/绘图区)的图
Parameters:    

nrows, ncols : 设置有几行几列坐标系
    int, optional, default: 1, Number of rows/columns of the subplot grid.

Returns:    
fig : 图对象
axes : 返回相应数量的坐标系

设置标题等方法不同:
    set_xticks
    set_yticks
    set_xlabel
    set_ylabel

注意:plt.函数名()相当于面向过程的画图方法,axes.set_方法名()相当于面向对象的画图方法。

import random
import matplotlib.pyplot as plt

# 设置坐标轴显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']

# 0.数据准备
x = range(60)
y_chongqing = [random.uniform(15, 18) for i in x]
y_shanghai = [random.uniform(1, 5) for i in x]

# 1.创建画布
# plt.figure(figsize=(20, 8), dpi=100)  # 创建一个画布
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(20, 8), dpi=100)

# 2.绘制图像
axes[0].plot(x, y_chongqing, label="重庆")
axes[1].plot(x, y_shanghai, label="上海")

# 2.1 添加x,y轴刻度
# 构造x,y轴刻度
x_ticks_label = ["11点{}分".format(i) for i in x]
y_ticks = range(40)

# 刻度显示
axes[0].set_xticks(x[::5])
axes[0].set_yticks(y_ticks[::5])
axes[0].set_xticklabels(x_ticks_label[::5])

axes[1].set_xticks(x[::5])
axes[1].set_yticks(y_ticks[::5])
axes[1].set_xticklabels(x_ticks_label[::5])

# 2.2 添加显示网格
axes[0].grid(True, linestyle="--", alpha=0.5)
axes[1].grid(True, linestyle="--", alpha=0.5)

# 2.3 添加描述信息
axes[0].set_xlabel("时间")
axes[0].set_ylabel("温度")
axes[0].set_title("中午11点--12点某城市温度变化图", fontsize=20)
axes[1].set_xlabel("时间")
axes[1].set_ylabel("温度")
axes[1].set_title("中午11点--12点某城市温度变化图", fontsize=20)

# # 2.5 添加图例
axes[0].legend(loc=0)
axes[1].legend(loc=0)

# 2.4 图像保存
plt.savefig("../img/demo06.png")

# 3.显示图像
plt.show()

七、常见图形绘制:

Matplotlib能够绘制折线图、散点图、柱状图、直方图、饼图。

1.折线图:

以折线的上升或下降来表示统计数量的增减变化的统计图

特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)

API:

plt.plot(x, y)

【机器学习】Python数据分析-图形绘制库Matplotlib_第13张图片

2.散点图:

用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。

特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)

API:

plt.scatter(x, y)

【机器学习】Python数据分析-图形绘制库Matplotlib_第14张图片

案例:

需求:探究房屋面积和房价关系

房屋面积数据:

x = [225.98, 247.07, 253.14, 457.85, 241.58, 301.01,  20.67, 288.64,
       163.56, 120.06, 207.83, 342.75, 147.9 ,  53.06, 224.72,  29.51,
        21.61, 483.21, 245.25, 399.25, 343.35]

房屋价格数据:

y = [196.63, 203.88, 210.75, 372.74, 202.41, 247.61,  24.9 , 239.34,
       140.32, 104.15, 176.84, 288.23, 128.79,  49.64, 191.74,  33.1 ,
        30.74, 400.02, 205.35, 330.64, 283.45]

完整代码:

# 探究房屋面积和住房价格关系

import matplotlib.pyplot as plt

# 房屋面积数据
x = [225.98, 247.07, 253.14, 457.85, 241.58, 301.01, 20.67, 288.64,
     163.56, 120.06, 207.83, 342.75, 147.9, 53.06, 224.72, 29.51,
     21.61, 483.21, 245.25, 399.25, 343.35]
# 房屋价格数据
y = [196.63, 203.88, 210.75, 372.74, 202.41, 247.61, 24.9, 239.34,
     140.32, 104.15, 176.84, 288.23, 128.79, 49.64, 191.74, 33.1,
     30.74, 400.02, 205.35, 330.64, 283.45]

# 1.构架画布
plt.figure(figsize=(20,8),dpi=100)

# 2.绘制散点图
plt.scatter(x, y)

# 3.显示散点图
plt.show()

【机器学习】Python数据分析-图形绘制库Matplotlib_第15张图片

3.柱状图:

排列在工作表的列或行中的数据可以绘制到柱状图中。

特点:绘制连离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计/对比)

API:

plt.bar(x, width, align="center", **kwargs)
Parameters:    
x : 需要传递的数据

width : 柱状图的宽度

align : 每个柱状图的位置对齐方式
    {‘center’, ‘edge’}, optional, default: ‘center’

**kwargs :
color:选择柱状图的颜色

【机器学习】Python数据分析-图形绘制库Matplotlib_第16张图片

案例:

需求:对比每部电影的票房收入

【机器学习】Python数据分析-图形绘制库Matplotlib_第17张图片

电影数据:

【机器学习】Python数据分析-图形绘制库Matplotlib_第18张图片

数据准备:

['雷神3:诸神黄昏','正义联盟','东方快车谋杀案','寻梦环游记','全球风暴', '降魔传','追捕','七十七天','密战','狂兽','其它']
[73853,57767,22354,15969,14839,8725,8716,8318,7916,6764,52222]

绘制柱状图:

# 对比电影票房收入
import matplotlib.pyplot as plt

# 设置坐标轴显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']

# 0.定义数据集
movie_name = ['雷神3:诸神黄昏', '正义联盟', '东方快车谋杀案', '寻梦环游记', '全球风暴', '降魔传', '追捕', '七十七天', '密战', '狂兽', '其它']
# 横坐标
x = range(len(movie_name))
# 纵坐标
y = [73853, 57767, 22354, 15969, 14839, 8725, 8716, 8318, 7916, 6764, 52222]

# 1.创建画布
plt.figure(figsize=(20, 8), dpi=100)

# 2.绘制柱状图
plt.bar(x, y, width=0.5, color=['b', 'r', 'g', 'y', 'c', 'm', 'y', 'k', 'c', 'g', 'b'])

# 2.1 修改坐标刻度
plt.xticks(x, movie_name)

# 2.2 添加显示网格
plt.grid(linestyle="--", alpha=0.5)

# 2.3 添加标题
plt.title("电影票房对比表")

# 3.显示柱状图
plt.show()

【机器学习】Python数据分析-图形绘制库Matplotlib_第19张图片

4.直方图:

由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据范围,纵轴表示分布情况。

特点:绘制连续性的数据展示一组或者多组数据的分布状况(统计)

API:

matplotlib.pyplot.hist(x, bins=None)
Parameters:    
x : 需要传递的数据
bins : 组距

【机器学习】Python数据分析-图形绘制库Matplotlib_第20张图片

5.饼图:

用于表示不同分类的占比情况,通过弧度大小来对比各种分类。

特点:分类数据的占比情况(占比)

API:

plt.pie(x, labels= , autopic= , colors)
Parameters:  
x:数量,自动算百分比
labels:每部分名称
autopct:占比显示指定%1.2f%%
colors:每部分颜色

【机器学习】Python数据分析-图形绘制库Matplotlib_第21张图片

你可能感兴趣的:(人工智能,python,数据分析,机器学习,人工智能,matplotlib)