关于Matplotlib的使用,几个案例便可以把东西给讲清楚
首先,没有Matplotlib的,通过pip install matplotlib安装
案例一:一个简单的对应和设置
# coding=utf-8
from matplotlib import pyplot as plt
x = range(2, 26, 2)
y = [15, 13, 14.5, 17, 20, 25, 26, 26, 27, 22, 18, 15]
#设置图片大小
plt.figure(figsize=(20,8),dpi=80)
#绘图
plt.plot(x, y) #得保证x,y的维度是一样的
#保存绘制出来的图片,在当前目录保存为1.png
#plt.savefig("./1.png")
#设置x轴的刻度
plt.xticks(x) # 这个参数是一个列表,可以用range动态生成
plt.yticks(range(min(y), max(y)+1))
#展示图形
plt.show()
运行结果:
案例二:温度与时间的折线图
# 时间与温度的变化折线图
from matplotlib import pyplot as plt
import random
import matplotlib
#matplotlib本身并不支持中文,因此得需要通过rc函数来设置,(该方式对mac系统不起作用)
font = {
'family' : 'Microsoft Yahei',
'weight' : 'bold',
'size' : 10.0}
matplotlib.rc("font", **font) #按ctrl+b可以详细看到rc的说明,其需要一个font字典来设置
x = range(0,120) #默认为120分钟
y = [random.randint(20,35) for i in range(120)] # 温度我们随机生成
plt.figure(figsize=(20,8),dpi = 80)
plt.plot(x,y)
#我们将x轴的刻度改成时间格式
_x = list(x)
_xtick_labels = ["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]
plt.xticks(_x[::3],_xtick_labels[::3],rotation = 45) #这里都取步长为3,保证维度一样,且字体逆时针旋转45度
#添加描述信息
plt.xlabel("时间") # x轴描述
plt.ylabel("温度") # y轴描述
plt.title("10~12点,每分钟的温度变化")
plt.show()
运行结果:
技术要点:plt.scatter(x, y)
# 绘制散点图,描述北京2016年三月,10月每天的最高气温,数据存放在y_3,y_10当中
# coding = "utf-8"
from matplotlib import pyplot as plt
import matplotlib
# 设置字体
my_font = 'Microsoft Yahei'
font = {
'family': my_font,
'weight': 'bold',
'size': 10.0}
matplotlib.rc("font", **font)
y_3 = [11, 17, 16, 11, 12, 11, 12, 6, 6, 7, 8, 9, 12, 15, 14, 17, 18, 21, 16, 17, 20, 14, 15, 15, 15, 19, 21, 22, 22,
22, 23]
y_10 = [26, 26, 28, 19, 21, 17, 16, 19, 18, 20, 20, 19, 22, 23, 17, 20, 21, 20, 22, 15, 11, 15, 5, 13, 17, 10, 11, 13,
12, 13, 6]
x_3 = range(1, 32)
x_10 = range(51, 82)
# 设置图片大小
plt.figure(figsize=(20, 8), dpi=80)
# 绘制散点图
plt.scatter(x_3, y_3, label="3月份")
plt.scatter(x_10, y_10, label="10月份")
_x = list(x_3) + list(x_10)
_xticks_labels = ["3月{}日".format(i) for i in x_3]
_xticks_labels += ["4月{}日".format(i) for i in x_10]
plt.xticks(_x[::3], _xticks_labels[::3], font=my_font, rotation=45)
# 添加描述信息
plt.xlabel("时间")
plt.ylabel("温度")
plt.title("温度统计")
# 添加图例
plt.legend(loc="upper left", prop=my_font)
plt.show()
运行结果:
from matplotlib import pyplot as plt
import matplotlib
# 设置字体,使其能够显示中文
my_font = 'Microsoft Yahei'
font = {
'family': my_font,
'weight': 'bold',
'size': 10.0}
matplotlib.rc("font", **font)
#相关数据
a = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归","生化危机6:终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:殊死一战","蜘蛛侠:英雄归来","悟空传","银河护卫队2","情圣","新木乃伊"]
b = [56.01,26.94,17.53,16.49,15.45,12.96,11.8,11.61,11.28,11.12,10.49,10.3,8.75,7.55,7.32,6.99,6.88,6.86,6.58,6.23]
#设置图片大小
plt.figure(figsize=(20,8),dpi = 80)
#竖着画
#plt.bar(range(len(a)), b, width = 0.3)
#plt.xticks(range(len(a)),a,fontproperties = my_font,rotation=90)
#有些电影名字太长了,横着画效果更好一些
plt.barh(range(len(a)), b, height = 0.3, color = "orange")
plt.yticks(range(len(a)),a, fontproperties = my_font)
plt.grid(alpha = 0.3)
plt.show()
绘制三部电影,在三个不同日子的票房对比(涉及多个条形图的绘制)
from matplotlib import pyplot as plt
import matplotlib
my_font = 'Microsoft Yahei'
_width = 0.2
# 设置字体,使其能够显示中文
font = {
'family': my_font,
'weight': 'bold',
'size': 10.0}
matplotlib.rc("font", **font)
a = ["猩球崛起3:终极之战","敦刻尔克","蜘蛛侠:英雄归来","战狼2"]
b_16 = [15746,312,4497,319]
b_15 = [12357,156,2045,168]
b_14 = [2358,399,2358,362]
x_14 = list(range(len(a)))
x_15 = [i+_width for i in x_14]
x_16 = [i+_width*2 for i in x_14]
#设置图像大小
plt.figure(figsize=(20,8),dpi=80)
plt.bar(range(len(a)), b_14, width = _width, label = "9月14日")
plt.bar(x_15,b_15,width=_width, label = "9月15日")
plt.bar(x_16,b_16,width=_width,label = "9月16日")
#设置图例
plt.legend(prop = my_font)
plt.xticks(x_15,a,fontproperties = my_font)
plt.show()
运行结果:
直方图乍一看就是很多连在一起的条形图,很杂乱,但其实,它应用的场景很广泛,如:
"""
假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量,出现的频率)等信息,
"""
from matplotlib import pyplot as plt
import matplotlib
my_font = 'Microsoft Yahei'
# 设置字体,使其能够显示中文
font = {
'family': my_font,
'weight': 'bold',
'size': 10.0}
matplotlib.rc("font", **font)
a=[131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107,
114, 119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128, 128, 115,
99, 136, 126, 134, 95, 138, 117, 111,78, 132, 124, 113, 150, 110, 117, 86, 95,
144, 105, 126, 130,126, 130, 126, 116, 123, 106, 112, 138, 123, 86, 101, 99, 136,
123, 117, 119, 105, 137, 123, 128, 125, 104, 109, 134, 125, 127,105, 120, 107, 129, 116, 108,
132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125, 138, 109, 132, 134,
156, 106, 117, 127, 144, 139, 139, 119, 140, 83, 110, 102,123,107, 143, 115, 136, 118, 139, 123,
112, 118, 125, 109, 119, 133,112, 114, 122, 109, 106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146,
137, 116, 103, 144, 83, 123, 111, 110, 111, 100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110,
111, 109, 141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126,114, 140, 103, 130, 141,
117, 106, 114, 121, 114, 133, 137, 92,121, 112, 146, 97, 137, 105, 98, 117, 112, 81, 97, 139, 113,
134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110,105, 129, 137, 112, 120, 113, 133, 112,
83, 94, 146, 133, 101,131, 116, 111, 84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 133, 150]
#计算组数
d = 3 #组距,尽量让(max(a)-min(a))%d为0,否则,容易发生偏移
num_bins = (max(a) - min(a))//d
#设置图片大小
plt.figure(figsize=(20,8),dpi = 80)
#绘制直方图
plt.hist(a, num_bins, width=d)
plt.grid(alpha = 0.4)
plt.xticks(range(min(a),max(a)+d,d))
plt.show()
运行结果:
如果统计数据已经很明确的情况下,其实是难以绘制直方图的,尤其是下面这种组距不固定的情况,但是我们可以通过条形图的方法,来模拟出来一个直方图
案例:美国2004年人口普查发现有124 million的人在离家相对较远的地方工作。根据他们从家到上班地点所需要的时间,通过抽样统计,统计出相关数据如下:
interval = [0,5,10,15,20,25,30,35,40,45,60,90]
width = [5,5,5,5,5,5,5,5,5,15,30,60]
quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]
其中:
interval: 上班所花费的时间;
width:组距
quantity:人数
from matplotlib import pyplot as plt
import matplotlib
my_font = 'Microsoft Yahei'
# 设置字体,使其能够显示中文
font = {
'family': my_font,
'weight': 'bold',
'size': 10.0}
matplotlib.rc("font", **font)
interval = [0,5,10,15,20,25,30,35,40,45,60,90]
width = [5,5,5,5,5,5,5,5,5,15,30,60]
quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]
l = len(interval)
plt.figure(figsize=(20,8),dpi = 80)
plt.bar(range(l), quantity, width = 1) #width = 1, 各个条之间就会没有间隙
#设置x轴刻度
_x = [i-0.5 for i in range(13)]
_xticks_labels = interval + [150]
plt.xticks(_x, _xticks_labels)
plt.grid()
plt.show()
运行结果:
关于Matplotlib还有许多玩法,如果需要查找资料,可以通过官方链接进行查找:
Matplotlib官方文档