import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import font_manager
一般条形图使用 pyplot.bar()
函数绘制,其形式及参数如下:
matplotlib.pyplot.bar(x, height, width=0.8, bottom=None, *, align='center', data=None, **kwargs)
主要参数解释:
# x:一个数组或者列表,代表需要绘制的条形图的x轴的坐标点。
# height:一个数组或者列表,代表需要绘制的条形图y轴的坐标点。
# width:每一个条形图的宽度,默认是0.8的宽度。
# bottom:y轴的基线,默认是0,也就是距离底部为0.
# align:对齐方式,{'center','edge'},默认是center,居中对齐;edge为靠边对齐,具体靠右边还是靠左边,看width的正负。
# color:条形图的颜色。
# edgecolor : 条形图边框的颜色。
# linewidth : 条形图边框的宽度。如果为 0,则不绘制边框
pyplot.bar()完整参数戳这里
示例:
某天电影票房数据:
movies = {
"流浪地球":40.78,
"飞驰人生":15.77,
"疯狂的外星人":20.83,
"新喜剧之王":6.10,
"廉政风云":1.10,
"神探蒲松龄":1.49,
"小猪佩奇过大年":1.22,
"熊出没·原始时代":6.71
}
直接通过获取字典的键值作为x,y轴数据
#票房单位亿元
movies = {
"流浪地球":40.78,
"飞驰人生":15.77,
"疯狂的外星人":20.83,
"新喜剧之王":6.10,
"廉政风云":1.10,
"神探蒲松龄":1.49,
"小猪佩奇过大年":1.22,
"熊出没·原始时代":6.71
}
# 中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['font.size'] = 13
# 设置图大小
plt.figure(figsize=(15,8))
x = list(movies.keys()) # 获取x轴数据(字典的键)
y = list(movies.values()) # 获取y轴数据(字典的值)
plt.bar(x,y,width=0.5,bottom=0,align='edge',color='g',edgecolor ='r',linewidth=2)
# 绘制标题
plt.title("电影票房数据",size=26)
# 设置轴标签
plt.xlabel("电影名",size=28)
plt.ylabel("票房/亿",size=28)
plt.show()
也可以利用字典创建DataFrame索引,通过data参数传入
#票房单位亿元
movies = {
"流浪地球":40.78,
"飞驰人生":15.77,
"疯狂的外星人":20.83,
"新喜剧之王":6.10,
"廉政风云":1.10,
"神探蒲松龄":1.49,
"小猪佩奇过大年":1.22,
"熊出没·原始时代":6.71
}
movies_df = pd.DataFrame(data={"name":list(movies.keys()),"tickes":list(movies.values())}) #通过字典创建DataFrame索引
font = font_manager.FontProperties(fname='C:\Windows\Fonts\STSONG.TTF',size=12) # 使用font_manager模块设置中文
# 设置图的大小,传入x,y
plt.figure(figsize=(14,5))
# 使用plt.bar()绘制条形图
plt.bar("name","tickes",data=movies_df,width=0.5,bottom=0,align='edge',color='g',edgecolor ='r',linewidth=2)
#设置X轴刻度,设置字体,也可以设置字体大小size
plt.xticks(fontproperties=font)
# 设置标题
plt.title("电影票房数据",size=30)
#设置X,Y轴名字
plt.ylabel('票房',fontproperties=font,size=25)
plt.xlabel('影片名字',fontproperties=font,size=25)
#设置Y刻度
plt.yticks(range(0,50,5),["%d"%x for x in range(0,50,5)],fontproperties=font1,size=20)
# 只保留图形信息
plt.show()
横向条形图需要使用barh()
这个跟bar非常的类似,只不过把方向进行旋转。参数也和pyplot.bar()
类似
matplotlib.pyplot.barh(y, width, height=0.8, left=None, *, align='center', **kwargs)
# 主要参数解释:
# y:数组或列表,代表需要绘制的条形图在y轴上的坐标点。
# width:数组或列表,代表需要绘制的条形图在x轴上的值(也就是长度)。
# height:条形图的高度(宽度),默认是0.8。
# left:条形图的基线,也就是距离y轴的距离。默认为0
pyplot.barh()完整参数
示例:
plt.barh()
movies = {
"流浪地球":40.78,
"飞驰人生":15.77,
"疯狂的外星人":20.83,
"新喜剧之王":6.10,
"廉政风云":1.10,
"神探蒲松龄":1.49,
"小猪佩奇过大年":1.22,
"熊出没·原始时代":6.71
}
font2 = font_manager.FontProperties(fname='C:\Windows\Fonts\STSONG.TTF')
x1 = list(movies.keys())
y1 = list(movies.values())
# 设置图的大小
plt.figure(figsize=(10,5))
# 使用plt.barh()
plt.barh(x1,y1,height=0.7,left=0,color='c',edgecolor='r')
#设置Y轴刻度,设置字体,也可以设置字体大小size
plt.yticks(fontproperties=font2,size=20)
plt.xlabel("票房/亿",size=20)
# 设置标题
plt.title("电影票房数据",size=30)
# 只保留图形信息
plt.show()
Axes.barh(y, width, height=0.8, left=None, *, align='center', **kwargs)
另外,还可通过返回的axes对象绘制图形
movies = {
"流浪地球":40.78,
"飞驰人生":15.77,
"疯狂的外星人":20.83,
"新喜剧之王":6.10,
"廉政风云":1.10,
"神探蒲松龄":1.49,
"小猪佩奇过大年":1.22,
"熊出没·原始时代":6.71
}
font2 = font_manager.FontProperties(fname='C:\Windows\Fonts\STSONG.TTF')
mdf = pd.DataFrame(data={"name":list(movies.keys()),"tickes":list(movies.values())})
fig,axes = plt.subplots()
# 通过返回的axes对象绘制图形
axes.barh("name","tickes",data = mdf,height=0.6,left=0,color='c',edgecolor='r')
#设置Y轴刻度,设置字体,也可以设置字体大小size
plt.yticks(fontproperties=font2,size=20)
plt.xlabel("票房/亿",size=24)
# 设置标题
plt.title("电影票房数据",size=27)
# 只保留图形信息
plt.show()
五天的电影票房数据(假设日期为1.1-1.5):并转换为DataFrame索引
movies = {
"流浪地球":[2.01,4.59,7.99,11.83,16],
"飞驰人生":[3.19,5.08,6.73,8.10,9.35],
"疯狂的外星人":[4.07,6.92,9.30,11.29,13.03],
"新喜剧之王":[2.72,3.79,4.45,4.83,5.11],
"廉政风云":[0.56,0.74,0.83,0.88,0.92],
"神探蒲松龄":[0.66,0.95,1.10,1.17,1.23],
"小猪佩奇过大年":[0.58,0.81,0.94,1.01,1.07],
"熊出没·原始时代":[1.13,1.96,2.73,3.42,4.05]
}
mdf = pd.DataFrame(movies)
mdf
绘制分组条形图思路:先选出每天所有电影的票房数据,可使用DataFrame.iloc[]
方法获取,例如
# 获取第一天票房数据
mdf.iloc[0]
流浪地球 2.01
飞驰人生 3.19
疯狂的外星人 4.07
新喜剧之王 2.72
廉政风云 0.56
神探蒲松龄 0.66
小猪佩奇过大年 0.58
熊出没·原始时代 1.13
Name: 0, dtype: float64
然后按天进行绘制,这里需要确定一个中心点作为中间日期的条形图位置(这里为第三天),有多少部电影就需要多少个中心点,可使用np.arange(len(movies))
获取x轴刻度作为中心点。最后根据日期按条形图的宽度调整条形图位置即可。
plt.figure(figsize=(15,5))
# 设置X轴刻度为一个数组(有广播功能)
xticks = np.arange(len(movies))
#设置字体
font = font_manager.FontProperties(fname='C:\Windows\Fonts\STSONG.TTF')
# 设置条形图宽度
bar_width = 0.15
#设置第一天所有影片条形图的位置
plt.bar(xticks-2*bar_width,mdf.iloc[0],width=bar_width,color='pink') # iloc[]取DataFrame的一行
#设置第二天所有影片条形图的位置
plt.bar(xticks-bar_width,mdf.iloc[1],width=bar_width)
#设置第三天所有影片条形图的位置,默认在[0 1 2 3 4 5 6 7]center处
plt.bar(xticks,mdf.iloc[2],width=bar_width)
#设置第四天所有影片条形图的位置
plt.bar(xticks+bar_width,mdf.iloc[3],width=bar_width)
#设置第五天所有影片条形图的位置
plt.bar(xticks+2*bar_width,mdf.iloc[4],width=bar_width)
# 设置X轴信息
plt.xticks(xticks,mdf.columns,fontproperties=font,size=15)
#设置Y刻度
plt.yticks(range(0,20,2),["%d"%x for x in range(0,20,2)],fontproperties=font,size=16)
#设置X,Y轴名字
plt.ylabel('票房/亿',fontproperties=font,size=30)
plt.xlabel('影片名字',fontproperties=font,size=30)
# 设置标题
plt.title("五日票房数据",fontproperties=font,size=30)
# 只保留图形信息
plt.show()
使用循环绘制每日数据
plt.figure(figsize=(16,5))
# 设置X轴刻度为一个数组(有广播功能)
#xticks1 = np.arange(len(movies)) # 这样设置每部电影X轴的距离是1,如果5个条形图宽度之后大于1会和其他电影重叠,可以设置步长
xticks1 = np.arange(0,7*len(movies),7) # 改变步长,要在设置X轴信息处改变xticks(步长*ticks labels)的第一个参数,否则对应不上
#设置字体
font4 = font_manager.FontProperties(fname='C:\Windows\Fonts\STSONG.TTF')
# 设置条形图宽度
bar_width1 = 1.05
#使用循环画出前五天的条形图
for index in mdf.index:
# plt.bar(xticks1+(-2+index)*bar_width1,mdf.iloc[index],width=bar_width1,label='第%d天票房'%(index+1))
xs = xticks1+(-2+index)*bar_width1 # 在X轴的位置
day_tickets = mdf.iloc[index]
plt.bar(xs,day_tickets,width=bar_width*7,label="第%d天票房"%(index+1))
#设置注释文本
# zip(day_tickets,xs)打包为元素为元组的列表,元素个数与最短的列表一致
for ticket,x in zip(day_tickets,xs): # ticket是day_tickets列表的值,x是xs的值
plt.annotate(ticket,xy=(x,ticket),xytext=(x-0.2,ticket+0.1))
# 设置X轴信息
plt.xticks(7*xticks,mdf.columns,fontproperties=font4,size=15)
#设置X,Y轴名字
plt.ylabel('票房/亿',fontproperties=font4,size=25)
plt.xlabel('影片名字',fontproperties=font4,size=25)
# 设置标题
plt.title("五日票房数据",fontproperties=font4,size=30)
# 设置图例
font4.set_size(15) # 图例无size属性,可以在字体设置font4中改大小(或者font.set_size():只改图例
plt.legend(prop=font4) # 根据bar()函数的中的label标签进行设置,不可缺少
# 设置网格
plt.grid()
# 只保留图形信息
plt.show()
堆叠条形图就是在已有数据基础位置上进行绘制图形,使用bottom
参数,以已有数据作为新数据的基地进行新数据的绘制,可以达到调整条形图的位置的目的。
示例:
# 男女不同组别的等分情况
menMeans = (20, 35, 30, 35, 27)
womenMeans = (25, 32, 34, 20, 25)
groupNames = ('G1','G2','G3','G4','G5')
xs = np.arange(len(menMeans)) # 有多少个组
font5 = font_manager.FontProperties(fname='C:\Windows\Fonts\STSONG.TTF',size=16)
plt.figure(figsize=(15,7))
# 绘制男性得分
plt.bar(xs,menMeans,label='男性得分',width=0.4)
# 绘制女性得分,以男性得分的最大值为基底
plt.bar(xs,womenMeans,bottom=menMeans,label='女性得分',width=0.4)
#设置图例
plt.legend(prop=font5) # 根据bar()函数的中的label标签进行设置
# 设置X轴刻度名称
plt.xticks(xs,groupNames)
# 设置标签
plt.xlabel("组别",fontproperties=font5,size=23)
plt.ylabel("得分",fontproperties=font5,size=23)
# 设置标题
plt.title("男女不同组别得分",fontproperties=font5,size=28)
# 只保留图形
plt.show()