之前逛微博时,看到爱豆排行榜 动态条形图,觉得很好奇,感觉这个动态图用到工作汇报中去会很炫酷,想尝试自己做一下。
搜索了一圈的资料发现是用d3.js做的,而且很麻烦,所以决定先用熟悉的Python实现一下。解决了重重问题终于绘制出了 python版的动态条形图。
数据来源:123粉丝网
图1是用第500期(截止2019年7月6日)到538期(截止2020年3月28日)的数据绘制的动态条形图。我是爬虫爬下来的数据,如果不想爬虫可直接到公众号中回复 "娱乐圈排行榜条形图" ,即可获取数据。
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import pandas as pd
from pandas import concat
import os
os.chdir(r"F:\微信公众号\Python\21.娱乐圈排行榜\2.绘制动图条形图") # 修改当前程序操作的路径
star_man = pd.read_csv("star_man.csv") #读取数据
star_man = star_man.iloc[1:,:] #去除第一行无用数据
代码解析:
import: 加载绘图库、数据处理库、文件路径管理库;
os.chdir: 设置python的工作路径,可以替换成你的路径;
star_man: 读取男明星排行榜数据;
#找到各期前10名的男演员名字
period = sorted(list(star_man.period_num.drop_duplicates().values)) #找出所有期数
all_data = [] #构造存放所有数据的空列表
for i in period:
data = star_man[star_man.period_num==i] #取出某一期的数据
data1 = data.iloc[0:9,:] #取改期数据的前10名信息
all_data.append(data1) #把取出的信息存放到列表中
all_data_1 = concat(all_data) #把列表中存放的数据框连接成一个数据框
#统计出现次数
all_data_1.name.value_counts()
代码解析:
period: 找出所有期数去重,并按从小到大排序;
all_data: 构造存放所有数据的空列表;
for: 构造循环取出每期前10名的信息;
all_data_1: 用concat函数把列表中存放的数据框连接成一个数据框(列表中不仅能存单个元素还可以存数据框);
value_counts(): 统计男演员在前10名中出现的次数;
注:颜色分配是绘制动态条形图的关键,本文按照在前10名中出现次数分配颜色,出现次数越多,给的颜色越深,标注颜色并无其它含义。
# 图形设置
plt.rcParams['figure.figsize'] = (12, 50) # 图像显示大小
plt.rcParams['font.sans-serif'] = ['SimHei'] # 防止中文标签乱码,还有通过导入字体文件的方法
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['lines.linewidth'] = 0.8 # 设置曲线线条宽度
#绘制单个人的图形
person_num = 10 #绘制person_num个人的条形图
data = star_man[star_man.period_num==538] #取某一期(538)的数据
data1 = data.iloc[0:person_num,:].sort_values(by = 'popularity_value', ascending = True) #取person_num个人的数据绘制条形图
name_color = pd.read_csv("name_color1.csv",encoding = 'gbk') #控制每个人绘图的颜色
colors_0 = pd.merge(data1, name_color, how = 'left', on = 'name') #控制当前这一期的颜色
colors_1 = list(colors_0.color.values) #取出对应的颜色
plt.barh(data1.name, data1.popularity_value, height=0.5, color=colors_1, alpha=1) #从下往上画
plt.xlim(min(data1.popularity_value),max(data1.popularity_value)*1.05) #设置x轴的范围
plt.xlabel("人气值") #给x轴加说明
title = '第'+str(int(data1.period_num[1]))+'期娱乐圈男星排行榜' #构造图片标题
plt.title(title, fontsize=18) #给条形图添加标题
plt.annotate(str(int(data1.end_time[1])), xy=(max(data1.popularity_value)*0.88, 1), xytext=(max(data1.popularity_value)*0.9, 1),color="r",weight="bold",\
arrowprops=dict(arrowstyle='-',connectionstyle='arc3',color='red'),bbox=dict(boxstyle='round,pad=0.5', fc='yellow', ec='k',lw=1 ,alpha=0.4),\
fontsize=15) #添加数据截止统计日期
for x, y in enumerate(data1.popularity_value): #添加名字
plt.text(y + 10, x - 0.1 , '%s' % colors_0.name[x],fontweight='heavy')
plt.show()
代码解析:
plt.rcParams: 设置图形的参数;
person_num: 确定每期绘制的人数;
data: 取出538期排行榜的数据;
data1: 取出前person_num个人的信息,并按人气值排序;
name_color: 读取根据前10名出现次数分配的颜色;
colors_0: 根据分配的颜色,给出当前期绘制颜色;
plt.barh: 绘制横向条形图;
plt.xlim: 设置x轴的范围;
plt.annotate:添加图形右下角截止统计日期,其中str是添加的文字内容,xy是箭头的位置,xytext是文字的位置,bbox是添加边框;
for x, y:添加人名;
得到结果:
数据来源:123粉丝网
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import pandas as pd
from pandas import concat
import os
os.chdir(r"F:\微信公众号\Python\21.娱乐圈排行榜\2.绘制动图条形图") # 修改当前程序操作的路径
star_man = pd.read_csv("star_man.csv")
star_man = star_man.iloc[1:,:]
period = sorted(list(star_man.period_num.drop_duplicates().values))
#找到各期前15名的男演员名字
all_data = []
for i in period:
data = star_man[star_man.period_num==i]
data1 = data.iloc[0:14,:]
all_data.append(data1)
all_data_1 = concat(all_data)
# 图形设置
plt.rcParams['figure.figsize'] = (12, 50) # 图像显示大小
plt.rcParams['font.sans-serif'] = ['SimHei'] # 防止中文标签乱码,还有通过导入字体文件的方法
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['lines.linewidth'] = 0.8 # 设置曲线线条宽度
for i in period:
person_num = 10 #绘制person_num+1个人的图像
data = star_man[star_man.period_num==i] #取某一期的数据
data1 = data.iloc[0:person_num,:].sort_values(by = 'popularity_value', ascending = True) #取person_num+1个人的数据绘制条形图
name_color = pd.read_csv("name_color1.csv",encoding = 'gbk') #控制每个人绘图的颜色
colors_0 = pd.merge(data1, name_color, how = 'left', on = 'name') #控制当前这一期的颜色
colors_1 = list(colors_0.color.values) #取出对应的颜色
plt.clf() # 清除之前画的图
plt.barh(data1.name, data1.popularity_value, height=0.5, color=colors_1, alpha=1) #从下往上画
plt.xlim(min(data1.popularity_value),max(data1.popularity_value)*1.05)
plt.xlabel("人气值")
title = '第'+str(int(max(data1.period_num)))+'期娱乐圈男星排行榜'
plt.title(title, fontsize=18)
plt.annotate(str(int(max(data1.end_time))), xy=(max(data1.popularity_value)*0.88, 1), xytext=(max(data1.popularity_value)*0.9, 1),color="r",weight="bold",\
arrowprops=dict(arrowstyle='-',connectionstyle='arc3',color='red'),bbox=dict(boxstyle='round,pad=0.5', fc='yellow', ec='k',lw=1 ,alpha=0.4),\
fontsize=15)
for x, y in enumerate(data1.popularity_value): #添加名字
plt.text(y + 10, x - 0.1 , '%s' % colors_0.name[x],fontweight='heavy')
plt.pause(0.4) # 设置暂停时间,太快图表无法正常显示
plt.ioff() # 关闭画图的窗口,即关闭交互模式
plt.show() # 显示图片,防止闪退
代码解析:
plt.clf():清除之前画的图,避免在一张图上画两个图;
plt.pause:每隔0.4秒展示一张图。
注: 该代码只是在绘制单个条形图代码的基础上,用循环把所有图每隔一个很短的时间展示出来,给人一种动图的效果。
本文是本人使用matplotlib库进行绘图得到的结果,如有问题请指正。若想获取文中所有可直接执行的代码和数据,可在公众号中回复"娱乐圈排行榜条形图",即可免费获取。如对代码有疑问,可以到公众号中私信我。
你可能感兴趣:
孤立森林
风控建模整体流程
爬娱乐圈排行榜数据
用Python绘制皮卡丘
用Python绘制词云图
Python入门干货经验(免费提供资料)
用Python绘制杨紫作品集动态二维码
【Python】【爬虫】Requests库详解