两年前在 B 站上看到了一个宝藏 up 主,名叫 "Jannchie见齐",专门做动态条形图样式的数据可视化。
做出的效果还是很不错的,但工具使用的是 JS,不是 Python。于是尝试搜索了一下,看看 Python 有没有相关的库,也能轻松做出动态条形图的效果。幸运的是还真有相关的库,叫 bar_chart_race,那么下面就来看看它的用法。
老规矩,使用之前先安装,直接 pip install bar-chart-race 即可。
import pandas as pd import bar_chart_race as bcr # 如果出现SSL错误, 则全局取消证书验证 """ import ssl ssl._create_default_https_context = \ ssl._create_unverified_context """ # 获取数据 df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 生成 GIF 图像 bcr.bar_chart_race(df, "covid19_horiz.gif")
我们看到代码非常简单,就是将数据转成 pandas 的 DataFrame,然后调用 bar_chart_race 即可生成 GIF 图像。
整体还是不错的,然后重点来看一下数据:
其中表头就是 GIF 图表中 Y 轴的部分,但要注意的是,我们的图表是随时间不断变化的,所以在生成 DataFrame 的时候必须将 date 字段设置为索引。然后数据随着时间不断变化,条形图之间会根据数据的大小进行排序。
当然了,以上只是默认生成的,bar_chart_race 里面还有很多的参数,我们来看一下。
动态条形图变动态柱状图
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) bcr.bar_chart_race(df, "covid19_horiz.gif", orientation='v')
我们看到为了避免文字发生重叠,自动倾斜了,所以还是比较人性化的。
指定排序方式
排序方式默认为降序,也可以指定为升序。
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 设置排序方式 bcr.bar_chart_race(df, "covid19_horiz.gif", sort='asc')
限制条目数
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 设置最多能显示的条目数,这里最多显示 6 条 bcr.bar_chart_race(df, 'covid19_horiz.gif', n_bars=6)
设置固定条目
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 选取如下 5 个国家的数据 bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_order=['Iran', 'USA', 'Italy', 'Spain', 'Belgium'])
固定数值轴,使其不发生动态变化
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 设置数值的最大值,固定数值轴 bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_max=True)
设置图像帧数,默认 10 帧
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 图像帧数:数值越小,越不流畅;越大,越流畅 bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=3)
可以看到,动图变得不流畅了。
设置帧率,单位时间默认为 500ms
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 设置帧率为 200ms,总共 20 帧 bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=20, period_length=200)
设置每帧增加的标签时间,默认为 False
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) bcr.bar_chart_race(df, 'covid19_horiz.gif', interpolate_period=True)
图形样式设置
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) """ figsize: 设置画布大小,默认 (6, 3.5) dpi: 图像分辨率,默认 144 label_bars: 显示柱状图的数值信息,默认为 True; 指定为 False 则不显示;指定为字典,则自定义显示属性 period_label: 显示时间标签信息,默认为 True; 指定为 False 则不显示;指定为字典,则自定义显示属性 period_fmt: 设置日期格式 title: 图表标题 title_size: 标题字体大小 shared_fontdict: 全局字体属性,例如 {'family': 'Helvetica', 'weight': 'bold', 'color': 'rebeccapurple'} """ bcr.bar_chart_race(df, 'covid19_horiz.gif', figsize=(5, 3), dpi=100, label_bars=False, period_label={'x': .99, 'y': .1, 'ha': 'right', 'color': 'red'}, title='COVID-19 Deaths by Country')
条形图属性,可以设置透明度,边框等
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # bar_kwargs:条形图属性 bcr.bar_chart_race(df, 'covid19_horiz.gif', bar_kwargs={'alpha': .2, 'ec': 'black', 'lw': 3})
添加动态文本
import pandas as pd import bar_chart_race as bcr import matplotlib.pyplot as plt # 设置字体,否则无法显示中文 plt.rcParams['font.sans-serif'] = ['SimHei'] # Windows # plt.rcParams['font.sans-serif'] = ['Hiragino Sans GB'] # Mac plt.rcParams['axes.unicode_minus'] = False df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) def summary(values, ranks): # 动态文本的内容 """ values 为 df 的每一行(Series),例如 Belgium 1143.0 China 3326.0 France 6520.0 Germany 1275.0 Iran 3294.0 Italy 14681.0 Netherlands 1490.0 Spain 11198.0 USA 7418.0 United Kingdom 3611.0 Name: 2020-04-03, dtype: float64 ranks 则是针对 values 的值进行了排名,例如 Belgium 1.0 China 5.0 France 7.0 Germany 2.0 Iran 4.0 Italy 10.0 Netherlands 3.0 Spain 9.0 USA 8.0 United Kingdom 6.0 Name: 2020-04-03, dtype: float64 """ all_people = int(values.sum()) ranks_country = ranks.sort_values().index s = (f'总死亡人数:{all_people},' f'死亡人数最多的国家:{ranks_country[-1]},' f'死亡人数最少的国家:{ranks_country[0]}') # 设置文本位置、数值、大小、颜色等 return {'x': .99, 'y': .05, 's': s, 'ha': 'right', 'size': 8} # 添加文本 bcr.bar_chart_race(df, 'covid19_horiz.gif', period_summary_func=summary)
添加垂直条
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) # 设置垂直条数值,分位数 def func(values, ranks): return values.quantile(.9) # 添加垂直条 bcr.bar_chart_race(df, 'covid19_horiz.gif', perpendicular_bar_func=func)
设置柱状图颜色
import pandas as pd import bar_chart_race as bcr df = pd.read_csv('covid19_tutorial.csv', index_col=["date"]) """ # 具体有哪些颜色,可以通过如下方式查看 from bar_chart_race._colormaps import colormaps print(list(colormaps.keys())) """ bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3")
以上就是绝大部分配置,当然源码中注释写的也比较详细,可以点进去看一下。
到此这篇关于Python实现动态条形图绘制的示例代码的文章就介绍到这了,更多相关Python动态条形图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!