北京气温咋样 - Python,数据绘图,matplotlib

matplotlib 是最流行的 python 绘图包之一,相比起之前给大家介绍的小清新 pygal,matplotlib 显得比较偏理工。具体安装使用请参考官方文档。今天小狼要给大家举的栗子很简单:绘制一个折线图看看帝都的气温变化情况。源码请移步小狼 GitHub 下的 bj_tmp_matplotlib 文件夹。

巧妇难为无米之炊,第一步就是找数据。这里我们使用的天气数据来自于 Weather Underground。无需注册你就可以下载有记录的年份的全球各地天气数据,如果注册的话则可以得到一个 API,你也可以利用 API 来获取数据。我们需要获取北京 2016 年全年的气温数据,以此来绘制全年的高低气温走势图。该网站的数据显示非常清晰友好,由于我们需要的数据也不多,直接转存成 .csv 格式备用。

接下来开写代码,首先导入一些我们要用到的包,用来支持 .csv 文件处理和时间数据处理:

import csv
import matplotlib.dates
from datetime import datetime
from matplotlib import pyplot as plt

写一个函数来把时间数据存储到列表里,并且转换成可被 python 理解的时间格式:

def date_to_list(data_index):
    """ save date to a list """
    results = []
    for row in data:
        results.append(datetime.strptime(row[data_index], '%Y-%m-%d'))
    return results

再来一个函数用来存储气温数据:

def data_to_list(data_index):
    """ save data to a list """
    results = []
    for row in data:
        results.append(int(row[data_index]))
    return results

现在看一下那个 .csv 文件的构造和内容:

filename = 'beijing_2016.csv'
with open(filename) as bj:
    data = csv.reader(bj)
    header = next(data)

    print(header)
    print(next(data))

通过两个 print 语句我们得到如下结果:

['date_akdt', 'high_temp_f', 'avg_temp_f', 'low_temp_f', 'high_dew_point_f', 'avg_dew_point_f', 'low_dew_point_f', 'high_humidity_pct', 'avg_humidity_pct', 'low_humidity_pct', 'high_sea_level_press_in', 'avg_sea_level_press_in', 'low_sea_level_press_in', 'high_visibility_mi', 'avg_visibility_mi', 'low_visibility_mi', 'high_wind_mph', 'avg_wind_mph', 'high_wind_mph', 'sum_precip_in', 'events']
['2016-01-01', '41', '30', '19', '23', '18', '14', '86', '68', '25', '30.36', '30.23', '30.12', '4', '3', '1', '9', '3', '-', '0', '']

上面的输出分别是表头和第一行数据的内容,我们可以看到其中有我们需要的时间,最高温度和最低温度,分别对应的 index 是 0,1,3。当然,你也可以直接用代码获取 index,尤其是当数据类型非常多的时候:

    print('date_akdt', header.index('date_akdt'))
    print('high_temp_f', header.index('high_temp_f'))
    print('low_temp_f', header.index('low_temp_f'))

获得输出:

date_akdt 0
high_temp_f 1
low_temp_f 3

知道数据位置后,我们就可以单独提取这些数据存到列表里,用于之后的绘图。这里有个坑,因为我们读取 .csv 文件的时候用到了迭代器,所以我们需要先转存一下数据,否则仅能返回第一条数据,其余的则返回空值。

    data = list(data)

接下来就是把数据存到列表里,由于获取的温度是华氏度,所以温度这里加了一个转换过程 (x-32)/1.8

    high_temp_f_bj = data_to_list(1)
    high_temp_c_bj = [int((x-32)/1.8) for x in high_temp_f_bj]

    low_temp_f_bj = data_to_list(3)
    low_temp_c_bj = [int((x-32)/1.8) for x in low_temp_f_bj]

    date = date_to_list(0)

然后就到了绘图步骤,先绘制高温曲线看一下:

    plt.plot(date, high_temp_c_bj)
    plt.show()

我们得到一个酱紫的图,不错哦:

北京气温咋样 - Python,数据绘图,matplotlib_第1张图片
bj_temp_2016_high.png

把低温曲线也加进去:

    plt.plot(date, low_temp_c_bj)
北京气温咋样 - Python,数据绘图,matplotlib_第2张图片
bj_temp_2016.png

做一些显示上的优化(咋就这么这么这么麻烦呢!):

    plt.figure(figsize=(15, 5), dpi=100)
    plt.plot(date, high_temp_c_bj, c='xkcd:orange')
    plt.plot(date, low_temp_c_bj,c='xkcd:azure')

    plt.title('Beijing Temperatures (High & Low) - Year 2016', fontsize=22)
    plt.ylabel('Temperature (C)', fontsize=20)
    plt.tick_params(axis='both', labelsize=16)
    plt.fill_between(date, high_temp_c_bj, low_temp_c_bj, facecolor='xkcd:tan', alpha=0.2)

    plt.gca().xaxis.set_major_formatter(matplotlib.dates.DateFormatter("%Y-%m"))
    plt.gcf().autofmt_xdate()
    plt.margins(x=0,y=0.2)

    plt.show()

上面的代码中,figure() 可调整绘图大小和分辨率,fill_between() 可在两条折线中间绘制填充色,autofmt_xdate() 可将横坐标斜着显示以避免重叠,margins() 可设置坐标轴和边框的留白距离。

北京气温咋样 - Python,数据绘图,matplotlib_第3张图片
bj_temp_2016_final.png

至此,总算是差不多了。其实用 matplotlib 绘制类似这样的图是比较基础的,但是我们可以看到稍有不慎在数据处理上还是有坑的,包括最后的 x 轴坐标调整也费了小狼一些时间去研究,幸好过程中得到几位大牛的指(教)点(训)。此外,在写提取数据的代码时,如果对数据质量没有把握,还是最好加入 try - except - else 模块方为妥当。

你可能感兴趣的:(北京气温咋样 - Python,数据绘图,matplotlib)