python学习

CSV文件与数据处理

学习书籍:《python编程 从入门到实践》

用到的python模块:csv、matplotlib、datetime

两种常见格式存储的数据:CSV和JSON
本篇看CSV。

  • 文件资源:ituring.cn/book/1861 在右侧的"随书下载“的《Python编程》源代码文件-更新.zip Chap16中。
  • CSV是指将一系列数据以逗号分隔
    2014-1-5,61,44,26,18,-1,,,0.00,195
  • 代码表示对 阿拉斯加锡特卡地区的温度变化数据 进行可视化
import matplotlib.pyplot as plt
import csv
from datetime import datetime

filename = 'sitka_weather_07-2014.csv'

with open(filename) as f:
    # 创建阅读器对象my_reader
    my_reader = csv.reader(f)
    # 读取第一行数据,结果存在变量(列表)first_row中
    first_row = next(my_reader)
    # 打印首行信息及位置
    for index, data in enumerate(first_row):
        print(index, data)

    # 存储7月每天的最高和最低气温
    highs = []
    lows = []
    # 存储每天日期
    dates = []
    # 此时,阅读器读完第一行,从第二行数据开始读
    # 从第一行信息中发现“最高气温”在第2列,下标为1
    # “日期”在第1列,下标为0.
    # 用datetime类中的strptime()方法将日期字符串转化为日期对象
    for row in my_reader:
        high = int(row[1])
        low = int(row[3])
        date = datetime.strptime(row[0], '%Y-%m-%d')
        highs.append(high)
        lows.append(low)
        dates.append(date)

    print(highs)
    print(lows)

    # 可视化
    fig = plt.figure(figsize=(10, 6))
    # alpha指颜色的透明度 0表示透明,1(默认)表示完全不透明
    plt.plot(dates, highs, c='red', alpha=0.5)
    plt.plot(dates, lows, c='blue', alpha=0.5)
    # 填充最高气温和最低气温之间的区域  通过着色突出每天的气温范围
    plt.fill_between(dates, highs, lows, facecolor='blue', alpha=0.1)
    plt.title('Daily high and low temperatures in July,2014', fontsize=24)
    plt.xlabel('', fontsize=16)
    fig.autofmt_xdate()     # 绘制斜的日期标签
    plt.ylabel('Temperature(F)', fontsize=16)
    plt.tick_params(axis='both', labelsize=16)

    plt.show()
    # plt.savefig('July Temperature(final)', bbox='tight')

执行结果:
python学习_第1张图片
未填充最高温和最低温之间区域时:
python学习_第2张图片
备注:也可以使用2014年全年的数据进行操作。
文件名:filename = 'sitka_weather_2014.csv'

你可能感兴趣的:(图表绘制)