Python时间序列--滑动窗口(三)

滑动窗口
滑动窗口就是能够根据指定的单位长度来框住时间序列,从而计算框内的统计指标。相当于一个长度指定的滑块正在刻度尺上面滑动,每滑动一个单位即可反馈滑块内的数据。
滑动窗口的意义
为了提升数据的准确性,将某个点的取值扩大到包含这个点的一段区间,用区间来进行判断,这个区间就是窗口。例如想使用2020年1月1日的一个数据,单取这个时间点的数据当然是可行的,但是太过绝对,有没有更好的办法呢?可以选取2019年12月16日到2020年1月15日,通过求均值来评估1月1日这个点的值,2019-12-16到2020-1-15就是一个窗口,窗口的长度window=30. 移动窗口就是窗口向一端滑行,每次滑动(行)并不是区间整块的滑行,而是一个单位一个单位的滑行。
滑动窗口类似于卷积或者移动均线的原理

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
df = pd.Series(np.random.random(1000), 
index = pd.date_range('1/1/2017', 
freq = 'D', 
periods = 1000))
df.head()

Python时间序列--滑动窗口(三)_第1张图片

r = df.rolling(window = 10)
print(r.mean())

Python时间序列--滑动窗口(三)_第2张图片
窗口2017-01-01到2017-01-10,下一个窗口并不是2017-1-10到2017-1-20,而是2017-01-02到2017-01-11(假设数据的截取是以天为单位),整体向右移动一个单位,而不是一个窗口。这样统计的每个值始终都是10单位的均值。前9个都不足够为一个窗口的长度,因此都无法取值,在此之前即为NaN。

#画出原始数据和滑动窗口的数据
plt.figure(figsize=(15, 5))

df.plot(style='r--')
df.rolling(window=10).mean().plot(style='b')

Python时间序列--滑动窗口(三)_第3张图片

你可能感兴趣的:(Python时间序列)