Pandas实战100例 | 案例 29: 时间序列分析 - 滚动窗口计算

案例 29: 时间序列分析 - 滚动窗口计算

知识点讲解

时间序列数据分析是数据科学中的一个重要领域。Pandas 提供了处理时间序列的强大功能,包括滚动窗口计算。滚动窗口计算可以用于平滑时间序列数据,识别趋势和模式。

  • 滚动窗口计算: 使用 rolling 方法可以对数据集应用滚动窗口计算。例如,你可以计算滚动平均或滚动标准差。
示例代码
# 准备数据和示例代码的运行结果,用于案例 29

# 示例数据
data_time_series = {
    'Date': pd.date_range(start='2023-01-01', periods=6, freq='M'),
    'Sales': [200, 220, 250, 300, 310, 330]
}
df_time_series = pd.DataFrame(data_time_series)

# 设置日期为索引
df_time_series.set_index('Date', inplace=True)

# 滚动窗口计算
rolling_average = df_time_series.rolling(window=2).mean()

df_time_series, rolling_average


在这个示例中,我们首先将日期设置为 DataFrame 的索引。然后,我们计算了一个窗口大小为 2 个月的滚动平均。

示例代码运行结果

原始时间序列 (df_time_series):

            Sales
Date             
2023-01-31    200
2023-02-28    220
2023-03-31    250
2023-04-30    300
2023-05-31    310
2023-06-30    330

滚动平均 (rolling_average):

            Sales
Date             
2023-01-31    NaN
2023-02-28  210.0
2023-03-31  235.0
2023-04-30  275.0
2023-05-31  305.0
2023-06-30  320.0

这个结果展示了时间序列数据的滚动平均计算,有助于平滑短期波动,突出长期趋势。

你可能感兴趣的:(Pandas实战100例,pandas)