O‘Reilly 的《利用python进行数据分析》一书中是这样说的
。
【重新采样】是指将时间序列从一个频率转换为另一个频率的过程
【向下采样】将更高频率的数据聚合到低频率
【向上采样】将低频率转换到高频率
resample拥有类似于groupby 的API;调用resample对数据分组,之后再调用聚合函数。
----------示例------------
rng=pd.date_range('2000-01-01',periods=100,freq='D')
ts=pd.Series(np.random.randn(len(rng)),index=rng)
ts
2000-01-01 -0.174652
2000-01-02 1.015691
2000-01-03 -1.528498
2000-01-04 0.255951
2000-01-05 0.518026
...
2000-04-05 0.151923
2000-04-06 -0.206902
2000-04-07 -1.162723
2000-04-08 0.587258
2000-04-09 0.061883
Freq: D, Length: 100, dtype: float64
ts.resample('M').mean()
2000-01-31 -0.024317
2000-02-29 -0.064409
2000-03-31 -0.049029
2000-04-30 -0.203543
Freq: M, dtype: float64
ts.resample('M',kind='period').mean()
2000-01 -0.024317
2000-02 -0.064409
2000-03 -0.049029
2000-04 -0.203543
Freq: M, dtype: float64In [ ]:
参数 | 描述 |
---|---|
freq | 表明所需采样频率的字符串或DateOffset对象,例如’M‘,’5min‘,Second(1) |
axis | 默认为0 |
fill_method | 向上采样时的插值方式,ffill 或 bfill,默认不插值 |
closed | 向下采样中,每段间隔的时间的哪一段是封闭的,‘right’或‘left’ |
label | |
loffset | |
limit | |
kind | 对区间(‘period’)或时间戳(’timestamp’)的聚合;默认为时间序列索引的类型 |
convention |
有空再更