pandas dataframe 里的resample 到底干嘛用的

O‘Reilly 的《利用python进行数据分析》一书中是这样说的

【重新采样】是指将时间序列从一个频率转换为另一个频率的过程

【向下采样】将更高频率的数据聚合到低频率
【向上采样】将低频率转换到高频率

resample拥有类似于groupby 的API;调用resample对数据分组,之后再调用聚合函数。

----------示例------------

rng=pd.date_range('2000-01-01',periods=100,freq='D')
ts=pd.Series(np.random.randn(len(rng)),index=rng)
ts
2000-01-01   -0.174652
2000-01-02    1.015691
2000-01-03   -1.528498
2000-01-04    0.255951
2000-01-05    0.518026
                ...   
2000-04-05    0.151923
2000-04-06   -0.206902
2000-04-07   -1.162723
2000-04-08    0.587258
2000-04-09    0.061883
Freq: D, Length: 100, dtype: float64

ts.resample('M').mean()
2000-01-31   -0.024317
2000-02-29   -0.064409
2000-03-31   -0.049029
2000-04-30   -0.203543
Freq: M, dtype: float64

ts.resample('M',kind='period').mean()
2000-01   -0.024317
2000-02   -0.064409
2000-03   -0.049029
2000-04   -0.203543
Freq: M, dtype: float64In [ ]:
参数 描述
freq 表明所需采样频率的字符串或DateOffset对象,例如’M‘,’5min‘,Second(1)
axis 默认为0
fill_method 向上采样时的插值方式,ffill 或 bfill,默认不插值
closed 向下采样中,每段间隔的时间的哪一段是封闭的,‘right’或‘left’
label
loffset
limit
kind 对区间(‘period’)或时间戳(’timestamp’)的聚合;默认为时间序列索引的类型
convention

有空再更

你可能感兴趣的:(python,python)