python pct_change_Python Pandas,使用pct_change函数重新采样数据

在Pandas 0.18或更高版本中,可以使用^{}:def percent_change(x):

if len(x):

return (x[-1]-x[0])/x[0]

ser.resample('60T', base=30).apply(percent_change)

它产生了

^{pr2}$

如果没有base=30,ser.resample('60T')会将序列重新采样为60分钟的间隔(分钟和秒等于0)。使用base=30时,60分钟的时间间隔将移动30分钟。因此Times显示9:30和{},而不是{}和{}。在

第一行显示从9:30到10:30的百分比变化。第二行,从10:30到ser中的最后一次,10:49。在

apply方法允许您使用custum函数聚合60分钟的间隔。在the docs的最底部,您可以找到resample/apply的另一个例子。在ser.resample('60T', base=30, how=percent_change)

例如import numpy as np

import pandas as pd

np.random.seed(2016)

N = 100

index = ((pd.date_range('2009-01-01', periods=N//2, freq='2T'))

.union(pd.date_range('2009-01-01 4:00', periods=N//2, freq='2T')))

Data = pd.DataFrame(np.random.random((N,5)),

columns='spyo spyc spyv vxxo vxxc'.split(),

index=index)

Data['vxxv'] = np.random.randint(10, size=(N,))

def percent_change(x):

if len(x):

return (x[-1]-x[0])/x[0]

print(Data.resample('60T', base=30).apply(percent_change))

收益率spyo spyc spyv vxxo vxxc \

2008-12-31 23:30:00 -0.290145 0.116518 -0.767117 0.019722 -0.329499

2009-01-01 00:30:00 0.957057 0.113174 0.331076 -0.179291 0.397392

2009-01-01 01:30:00 0.412948 -0.366011 0.092585 0.455002 2.637628

2009-01-01 02:30:00 NaN NaN NaN NaN NaN

2009-01-01 03:30:00 0.169505 -0.901438 1.287304 8.042780 -0.189155

2009-01-01 04:30:00 40.559281 -0.510897 0.316828 0.064967 0.236498

2009-01-01 05:30:00 0.009669 -0.232149 2.055451 -0.210185 0.516835

vxxv

2008-12-31 23:30:00 7.000000

2009-01-01 00:30:00 0.000000

2009-01-01 01:30:00 -0.333333

2009-01-01 02:30:00 NaN

2009-01-01 03:30:00 2.500000

2009-01-01 04:30:00 4.000000

2009-01-01 05:30:00 -0.333333

你可能感兴趣的:(python,pct_change)