Pandas时期:Period
核心:pd.Period()
# pd.Period()创建时期
p = pd.Period('2017', freq = 'M')
print(p, type(p))
# 生成一个以2017-01开始,月为频率的时间构造器
# pd.Period()参数:一个时间戳 + freq 参数 → freq 用于指明该 period 的长度,时间戳则说明该 period 在时间轴上的位置
print(p + 1)
print(p - 2)
print(pd.Period('2012', freq = 'A-DEC') - 1)
# 通过加减整数,将周期整体移动
# 这里是按照 月、年 移动
# 执行结果
2017-01
2017-02
2016-11
2011
# pd.period_range()创建时期范围
prng = pd.period_range('1/1/2011', '1/1/2012', freq='M')
print("1".center(40,'*'))
print(prng,type(prng))
print("2".center(40,'*'))
print(prng[0],type(prng[0]))
# 数据格式为PeriodIndex,单个数值为Period
ts = pd.Series(np.random.rand(len(prng)), index = prng)
print("3".center(40,'*'))
print(ts,type(ts))
print("4".center(40,'*'))
print(ts.index)
# 时间序列
# Period('2011', freq = 'A-DEC')可以看成多个时间期的时间段中的游标
# Timestamp表示一个时间戳,是一个时间截面;Period是一个时期,是一个时间段!!但两者作为index时区别不大
#执行结果
*******************1********************
PeriodIndex(['2011-01', '2011-02', '2011-03', '2011-04', '2011-05', '2011-06',
'2011-07', '2011-08', '2011-09', '2011-10', '2011-11', '2011-12',
'2012-01'],
dtype='period[M]', freq='M')
*******************2********************
2011-01
*******************3********************
2011-01 0.480528
2011-02 0.378379
2011-03 0.057000
2011-04 0.626114
2011-05 0.115272
2011-06 0.938763
2011-07 0.009299
2011-08 0.001233
2011-09 0.472564
2011-10 0.932368
2011-11 0.197020
2011-12 0.045245
2012-01 0.062759
Freq: M, dtype: float64
*******************4********************
PeriodIndex(['2011-01', '2011-02', '2011-03', '2011-04', '2011-05', '2011-06',
'2011-07', '2011-08', '2011-09', '2011-10', '2011-11', '2011-12',
'2012-01'],
dtype='period[M]', freq='M')
# asfreq:频率转换
p = pd.Period('2017','A-DEC')
print("1".center(40,'*'))
print(p)
print("2".center(40,'*'))
print(p.asfreq('M', how = 'start')) # 也可写 how = 's'
print("3".center(40,'*'))
print(p.asfreq('D', how = 'end')) # 也可写 how = 'e'
# 通过.asfreq(freq, method=None, how=None)方法转换成别的频率
prng = pd.period_range('2017','2018',freq = 'M')
ts1 = pd.Series(np.random.rand(len(prng)), index = prng)
ts2 = pd.Series(np.random.rand(len(prng)), index = prng.asfreq('D', how = 'start'))
print("4".center(40,'*'))
print(ts1.head(),len(ts1))
print("5".center(40,'*'))
print(ts2.head(),len(ts2))
# asfreq也可以转换TIMESeries的index
#执行结果
*******************1********************
2017
*******************2********************
2017-01
*******************3********************
2017-12-31
*******************4********************
2017-01 0.935882
2017-02 0.459180
2017-03 0.213135
2017-04 0.433050
2017-05 0.995488
Freq: M, dtype: float64 13
*******************5********************
2017-01-01 0.182071
2017-02-01 0.796967
2017-03-01 0.209907
2017-04-01 0.385255
2017-05-01 0.972818
Freq: D, dtype: float64 13
# 时间戳与时期之间的转换:pd.to_period()、pd.to_timestamp()
rng = pd.date_range('2017/1/1', periods = 10, freq = 'M')
prng = pd.period_range('2017','2018', freq = 'M')
ts1 = pd.Series(np.random.rand(len(rng)), index = rng)
print("1".center(40,'*'))
print(ts1.head())
print("2".center(40,'*'))
print(ts1.to_period().head())
# 每月最后一日,转化为每月
ts2 = pd.Series(np.random.rand(len(prng)), index = prng)
print("3".center(40,'*'))
print(ts2.head())
print("4".center(40,'*'))
print(ts2.to_timestamp().head())
# 每月,转化为每月第一天
#执行结果
*******************1********************
2017-01-31 0.945223
2017-02-28 0.243593
2017-03-31 0.343948
2017-04-30 0.283476
2017-05-31 0.959287
Freq: M, dtype: float64
*******************2********************
2017-01 0.945223
2017-02 0.243593
2017-03 0.343948
2017-04 0.283476
2017-05 0.959287
Freq: M, dtype: float64
*******************3********************
2017-01 0.808551
2017-02 0.623877
2017-03 0.659665
2017-04 0.719965
2017-05 0.152045
Freq: M, dtype: float64
*******************4********************
2017-01-01 0.808551
2017-02-01 0.623877
2017-03-01 0.659665
2017-04-01 0.719965
2017-05-01 0.152045
Freq: MS, dtype: float64