Pandas data_range函数

      最近在做一个大数据电力分析项目。在github下载了Python源代码。

数据结构是Pandas 中的dataframe 所以想系统的学习Pandas 工具包。

首先需要产生时间序列data_range.

函数原型

pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)

参数

  • start:string或datetime-like,默认值是None,表示日期的起点。

  • end:string或datetime-like,默认值是None,表示日期的终点。

  • periods:integer或None,默认值是None,表示你要从这个函数产生多少个日期索引值;如果是None的话,那么start和end必须不能为None。

  • freq:string或DateOffset,默认值是’D’,表示以自然日为单位,这个参数用来指定计时单位,比如’5H’表示每隔5个小时计算一次。

  • tz:string或None,表示时区,例如:’Asia/Hong_Kong’。

  • normalize:bool,默认值为False,如果为True的话,那么在产生时间索引值之前会先把start和end都转化为当日的午夜0点。

  • name:str,默认值为None,给返回的时间索引指定一个名字。

  • closed:string或者None,默认值为None,表示start和end这个区间端点是否包含在区间内,可以有三个值,’left’表示左闭右开区间,’right’表示左开右闭区间,None表示两边都是闭区间。

返回值

DatetimeIndex

有了 data_range 就可以构造 dataframe ,DataFrame 的英文介绍如下:

DataFrame unifies two or more Series into a single data structure.Each Series then represents a named column of the DataFrame, and instead of each column having its own index, the DataFrame provides a single index and the data in all columns is aligned to the master index of the DataFrame. 

rng = pd.date_range('2012-01-01', freq='S', periods=N_PERIODS)
for i in range(1, 4):
        dfs[i] = pd.DataFrame(data=data[i], index=rng, dtype=np.float32,
                              columns=measurement_columns([('power', 'active')]))
将data_range生成的时间序列作为 DataFrame 的索引

你可能感兴趣的:(Python)