pandas对数据的操作

今天主要对pandas的时间进行了操作。因为需要喂入的模型是以小时为单位的,而我的数据是每五分钟一次,因此把小时数据要汇总下。主要实现的目的有这些。

1,怎么样对dataframe进行改列的名称

df.rename(columns={'Time':'ds','Value':'y'},inplace = True)

这个改名称还是很给力的

2,怎么对两个Series进行合并

pd.concat([ds,ts],axis=1,ignore_index=True,names=['index','ds','y'])
这里需要注意的是,如果不加
ignore_index=True

那么合并的结果是没有index。加上之后,就会对group的种类进行index。后面的names一定要比自己的真实数据多一列,第一列要是index,不然加不上去。还得用方法1改名

3,处理时间用的非常笨的循环搞的,需要提高下,应该用map函数的形式更优美些。

4,prophet预测的结果。

这个,模型应用还是很简单的,主要是fit函数,然后天剑预测的future的形式,就可以了。预测的结果如果以小时来计算,还是相当可以的。如下图:

pandas对数据的操作_第1张图片

pandas对数据的操作_第2张图片

Prophet的使用可以参考教程:https://facebook.github.io/prophet/docs/quick_start.html

还有个比官网更详细的,函数参数也有解释:https://www.digitalocean.com/community/tutorials/a-guide-to-time-series-forecasting-with-prophet-in-python-3

你可能感兴趣的:(机器学习理论相关)