Prophet是一种基于可加性模型预测时间序列数据的程序,其中非线性趋势可以按年度、每周和每日的季节性,以及假日效应进行拟合。它最适合于具有强烈季节效应的时间序列和有几个季节的历史数据。Prophet对于缺失的数据和趋势的变化是稳健的,并且通常能够很好地处理异常值。
模型原理:
Prophet模型如下:
g(t) 表示趋势函数,拟合非周期性变化;
s(s)表示周期性变化,比如说每周,每年,季节等;
h(t)表示假期变化,节假日可能是一天或者多天;
ϵt为噪声项,用他来表示随机无法预测的波动,我们假设ϵt是高斯的。
prophet的预测过程:
Prophet适用场景:
传统的时间序列预测,适用的时序数据过于局限, 缺失值需要处理,模型缺乏灵活性,指导作用较弱;
Prophet优点:
在anaconda中安装prophet模块,以管理员权限运行命令窗口,执行以下命令
conda install -c conda-forge fbprophet
中间可能会遇到需要暗转或者更新一些依赖模块,输入y回车就行,因为之前我运行的时候已经更新,但是不是管理员权限,所以安装失败,我重新以管理员运行命令,就安装成功了。
R语言实现
mydata<-read.table("C:\\Users\\examples\\example_wp_log_peyton_manning.csv",header=TRUE,sep=",")
head(mydata)
m <- prophet(mydata)
future <- make_future_dataframe(m,periods=365) #####需要剩下的预测天数,如果预测的数据是月份加上参数freq='month'
#预测数据集
forecast <- predict(m,future)
plot(m, forecast)
prophet_plot_components(m, forecast)
其中trend是增长模型的展示,weekly和yearly部分是季节性模型的展示
由于prophet是加法模型,有:
forecast[‘additive_terms’] = forecast[‘weekly’] + forecast[‘yearly’];
forecast[‘yhat’] = forecast[‘trend’] + forecast[‘additive_terms’] 。
因此:forecast[‘yhat’] = forecast[‘trend’] +forecast[‘weekly’] + forecast[‘yearly’]。
加上节假日因素:
forecast[‘yhat’] = forecast[‘trend’] +forecast[‘weekly’] + forecast[‘yearly’] + forecast[‘holidays’]。
‘multiplicative_terms’, ‘multiplicative_terms_lower’, 'multiplicative_terms_upper’这3列是乘法模型的因素,所以为空。
增加假期的影响
lower_window 和 upper_window 表示节假日的区间,其中包含前一天,就设置 lower_window = -1 , upper_window = 0 ,
表示包含后一天,就设置 lower_window = 0 , upper_window =1
playoffs <- data.frame(
holiday = 'playoff',
ds = c('2008-01-13', '2009-01-03', '2010-01-16',
'2010-01-24', '2010-02-07', '2011-01-08',
'2013-01-12', '2014-01-12', '2014-01-19',
'2014-02-02', '2015-01-11', '2016-01-17',
'2016-01-24', '2016-02-07'),
lower_window = 0,
upper_window = 1)
m <- prophet(mydata,holidays =playoffs)
future <- make_future_dataframe(m,periods=365) #####需要剩下的预测天数,如果预测的数据是月份加上参数freq='month'
#预测数据集
forecast <- predict(m,future)
prophet_plot_components(m, forecast) #成分图
plot(m, forecast)#预测图
python实现
import pandas as pd
from fbprophet import Prophet
#读取数据集
df=pd.read_csv('C:\\Users\\examples\\example_wp_log_peyton_manning.csv')
#拟合模型
m=Prophet()
m.fit(df)
#构建待预测日期数据框,periods=365 代表除历史数据的日期外再往后推365天
future=m.make_future_dataframe(periods=365) #包含历史数据,如果是月度数据make_future_dataframe(periods=9, freq='M')
#预测数据集
forecast=m.predict(future)
#展示预测结果
m.plot(forecast);
#预测的成分分析绘图,展示预测中的趋势、周效应和年度效应
m.plot_components(forecast);
增加节假日信息
playoffs=pd.DataFrame({
'holiday':'playoff',
'ds':pd.to_datetime(['2008-01-13', '2009-01-03', '2010-01-16',
'2010-01-24', '2010-02-07', '2011-01-08',
'2013-01-12', '2014-01-12', '2014-01-19',
'2014-02-02', '2015-01-11', '2016-01-17',
'2016-01-24', '2016-02-07']),
'lower_window':0,
'upper_window':1,})
superbowls=pd.DataFrame({
'holiday':'superbowl',
'ds':pd.to_datetime(['2010-02-07', '2014-02-02', '2016-02-07']),
'lower_window':0,
'upper_window':1,
})
holidays=pd.concat((playoffs,superbowls))
m=Prophet(holidays=holidays)
m.fit(df)
future=m.make_future_dataframe(periods=365)
forecast=m.predict(future)
fig=m.plot_components(forecast)
参考资料:https://blog.csdn.net/qq_23860475/article/details/81354467
https://blog.csdn.net/anshuai_aw1/article/details/83412058