基于时间序列的用户行为预测

 最近老师给了一篇顶会的论文《Modeling and Predicting Behavioral Dynamics on the Web》,让我实现论文里提到的用户行为预测的方法。通过该论文掌握基本的时间序列预测模型、参数估计方法以及论文中新提出的动态模型选择方法。
 论文中主要针对用户在网页上的搜索和点击URL的行为进行预测,使用的最基本的方法是基于简单的Holt-Winters模型,即三次指数平滑法,通过对该模型进行改进,增加了一些周期性、季节性组件,达到了优化预测效果的目的,能针对数据的特点,更好地实现预测。
 除此之外,论文还对数据进行了详细的分析,提取出了数据的937种特征值并且将特征值归类。这里将要重点学习下如何提取时序数据的特征值,并且能够根据特征值进行分类。提取特征值的主要目的是建立DML(dynamic model leaner),根据提出的特征值动态地选取适当的预测模型,能够实现较复杂的模型的预测。(我觉得下一步的方向可以学习下时序数列的数据挖掘方法,熟悉掌握一些常用的数据预测的模型,最近在学习《matlab超级智能算法》这本书,感觉还是挺有用的)
 现在已经初步实现了Holt-Winters模型,下一步的计划是实现贝叶斯预测模型,对比一下二者的效果,熟悉下matlab编程。另外还在学习S.J的《matlab编程》
 这就是今天的主要的内容了

你可能感兴趣的:(数据分析)