新人小白的第一次天池比赛感受

第一次参加天池大赛(实际上是服务外包大赛),我懂得不是很多,程序也大多是在网上copy,然后努力的去改。
本人尝试过Arima模型,lstm模型,rnn模型和很牛逼的STL分解。
由于本人是个半路出家的大二小白,很多东西也不是很懂。大致谈下我的感受。
一上来搜索了好多别人的代码,弄来弄去,也没啥出路。后来发现,处理数据是很重要的。首先观察可以看到2014年的4月之前的数据是很不稳定的。然后对应到相应的时间,发现每一周的工作日和周六,周日的数据是有差异的。同样节日的那天的purchase和redeem都是比正常的工作日是要低的。还有STL分解后的残差也要和日期对齐,等等。
对于一个新手来说,推荐使用ARIMA入门。这因为,一个小白之前没接触过Python,想要一下子看懂复杂的神经网络并不是那么容易的。而且,它使用的acf和pacf图也较为好懂,它对数据的一些简单处理方便以后的时间序列分解,和进阶版的时间序列分解:STL分解的理解学习。
对于STL分解,怎么说呢,就是要认真的去理解,因为它要不断的分解,对齐数据。网上的关于STL的教程大多是R那个自带的Airpassanger的那个包的数据。看了人家的操作,很秀。但是真的不会用。Airpassanger的趋势实在是太好了,而2014年4月到 8月的真的看起来真的没啥周期和趋势。所以,建议,先学习时间序列分解,再进阶。注意:要搜索时间序列分解,而不是STL分解。后者的资料,对于我来说 ,真的没有太大的帮助。
再者,软件上,Pycharm和R studio都是不错的。前者要写代码,而后者可以直接执行脚本命令,更直接(很爽)。

新人小白的第一次天池比赛感受_第1张图片
这个是我的排名吧。最后火箭太多了,真的厉害。但很遗憾,没机会知道人家是怎么弄的。
看过网上一个人的思路,不是很懂但感觉很厉害,虽然他们的分数不高。但感觉好好改一下,应该是很厉害的。我所知道的他们都用了,还有就是GBDT模型。他们的代码在我电脑上跑,有点问题,我就稍微改了一下。结果就是9月1号是一个数据,2号到15号是一个,16号是一个,剩余的是一个。很尴尬,但是看他们最后给出的他们的结果,也差不多。原因没找到,而且也没那么多的时间了,所以就等明年如果还有机会的话,就好好研究一下这个神经网络,希望可以不要去抄别人代码了。
刚刚解题没多久,写个博客总结下吧。

你可能感兴趣的:(新人小白的第一次天池比赛感受)