复盘一下刚通过的预选赛-大数据挑战赛门槛(哇的一声哭出来)

过程:
模型从简单到复杂的试:朴素贝叶斯,结果0.82左右,距离参赛群的大佬们说的0.85通过线还差挺多,然后就word2vec+LSTM,结果是0.83-0.84的范围浮动,考虑到数据量才6k多,开始调参,主要的方向是调那些可以降低模型复杂度的参数(embedding size, hidden dim…),以及容易导致过拟合的(lr,epoch,…),然鹅,调了一段时间发现,对验证集结果影响最大的可能是随机种子,这时候就可以怀疑人生了。想来想去还是觉得是因为数据量太小模型用的太复杂导致的过拟合,但知乎上一大佬word2vec+LSTM跑了0.86多呀,难道我连调参也不会,心态开始崩。看了几天的番,从永生之酒到重温排球少年,从强风吹拂到笨女孩,哎我果然是个死宅QAQ。今天开始用fasttext,随便跑一下好的一下子破0.84了,好吧我已经无能为力了开始ensemble,0.856通过了我果然是个天才,完结撒花~QvQ~

你可能感兴趣的:(复盘)