2020华为大数据参赛总结

总结一下这次参加华为大数据比赛的体会和收获
此次比赛最后止步200+ 没能进复赛
第一次参加大数据竞赛 虽然没能进复赛 但总得来说 还是很值得的
初赛一个月的备赛时间 我和我的组员大约只用了半个月在比赛上
首先 比赛真的是可以长见识的 这次大数据的训练集有20GB
刚拿到数据的那一周都不知道怎么下手 最后是通过将大文件分割成若干个小文件 找到了比赛入口
通过这次比赛 我粗略地学习了python 机器学习 数据挖掘
人生苦短 我用python
python的库很丰富
这次在csv文件的操作上 大量的使用了pandas
在比赛的最后一天 终于跑通了geopandas 绘制出了测试集的航线轨迹 害要是早点完成 指不定…就苟进复赛了…
数据挖掘80%的时间都用在数据清洗上 这是这次比赛最深刻的体会
合理的利用可视化工具 可以省事省力解决问题 下次参赛的话 可以早点从这个角度考虑
同时心态的调整也很重要 多沟通多交流 紧跟大佬的步伐
有机会的话 还会继续参加这类比赛的 很值得

你可能感兴趣的:(大数据)