来我厂已半年(数分近两年),近半年主要提升是在编程能力方面,算法相关的提升较少,其实心里还是比较着急的。目前知识结构比较散,想学的东西非常多,而且经常坑没开始,新坑就来了,所以打算做个简单的规划,主要把该做该学的记录起来,怕遗忘。
1)做:做方面,主要是丰富自己为主,一个技术博客以及Github我觉得必不可少,相当于自身实力的代言了。算法方向方面,考虑了很久还是觉得以:推荐系统、ctr、营销相关算法为主。(目前博客和Github看起来毫无含金量)
1.1、博客搭建:记录学习笔记、算法比赛思路、目前工作开发的一些东东
1.2、Github : 记录算法比赛开源,自研工具代码等
1.3、推荐系统、ctr、营销相关等算法比赛(旧的新的都行)。
2 )学:想学的坑太多,往后还是想往数据挖掘走,所以感觉有几个要学的还是无法避免.
2.1、深度学习:目前比较浅掌握RNN、LSTM时间序列相关的(工作需要),但深度学习整体还是比较模糊,这块要尽快抓起来,暂时主要以《动手深度学习》:https://github.com/d2l-ai/d2l-zh为主,吴恩达教学视频、《深度学习》为辅。
2.2、 java:本来预计学C++,因为身边同事模型上线时候要写taf服务(C++),但考虑了N久,感觉还是先学一个万金油的一点比较好,担心C++太难,以及入门后应用部分没有学习资源的问题。主要以《java核心技术卷2》,其他资料待补充。
2.3、leetcode medium难度:不多说,不刷找不到工作。
2.4、hadoop深入及mapreduce的运用:主要还是有个数据处理自己用python需要8小时,数据开发的同事写mapreduce只要30分钟被打击到,感觉还是要掌握这块,不过同事吐槽我没写多线程也可能是原因。资料:https://www.icourse163.org/course/XMU-1002335004
2.5、Spark:这个不多说,目前岗位没用这个,但也是必须的工具,主要以pyspark进行学习,考虑精力在学scalar。资料:https://www.icourse163.org/course/XMU-1205811805
2.6、框架tensorflow、pytorch:目前只很浅的使用过tensorflow,框架这块还是要好好学。资料:官方文档
2.7、Html、css、js:近期再开发自定义BI工具,深深体会到前端的薄弱,想做点产品,感觉这块还是需要的,虽然ployly.dash真得蛮好用,但这块html,css啥的也要比较懂才好发挥。资料:https://www.imooc.com/learn/9 (已解决)
2.8、teableau:我厂的BI工具都是时序相关的,所以这个最主流的BI就我自学时候接触过,比较浅,感觉还是要深入一些。资料:官方文档
2.9、可选项学习elasticsearch、redis:听得太多了,尤其是redis,这种缓存相关的我是完全不懂,感觉用得场景还是非常多的。资料:暂无
大致就这些,预计1年的时间都入个门在稍微进阶一下,内容确实十分多的而且难度有,对于能不能完成自己也没底,近期工作、生活上还是比较忙碌的,但身处看天吃饭的行业,不进则退,要好好挤时间学习才行,简单说,就是学习 - 写博客 - 比赛 - 工作数据相关工具研发 - github 如此循环。嗯,加油。
ps:有些同学反馈说技能太偏向技术,但数分还是偏业务的好。但我个人觉得刚工作的几年最好以技术积累为主,当然不是说抛弃业务,而是用技术更好的服务业务,无论数分、数据挖掘甚至算法我觉得都是以业务为主导的。自己这么规划,主要也是我这个非科班生对技术的一点点追求吧。
一个记录会计到数据、算法路上所学微信公众号:Dathon