=============
本人算法菜鸡,本科双非二本电子信息,研究生德国TU9的信息技术。因为本科毕业在事业单位工作两年,所以研究生毕业算是大龄应届生了。在18秋招年还在读书的时候就听闻学长说到国内算法岗已经开始卷了,但是那时候相对来说进大厂或者科技公司还算好进,有一些项目经历能进面试,还可以保小厂offer。进入19年开始难度陡增,而20年在疫情下又缩招,算法更是灰飞烟灭。没有头部大厂算法实习或者独角兽算法实习很多简历都过不了,而笔试难度也开始以leetcode的medium起底,时不时上一些hard题型。我之前的工作经验并不匹配算法,而实习虽然在德国车企的数据科学部门做一些算法,但是业务深度由于疫情影响也不太够格。
我本身的方向是偏向数据挖掘的,所以我投递的比较多是机器学习岗,数据挖掘岗,大数据分析岗。投递的领域有互联网,金融科技,制造业,车企,研究院。不过今年春招竞争其实比秋招还要激烈,而很多公司的招聘需求并不多,JD放出来但是并不捞人(也可能是我太菜了)。
华为(AI培训工程师):这个是春招第一面,准备很差,问了欠拟合过拟合,为何模型总是难以拟合真实情况,还有一个忘了,然后介绍下业务:他们是要给客户做AI技术培训的,要讲课,要经常出差。面试反馈感觉一般,但是还是进到第二轮HR面了,HR面反馈说不太好,不适合讲师这个岗位。
科大讯飞(NLP):一面自我介绍,问实习,问论文,问比赛,介绍自己常用的特征工程方法,问word2vec原理,python装饰器是什么,没手撕代码。因为c++不熟一面挂。
兴业数金(数据挖掘分析):一轮笔试,通过后一面自我介绍,问实习,问论文,问比赛,比赛用什么模型,评价指标,决策树模型原理,xgboost原理,xgboost和gbdt以及lightgbm区别,如何用决策树做特征重要性排列,IV值是什么,知不知道评分卡模型。一面之后没信。
中信信用卡(数据挖掘):一轮笔试,通过后安排一小时三连面,两轮技术面。一面自我介绍,实习,论文,问比赛,RNN和LSTM原理;二面问梯度下降原理,卷积核原理,简述欠拟合和过拟合可以预防的办法。面完一直在等消息。
美团(数据开发):这个是意外投的,因为我预料算法肯定是排不上,就投了简历稀缺的数开(笔试只ac了不到两道的情况下还能进是真的稀缺)。一面问了实习(因为实习用到了spark),如何搭建这个spark框架的,知不知道rdd是什么,SQL写得多吗,数据库接触的多不多,如何解决数据倾斜,手撕最长回文串。
一点资讯(算法):一面介绍毕业论文,问实习内容,问比赛内容,如何构建新特征,怎么做特征交叉,如何进行特征筛选,解释FM原理,LR+GBDT中GBDT是如何构造特征,wide&deep原理,做题和为s的两个数字。
明略科技(算法):一面自我介绍,问实习,因为面试管是CV组的大佬,问有没有接触过人脸识别,简单介绍下Transformer,实习用的数据量大小,论文发到哪个会议了,做题判断带括号四则运算式子是否合法,合法输出结果。因为我做CV比较少,俩人有点聊不到一起去,后面尬聊比较多,挂。
伴鱼(数据挖掘):一轮笔试,通过后一面上来直接做题:一道二维数组翻转求数组最大二进制和,没思路,挂。
PayBy(信贷/风控算法工程师):一个初创出海公司,主做阿联酋的移动支付和信贷业务,今年尝试少量校招。技术面就有三轮,英语面一轮,HR面一轮,前三轮轮都一个小时左右,总体感觉挺有技术沉淀的。一面自我介绍,介绍毕设,挖实习,询问树算法原理,xgboost的提升点,AUC是什么,高于和低于对角线表示意义,偏差和方差区别,手写几个pandas的代码,手写冒泡排序以及复杂度,介绍他们的业务;二面自我介绍,问竞赛使用的模型,怎么做的特征工程,手写LCS和Kmeans算法;三面是技术主管面,询问深度学习做的多不多,是否处理过海量数据,实习中是怎么用spark的,手写判断回文;英语面是阿联酋的一个HR面的,英语自我介绍,职业规划,为何选择留学。终面谈到工资,才发现出海业务的工资非常可观,如果有半年在境外,全年工资轻松可以上35w。
腾景研究院(机器学习):一面问实习,问毕设,问比赛模型,特征工程,问项目中的难点是怎么解决的,介绍他们的主要业务;二面居然是技术群面,四个候选人挨个对于当前提出的技术或者趋势问题,以及以自己的项目经验如何处理他们提出的技术问题发表看法,然后会有HR和技术部门的人对候选人单独提问(搞得像是论文答辩的自由提问环节一样,两个半小时下来都虚脱了)。三面就是HR面,问简历经历,问期望薪资,问留学,为何选择回国等。
吉利(大数据挖掘/算法):吉利这个面试很奇葩,不预约直接打电话。第一次接到的是国地联合算法部门的面试,由于一二轮的面试官碰上了,所以直接合在一起面。问了实习中数据分析解决的需求,用什么算法,比赛中又用什么算法,结果如何,介绍他们的业务,想做算法应用还是算法研究,反馈挺满意,他们说直接交给HR等他联系我;第二次接到的是吉润的大数据挖掘,问实习中数据大小,特征有多少,如何选择有用特征,问毕设,问xgboost对于GBDT的提升点,提升树的算法步骤,LSTM的原理,ARIMA原理,AR和MA区别。HR面先接到的是国地联合的,工资给的实在太低,拒了。
滴滴(算法):这个是在boss上受邀投的,所以直接进面试了,快车分单业务部。临时换了面试官,但是一面仍然面了一个多小时。上来也是自我介绍,然后写题,因为面试官临时上阵也没准备,手撕是快排,中间在循环嵌套的地方有一个小错误并不影响。然后进入项目深挖,挑一个比赛细讲,讲时间序列模型选择,序列分解,特征筛选的缘由,xgboost中使用feature importance的判断条件,讲一下DIN模型的原理,以及attention的思想,LR模型中为何使用交叉熵而不使用MSE作为损失函数(从损失函数建立的目标和效果上谈),CART树的优缺点,DNN中防止过拟合欠拟合的方法,如果训练集采样和全样本分布相同,可以避免过拟合吗(不能,交流了非规律噪声的影响)。然后进入到反问环节,问到业务部,技术栈,目前业务上的模型是哪些。整体面试体验非常好,没有压迫感,对每个问题都是在交流和讨论中度过的。现在在等二面。
挂在笔试的:字节,网易,百度,360,奇安信。
挂在简历的:搜狗,海康,多抓鱼,车好多,满帮,manteia,龙湖,小红书。
没人捞的:平安,bilibili,小米,上海银行,搜狐,友塔,度小满,陌陌,便利蜂,永辉,soul等等。
总结来说,因为我个人经历在算法这种要么985或者知名实验室毕业,或者在大厂算法岗实习或者有顶会论文的神仙打架的岗位上没有竞争力,所以还是比较吃亏的。总体面试的难度互联网和AI独角兽 > 制造业和银行独立出来的科技公司 >= 小公司。比较常见的面经能够应付一些小公司的面试,但是一旦进入大厂面试,每个知识点会问到更根本的问题上,经常需要从数学,或者更高的视角去分析因果,并且会对于每个项目(毕设,论文,竞赛)的每个点都会打破沙锅问到底,所以要详细准备。对于LeetCode这个还是早准备,要多刷,多总结,刷到400-500道应该就能应付大多数笔试和面试了。