机器学习实习生面试总结(阿里 腾讯等)

转自:https://blog.csdn.net/Gavin__Zhou/article/details/71075217

如果侵权,联系版主删除。

以下均为大佬面试原文,与我无关,最近在准备实习生面试,转载了解一下套路。

今年来一直在找暑期实习,现在基本已经确定了,前后历经差不多2个月吧,发现了很多自己的缺点,同时也希望写出来供需要的人参考了解


先说下我自己的情况吧,决定去腾讯TEG的机器学习岗实习了,面试期间(3月初-4月底)投了不少公司的暑期实习(都是机器学习岗),大概有这么多吧(按照投的时间顺序):

  • 完美世界(笔试挂)
  • 美团(offer)
  • 阿里蚂蚁金服(offer)
  • 腾讯TEG(offer)
  • 滴滴研究院(offer)
  • 去哪儿(offer)
  • 360(笔试挂)
  • 商汤科技(一面挂)
  • 华为(offer)
  • 网易有道(笔试通过,面试要去北京我没去)

百度没投,它时间很晚(4月底笔试,5月初面试),然后我就没投了

每家的情况都说下吧: 
(1) 完美世界笔试挂,投的太早完全没复习果然gg了 
(2) 美团内推没有笔试(非官网投递),不过实验室的其它人都没获得面试机会(看脸??),一面就直接过了(做机器学习图像的),面试官还是很nice的,直接发offer了 
(3) 阿里就很坑了,3面技术面+HR面(更优秀的还有交叉面),然而我并没有,三面面的不好,问了我一堆java源码的,我没答上来,到现在我还没有拿到offer,一直是面试中,估计也没什么戏,时间真的持续了好久;有意思的是,一面的面试官说今年ML岗太火,他们倾向于博士。。。。也是醉了 
(4) 腾讯现场面的,两面+HR面,每一面都刷很多人,一面去的时候人山人海,二面就很少人了,HR面去的时候只有我一个,我差点以为我走错片场了。。。结果过了,TEG网络部的机器学习岗 
(5) 滴滴研究院,也是非官网投的,两面+HR,问的比较深,感觉滴滴研究院这帮做算法的水平很不错,之后顺利通过,大数据策略组的机器学习实习生 
(6) 去哪儿也是现场面的,一个下午就面完直接口头发的offer,效率很高,两面+HR,一面是个小弟面的基础,二面HR后来告诉我是数据组的老大面的项目,顺利过了 
(7) 360不知道怎么回事,笔试做的感觉还可以,3个编程题AC了两个然后也没过,听说招实习很少 
(8) 商汤科技也是内推的,过了笔试,一面是香港打来的,问的非常深,只问deep learning,其它不问,面了50分钟吧,gg了 
(8) 华为暂时还没面,因为我拿了华为编程比赛的奖,所以免了笔试,不过笔试也不难 
(9) 网易有道投的是java开发,听说笔试挂了无数人,然而我没挂,后来让去北京总部去面,报销路费,我决定再三还是没去,放弃了,因为实习不想去java开发(那么为什么我当时投java开发???)

其实还有微软,不过那编程题实在是做不出来,ACM编程题,有兴趣的去感受下hihoder微软2017预科生,另外告诉一点,即使是PM也是要做这个题的。。。


给我的感触还是很多,总结如下:

(1) 早准备,我就是去年冬天在外地出差干活没复习,今年来做笔试的时候就很吃亏 
(2) 好好刷leetcode,基本在线面试的笔试题都是leetcode的题 
(3) 实习经验非常重要,有实习做过相关项目的话很加分 
(4) 了解的广不如了解的深,最好要在某个领域钻研的比较有心得(比如推荐,用户画像,目标检测等),因为面试官会顺着你的简历一直往下问,比如你做了用户画像,他就会问你怎么做的?如何做的特征工程?特征如何选择?balabala… 
(5) 想去阿里的一定要java玩的溜,尤其源代码, jvm,集合框架这是一定会问的 
(6) 虽然说搞ML的集中在算法方面,但是最好还是要会Hadoop,Spark之类的,毕竟你算法需要数据,数据只能你自己去拉(滴滴和阿里面试官原话) 
(7)ML竞争很激烈,做好心理准备


5月6号更新: 
(1)阿里的蚂蚁金服offer已经拿到 
(2)分享面试的具体问题

  • 什么是boosting tree
  • GBDT
  • L1和L2正则为何可以减弱over-fitting?
  • L1和L2正则有什么区别
  • KNN和LR有什么本质区别
  • 怎么理解Dropout
  • 为什么random forest具有特征选择的功能
  • random forest有哪些重要的参数?
  • DNN为什么功能强大,说说你的理解
  • SVM的损失函数是什么?怎么理解
  • 介绍下Maxout
  • 项目中over-fitting了,你怎么办
  • 详细说一个你知道的优化算法(Adam等)
  • 项目(比赛)怎么做的模型的ensemble
  • stacking是什么?需要注意哪些问题
  • 了解哪些online learning的算法
  • 如何解决样本不均衡的问题
  • fasterRCNN中的ROIPooling是如何实现的
  • 如何进行特征的选择
  • 如何进行模型的选择
  • 什么是梯度消失?怎么解决
  • 常用的有哪些损失函数
  • XX用户画像挖掘怎么做的feature engineering?
  • 假设一个5*5的filter与图像卷积,如何降低计算量?
  • 做过模型压缩吗?介绍下
  • 什么是residual learning?说说你的理解
  • residual learning所说的residual和GBDT中的residual有什么区别?
  • FFM和FTRL有过了解吗?
  • 你对现在Deep Learning的发展和遇到的问题有什么看法?

基本这些就是我问的问题,不是一家公司,其它的问题还有,主要看你的简历和项目,这个每个人不一样


5月19号更新 
阿里大牛推荐了几本书(非基础类),虽然以前也知道可是没看过,大牛推荐了还是要看的,分享给大家: 
(1) Machine Learning A Probabilistic Perspective 
(2) The Elements of Statictical Learning

我自己推荐Bengio的”Deep Learning”一书

你可能感兴趣的:(机器学习)