【面经】百度NLP算法实习生--9.17

9月17下午2点面的百度富媒体组的算法岗,总共面了我3个小时,本来以为已经挂在四面上了,在面试过程中也觉得自己一度要挂,最后在18号中午11.30左右接到HR的电话说最后过了,收到offer还是挺惊讶的,也算是我第一次面过BAT的大公司了。

一面—计算机基础面
1.40到的公司,部门所在的地方不是百度的总部,想想当时去新浪面的时候看到百度的地盘,还是挺想去参观一下的。唉,稍微有点可惜。一面面试官是个妹子,也是我第一次遇到女生的技术面试官,也是我面百度最慌的一面(真的全是计算机基础)

  1. 先自我介绍一下自己吧(balabala)
  2. 背得不错嘛(hhh),看你简历上写到熟悉linux环境,讲讲你熟悉的linux终端指令吧(自己没想到会问这些东西,一上来不问实习不问项目也不问机器学习深度学习直接问Linux,硬着头皮说自己熟悉的指令。)
  3. 嗯,你知道awk指令吗(知道,但要看着教程才能写,用于处理一些文本,自己平时会用vim来处理文本)
  4. 找home下所有的以.dat结尾的文件用什么指令(find–不怎么用,开始慌),还问了几个指令忘记了。
  5. 讲讲你对hadoop过程的理解吧(从HDFS开始讲,再讲了mapper和reducer)
  6. 说一说静态链接和动态链接的区别吧(没答上来,真的觉得自己凉凉,这些计算机基础自己好久没看了,这里自己有反问她问什么问我这些计算机基础,这些在你们平时工作中起到什么作用)
  7. 讲讲TCP/IP的握手和挥手吧(没学过计算机网络,觉得大概一面就挂了)
  8. 那我们做个题吧,手写一下归并排序(以为只是最后走了流程写写代码了,有点小气自己的项目实习全部不问,然后就写了个归并排序,跟她讲了讲归并排序的过程–中途有一个小点还写错了)
  9. 在写一个吧,一个unsigned int的数二进制有多少个1(位运算操作,有很多思路,我写的和她想到的不是一个思路,我们两个也交流了一下)
  10. 那在问你一个,一个递增的数组,怎么把数组转化成一个二叉搜索树(递归过程,去中位数为父节点,写代码中有一个递归的地方考虑用队列,然后没写完就被她叫停了,说思路时对的,代码要写得比较久久先到这吧)

一下子问了三道数据结构题,又燃起了一点点希望,后面的面试也没有手写代码这一块了,然后她就说你计算机基础这一块比较薄弱,我这里还是给你过了,我去联系下下一面的面试官

二面–项目面
这一面开始就比较靠近算法在这一块了,面起来也顺了很多。

  1. 讲讲你的QA系统的项目吧
  2. 看你用了CRF处理序列标注,跟我讲讲CRF吧(结合HMM和他讲了讲,HMM的条件假设,CRF的全局归一,以及参数量的问题)
  3. BI-LSTM比LSTM有什么优势(反向的LSTM得到后面时序的上下文)
  4. LSTM为什么不适合处理长文本(长时序还是会有梯度的消失–其实自己不是很理解)
  5. 画一个LSTM的内部结构吧,跟我讲讲遗忘门和输入门,可不可以调换顺序,可不可以删除(画图,然后说都不能,跟他讲了讲GRU模型的优化)
  6. 讲讲batch_size和learning rate的关系吧(batchsize越大,每条数据的learning rate应该会小(自己也不确定),但是有可能难以收敛,且太大会出现内存问题)
  7. 你有什么问题要问我(问了觉得我表现得怎么样,然后问了个他问我我自己觉得答得不好的问题)

他说感觉我在模型这一块还是了解得不错,然后跟我说了说业务上的东西,说上一面面试官反馈不是很熟悉工程。然后让我等下一面

三面–机器学习基础面
这一面问了些机器学习的基础,然后加上一点NLP

  1. 跟我讲讲SVM的核函数的理解吧(SVM用一个超平面进行分类,对于一些在空间中线性不可分的问题,可以通过核函数转化到高维空间再进行分类,然后自己再和他说了说常用的核函数)
  2. 说一说GBDT和RF的区别吧(模型本来就完全不一样,然后首先说了一下在偏差和方差层面上侧重点不一样,在具体讲了讲这两个的处理流程)
  3. GBDT怎么处理过拟合的呢(XGBOOST中有讲,面试过程中只记得加了正则了)
  4. 我们讨论个题吧。有多个大文件,不能直接用内存读,每个文件的每一行都是一个字符串,要统计在这些文件中出现过大于一次的字符串。(应该有很多思路吧,我说了三个,第一个使用hadoop来进行处理;第二个讲字符串构成字典树处理,节省内存;第三是利用文件系统来处理,不依赖内存)
  5. 讲讲Word2Vec训练词向量的过程吧(讲了CBOW和skip-gram两个模型,讲了其中的具体思路以及两者的优劣)
  6. 讲讲你对LR的输出值y的理解(取到某一个类的概率)
  7. 那如果我把负样本下采样后的结果的y值又是什么意思呢(完全没有听懂他想问什么,最后解释了也没听懂)

最后主动介绍了一下工作上的业务,然后让我等下一面面试官(居然还有下一轮,面得也太jb久了吧)

四面–总监(经理)面
这轮是他们团队的经理面,完全不问技术,就聊聊人生,对我的性格上也提了一些问题

  1. 你对你的未来有什么打算以及规划?
  2. 讲讲你之前面试失败的经历
  3. 你性格上有什么缺点?
  4. 绩点不是很高啊。。。
  5. 在学校学了这么久有什么感受?
  6. 对加班这一块有什看法?
  7. 你有什么问题要问我?

最后我问他结果怎么样,他说不知道让我回去等消息,而且我以为最后一面会是HR面,以及在聊成绩和加班的过程中他一直在反驳我,我就以为我凉了,晚上回去还挺气愤了(面了3个多小时莫名其妙挂了我),不过也蛮对不起一面的小姐姐的,有点呛她。
最后在18号上午11.30收到了HR电话通知面试过了,也算有个好的结果。

你可能感兴趣的:(【面经】百度NLP算法实习生--9.17)