面试经历记录~

目录

  • 奇虎360 牛客SP专场
    • 笔试 7.3下午
    • 一面 2021-0709 16:45 40min
    • 二面 2021-0716 15:25-16:00 35min
    • 三面 2021-0818 16:10-16:40 30min
  • 百度 提前批
    • 一面 2021-0716 10:00-11:10 70min
    • 二面 2021-0722 20:00-21:00 60min
    • 三面 2021-0727 19:00-20:20 80min
    • 口头offer 2021-0728
    • 测评 2021-0728
    • 意向书 2021-0806
  • 虾皮 提前批和正式批一起
    • 笔试 7.5下午
    • 一面 2021-0718 13:30 60min
    • 二面 2021-0803 14:00-14:45 45min
  • 旷视 提前批
    • 一面 2021-0721 17:00-18:05 65min
    • 二面 2021-0721 18:05-18:35 30min
  • 滴滴 牛客SP专场
    • 一面 2021-0725 13:30-14:20 50min
    • 二面 2021-0725 15:25-16:05 40min
    • 三面 2021-0725 17:00-17:30 30min
    • OC+意向书 2021-0826
  • 字节 提前批
    • 一面 2021-0726 17:00-18:20 80min
  • 阿里高德
    • 笔试 7.20 19:00-20:00
    • 一面 60min
    • 二面 8.2 11:30-12:05 35min
  • 阿里达摩院
    • 笔试 7.20 19:00-20:00
    • 简历面 8.9 下午 21min
    • 一面 8.11 16:00-17:00 60min
  • 腾讯
    • 一面 8.12 17:00-18:00 60min
  • 猿辅导
    • 一面 8.13 16:00-16:45 45min
    • 二面 8.20 16:00-16:45 45min
    • 三面 8.27 16:00-16:50 50min
    • hr面 9.2 15:00-15:30 30min
    • 意向书 9.16
  • 美团骑行
    • 一面 8.19 17:00-18:05 65min
    • 二面 8.26 16:00-16:55 55min
  • 贝壳找房
    • 一面 8.22 16:30-17:20 50min
    • 二面 8.22 18:00:19:00 60min
    • hr面 8.22 19:05-19:30 25min
    • OC 9.5
    • 意向书 9.10
  • 阿里夸克
    • 一面 8.24 10:00-11:00 60min
    • 二面 8.25 14:10-15:00 50min
    • hr面 8.26 14:00-14:50 50min
    • 意向书 8.28
  • 快手
    • 一面 8.28 17:00-18:00 60min
    • 二面 9.4 11:00-11:40 40min
  • 京东
    • 一面 8.25 10:40-11:25 45min
    • 二面 9.1 10:00-10:40 40min
    • hr面 9.6 20:30-21:00 30min
    • 意向书 9.15

奇虎360 牛客SP专场

6.23投递

笔试 7.3下午

7.4 24:00前完成即可

一面 2021-0709 16:45 40min

使用的牛客视频面试,这个部门做nlp的好像。。。好多问题人家都没法问,问了我也不会哈哈哈,感觉可能会因为不match给我拒掉。第一次记录,稍微多吐槽点东西

  1. 自我介绍
    自我介绍这块还是没太把握好详细程度,在介绍毕设和项目的时候有点太细致了,人家让我说的粗略点,我就把大概干了什么,有啥成果给人家说了一遍,感觉人家至少是听了个七七八八
    可能因为跟人家都不怎么相关,也就都没细问毕设和项目的细节。。就挑着我用到的一些模型啊之类的问了问
  2. 编程题
    这块儿算是问了我四个题吧大概,老哥出题很逗,逻辑上有点连续性,在诱导我
    (1)剑指offer 24. 反转链表
    说实在的还是又思考了一会儿,写的时候基本凭记忆,最后写完停顿了一会儿看看有没有问题,然后我说可以了。面试官挺逗,“你这好像有点问题,可以先提交一下试试”,然后提交,过了。。。。。。大哥尴尬了一下,自己写写画画说行吧。
    然后他说你算法是不是还挺好,我说稍微有些准备。
    (2) (改) HOT100 2. 两数相加
    这个题吧,没从牛客题库里调出来,我就觉得奇怪。
    题目是这样的,两个链表,每个节点存了一位数字,头结点放的是最高位,然后给这俩链表加起来返回加法结果。
    其实看着没啥,我说我拿草稿写一下。。结果一看,不大对啊,头结点怎么放最高位啊,我就跟面试官说,那这不太行啊,不能直接头结点相加,我得给先【反转链表】吧。老哥乐了,说行,这题就过了吧。
    他自己改题了。。。怪不得没从题库调。。。
    在问我下一题之前问我对排序了解吗,我说还行。之前好像还问了个什么,我好像不太知道,就没问
    (3)HOT100 15. 三数之和
    这题我想了半天。。人家问你有思路吗,我说有,就是不知道是不是合理(最优)
    他说那你讲讲吧
    那先说最简单的就是a,b两个遍历一下,先把数组放个set里,然后两重遍历,看c在不在set里就行了。
    然后优化一点的话我想的是a和b从两头往中间走,这样可能好一些,大哥说可以了,然后就无了。。
    (4)HOT100 121. 买卖股票的最佳时机
    HOT100就很久以前做了一两遍,印象不深。。这题我一开始想用dp,后来发现不需要。。然后又问了一下是写代码还是说思路,大哥说写一下代码吧,我先写的dp,写到后面关键部分求每个位置之前的最小值了,大哥知道我会就说那你讲讲思路吧,我说了一下,然后说似乎不用dp存这个数组,大哥说可以,就结束了。
    然后开始问技术
  3. 线性回归的形式,怎么拟合,然后求解方法,我说直接求梯度然后求解就可以了,大哥说那这样有啥问题吗
    我懵了。。。这样有啥问题???(哦是不是想让我说最小二乘法啊。。。他理解是我直接连立方程组求解了吧。。。。。这样好像确实说得通哈哈哈)
  4. LR和线性回归的区别,为什么用sigmoid
    我直接就说伯努利分部指数簇那些复杂回答了。。。刚说没两句,大哥懵了。。。。不知道啥是伯努利。。。。得我寻思后面他也不知道了呗,我就说sigmoid输出0-1,对于这个二分类比较合适啥啥啥的。。。然后又给手推了一遍ln(y/1-y)这个公式,写了一下sigmoid的公式
    (当初面阿里我就这么回答的,然后面试官说不够,问我知不知道指数簇。。。。。。天道好轮回)
  5. LR损失函数是啥,怎么求解
    我说对数损失函数,他好像很疑惑,我又说求对数之后算极大似然。。。然后梯度下降牛顿法啥的
  6. RNN、LSTM
    看我用到了就问了问,介绍RNN,然后为什么梯度消失爆炸,怎么解决
    LSTM是什么,怎么改进,三个门都是干啥的,怎么起作用,基本上等于是说了一下LSTM全套公式都干了啥,信息怎么传递的
    然后想问我nlp相关的问题,LSTM怎么做语句分类,我在思考的时候他以为我不会就问我在项目里怎么用了。后来还问了Transformer啥的,我说我简历后来改了,没太了解,他就没问了
  7. 问我Spark会不会,原理啥的,还有flink
    我就说只会用一点,但是都忘差不多了。。。让我说用过几个算子,我说reduce、maptopair、flatxxxx什么的,反正就不咋行
  8. 还问了一下移动项目数据预处理干了啥都,大概说了说数据质量不行、存在一些问题,要给解决
  9. 反问
    可能还有点其他的问题。。反正nlp相关的都不会,他也没纠结,其他的差不多就胡诌,大哥看差不多就结束了,反问我就问了一下是不是项目做nlp,他说是,不过也没太多说,我一时间也没太想好反问啥,就结束了。

二面 2021-0716 15:25-16:00 35min

这位面试官很有趣,不问技术,就问一些抽象的问题,考察思维方式。。。

  1. 说说自己擅长什么不擅长什么
    我说我擅长解决问题运用知识,不擅长写文档。。。
  2. 问我虎门大桥项目里面我负责的什么部分的代码
    还说了一下感觉我们应该很容易出去实习,没实习有点可惜
    我说实验室项目质量够,而且实验室不允许出去实习 (尬
  3. 说说同学眼里对自己的评价(自吹自擂)
  4. 对未来的规划是什么
    我说我喜欢提前收集信息做些准备啥的。。未来积累技术(不敢说去大厂跳槽啊)
    补充:感觉这方面没做好准备回答,当时有点踩雷了,要引以为戒,提前准备一下类似问题了!
  5. 反问
    我问怎么不问技术。。。
    部门干啥的,说是搜索下面的二级部门啥的

好像没啥了。。。反正一共就没多会儿,我还一直在看时间等着问我技术或者算法 - -
有点神奇

三面 2021-0818 16:10-16:40 30min

hr面,今天网太差了。。。断了两次,就改用4G了,不过一开始hr也鸽了我半个小时。。。从15:45推迟到16:00,结果16:10才来才开始

  1. 自我介绍
    1. 毕设
    2. 项目
  2. 讲了前两个就不让继续讲了,问作为负责人遇到过什么困难问题
  3. 有什么offer,在面其他的么
  4. 怎么看待360和其他厂,职业规划
  5. 反问
    1. 新人培养体系
    2. 工作压力怎么样:在中大厂里算比较小的(我说那挺好,我还比较在意)
    3. 部门分了么:就前面面试官就是部门同事了
  6. 感想
    感觉在问和其他大厂比较的时候还挺难回答的。。。不知道面试官会不会因为我还在面其他的就给我挂了 = =

百度 提前批

官网内推 7.12 投递 7.13被捞,进入面试流程 7.15通知7.16面试

一面 2021-0716 10:00-11:10 70min

使用百度的面试平台 如流,视频+桌面共享

  1. 介绍
    1. 介绍毕设
      算是稍微问了问一些处理数据的问题,对具体模型实现不太关心。。
    2. 介绍中移动
      面试官好像很关注算法有没有落地,我说那这样的话我再介绍一下虎门大桥
    3. 介绍虎门大桥
      说落地了,人家采取了定价策略,并且流量符合预估,也有挑战杯拿奖
  2. 问LR,让介绍一下,然后问LR适用于什么类型或者特征的数据(可能应该答高维稀疏吧,这个没太get到点,胡诌了一大堆)
  3. 问机器学习这些还有哪些用过熟悉的,我说XGBoost我用过当basline,来给你讲讲
    然后我就把我知道的包括和GBDT的对比,然后到列采样、分位数法(全局、局部分箱、分位数加权分位数)、计算增益公式什么的都说了
    问我缺失值怎么处理,能不能并行计算,我说分裂时候层内特征间可以,层间不行,得串行,树与树之间呢,肯定不行,boosting都是串行的。
    问黑白样本不平衡问题XGBoost有啥办法,我不知道了。。。就说了调整阈值、欠采样、过采样,但不是树模型的方法
    然后问我XGBoost适合什么类型的数据。。。。又问我这个问题,我还是不会,他说你可能没怎么遇到过实际问题,就过了。
    这块说一下,这大哥对XGBoost应该是挺了解的,很深入,所以他再多问一些工程上的问题我就都不懂了,我俩也达成共识,我就知道理论,实践上还是不太行的
  4. 问深度学习问题
    我说CNN、RNN都行,然后就问梯度消失爆炸的原理,怎么解决;LSTM的重点解释一下
  5. 算法题(已经过去四十分钟了,才开始算法)
    1. 求两个数组的交集(可能有重复的)
      我其实不知道答案,想了想是用两个dict存数组每个数出现的次数,然后遍历a的keys看看在不在b的keys里面,然后往answer里面append min(dict_a[i], dict_b[i])这么多的i
      问我时间和空间复杂度
      O(m+n), O(m+n)
    2. 问如果数组是排序的有没有更好的解决办法
      双指针,O(m+n)
    3. 问如果a数组特别特别长,b数组特别特别短,有什么更好的办法
      想了想那就二分查找呗,复杂度我说是nlogm,他说不对你再想想,结果我也没答对,就先写代码了。最后提示我强调说b特别短,我说那就是logm,n太小了因为是渐进复杂度就算到O里面了。
    4. 最后说因为工程很重要,所以一定要问我一个spark类似的数据处理问题
      假设有很多user,很多query,一条记录是[user_i, query_k],需要构建一个图,节点是user,边就是两个user在某个query上共同搜索的次数,所以有多少个query类型就有多少条边,边上的权重就是功公共次数
      我说应该reduceByKey,key就是query,但是我一直不知道怎么才能存成user两两之间的共同次数。后来我说重写reduceByKey在聚合时候的算法,本来相同key了之后返回的是x+y,这样对于同样的key可能所有用户就都放一起了,这样不符合要求。我就把返回的东西改了一下,存成[[u1,u2,1],[u2,u3,2],[u1,u3,1]]类似这样的结构,然后输入的时候如果x也是这种list,y是一个user,就能合并,如果两个都是个user,就返回成[[u1, u2, 1]]这样,反正大概是这意思,这个问题他虽然说时间不够了,但是抓着这个问题一直让我思考,说考察数据处理的能力。可能最后就是过了
  6. 反问
    说这个组不太卷,没有什么科研要求,就是做算法落地。增长策略部门,包括业务增长和反作弊(广告流量数据之类的),然后说全百度的钱相关的数据都要经过他们来审核判断之类的,反正吹嘘一下吧。另外他问了我一下有没有offer,可能对我还算满意?感觉可能面的还行

二面 2021-0722 20:00-21:00 60min

使用百度的面试平台 如流,视频+桌面共享

  1. 自我介绍
    讲到毕设,然后大概问了一下核心的创新点是什么
    后两个项目没让讲,就开始提问了
  2. 线性回归的损失、逻辑回归的损失公式怎么写
  3. 决策树相关,问我熟悉什么,我说XGBoost,让我说怎么做分裂的,具体是让说计算的是什么
    我就说的一阶导的平方除以二阶导加λ
  4. 集成学习大概介绍一下
  5. 集成学习的boosting和bagging,哪种对基学习器的要求更高
    这题我没答到点上,他问我说如果10个学习器准确率都不到40%,集成起来会不会更好?
    我说应该会,书上有公式,他也知道,但答案可能是不会更好,bagging对基学习器的要求更高,因为如果每个学习器的准确率都很高,那集成起来就会更好,反之可能会更差。
  6. SVM的损失函数是什么,写出原问题和对偶问题以及只有α的那个求解出来的公式(我写pad上给他看的)
  7. 问CNN, 3 × 64 × 64 3 \times 64 \times 64 3×64×64的图片,用 5 × 5 5 \times 5 5×5 的卷积核卷完了大小变多少
  8. 我毕设用了attention,所以问我transformer,让我画个transformer的结构
    画pad上给他看,他说我没画残差。。。。(我简历里并没写transformer)
  9. 最后二十分钟说写两个代码题(并不是算法题。。。。。。orz)
    1. 用pytorch写一个attention的计算过程,要能运行出来结果
      我随机初始化了一个[8, 64, 128]的x,然后写了个attention计算的类,里面包括qkv的计算,还有个softmax,稍微有点小问题一开始忘了转置了,后来改了一下运行处了结果。然后面试官让把代码发到如流上面交给他(不知道为啥。。留个底儿?)
    2. spark题,1w行,5列abcde,让统计c列有多少不同值,也要写spark。。。。。
      我跪了。。时间有点久不会了。。。我说要不说个思路或者写伪代码,面试官说那不用了,不写代码比较简单就没意义了,然后就结束了
  10. 反问
    问部门业务,介绍是说所有百度广告的反欺诈、风控啥的,技术上除了CV基本啥都有。。用图、序列等,也有nlp。
    我问部门规模,他说这个不能透露哈哈哈哈,搞得我还挺慌,他说这个有点敏感不能说,不过还是很大的,然后有很多小组,大家有不同分工,如果能进这个部门会根据兴趣以及人力的分配来决定。
  11. 另外补充一点,这位面试官有一些说话结巴不完整,要不就是一串说出来的情况,应该是有一些先天的问题,但是感觉他本人还是挺厉害的,很不容易,很佩服,面试过程中,还有人和他打招呼,关系非常好的感觉~ 虽然面试过程对我俩都多少有一点困难,但面试官人还是非常好的,也想对面试官表达个感谢和祝福。

三面 2021-0727 19:00-20:20 80min

使用百度的面试平台 如流,视频
leader是一位小姐姐,感觉还是很有经验的,而且考察的内容也很多。

  1. 自我介绍
    1. 介绍毕设
    2. 介绍项目
  2. 问遇到的困难
  3. 问和同学沟通遇到分歧
  4. 问和导师沟通是不是跟和同学沟通一样
  5. 做项目负责人的压力(需要承担什么)
  6. 遇到的困难
  7. 怎么考虑研究方向不同的问题
  8. (…聊的很多很细想不起来了)
  9. 介绍部门业务
    这个部门是增长和风控技术部,做用户增长和商业流量反作弊。下属方向很多,主要意思就是和黑恶势力对抗,因为对方是想要获利的技术团伙,而且技术实力也很强,且业务场景丰富多变,所以这个部门的业务还挺有挑战性。同时给我介绍了一下百度体系里面的这个职业路线,也讲了很注重新人培养(这个问题我还挺看中的)。最后说因为我没有过实习,所以讲的比较多,加过微信了,如果之后有什么问题可以随时沟通(但我怎么总感觉意思是我要挂了呢QAQ)。。。

口头offer 2021-0728

测评 2021-0728

意向书 2021-0806

虾皮 提前批和正式批一起

6.22投递 7.2通知7.5笔试

笔试 7.5下午

AC 2.6 / 3

一面 2021-0718 13:30 60min

  1. 自我介绍
    讲了讲项目,稍微提问了几个(面试结束前说你这项目比较薄弱)
  2. 算法题
    1. 第一题
      两重循环暴力求解,问我复杂度,有没有更好的办法
      = = 不会,告诉我前缀和,我还是不会。。。就下一题了

    2. 第二题
      这个题更不会了。。。还O(1),我直接懵了。。。面试官说你讲讲思路先
      我捋了捋,我说没法O(1)啊,他说那你先实现个最简单的
      实现完了复杂度是O(n)
      告诉我应该用hashmap,key是那个string,value是个链表的node。。。。。。

俩题直接过去了半个小时

  1. 基础知识

    1. 进程间通信
    2. 计算机网络,给你个baidu.com,那几个层什么的,都什么流程
      对于这几个问题。。我真不会
      他说他也不是算法岗的,但他认为基础知识很重要,问的也都是课程内的东西。。。。。。。我还真无法反驳。。。
  2. 问算法(就是随便问问)

    1. 特征怎么判断好坏,有没有用?
      我答了看权重大小(LR、正则化什么的做特征筛选)
      问我深度学习怎么看,我还是说w是0
      最后暗示我意思是看p-r曲线、ROC曲线的面积
    2. 过拟合的原因、怎么解决
  3. 反问
    我就问的为啥不考算法考这些个。。。他说我不是搞算法的,问你也问不出什么,看你项目比较薄弱,就问问你基础知识,这都课程内容的,应该能掌握,看看你的理解。。。。。。(其实大概也是因为虾皮面试官不够了,面不过来,我大概就是个炮灰)

  4. 估计没了,虾皮这一套有点顶,可能外企都这样??

二面 2021-0803 14:00-14:45 45min

  1. 自我介绍
  2. 介绍毕设
  3. 介绍项目
    讲到中移动的差不多就不让讲了,大概知道我做的是什么了
  4. 问LSTM、GRU
    问门控怎么解决消失爆炸,从梯度公式上讲
    说残差也相当于是个门控,怎么理解(当时没反应过来)
  5. 问参数初始化方法
  6. 问如果全初始化成0会怎么样;如果初始化的方差太大了会怎么样
    对称,没法更新;会使得每一层的输出越来越大,形如tanh激活函数,就会容易导致梯度饱和的现象
  7. 问如果是embedding全初始化成0会怎么样
    好像不会有问题,因为本身词的选择打破了对称,面试官想了想说应该没问题
  8. 问word2vec,我不会。。
  9. 问AUC从概率上怎么理解
    我说任取一个正样本和一个负样本,他说这个没错但不是从概率
  10. 问只有一个负样本且负样本的预测概率很高的时候,AUC是多少
  11. 算法题
    1. 给定score,labels,算auc
      我就算的两重遍历正负样本。。面试官说没错,但是可以 O ( n ) O(n) O(n)解决的
    2. 给定一个list,比如[-5, -2, 0, 1, 4],返回 x 2 x^2 x2的排列,要求时空间复杂度都是 O ( n ) O(n) O(n)
      这个就一次遍历就行,额外使用一个栈存一下负数这边的平方,遍历到非负数的时候和栈顶比个大小,再依次append到ret里面就行了。
  12. 反问
    1. 问部门业务,面试官说现在是个大类,还没分具体部门,如果进了会再分。业务内容上讲非常丰富,什么都有
    2. 问机器学习多还是深度学习多,面试官说深度学习效果好太多了,所以还是深度的多
    3. pytorch还是tensorflow,面试官说这个不太重要,看部门喜好,但面试官也吐槽了一下tf难写,没有keras根本不知道怎么写
    4. 我另外问了一下面试官人在哪,他说他在新加坡,跟我吐槽网不好,前面面的俩人都听不清说啥呢

旷视 提前批

6.27投递 免笔试

一面 2021-0721 17:00-18:05 65min

  1. 自我介绍
    讲论文,讲项目,稍微描述了一下细节,面试官说不是这方向的听不懂,让我简单说说就行了。
  2. 问用过什么模型
    我说XGBoost当baseline
    面试官就让讲讲,也没别的要求就讲讲。
    我就开始了。。。后来给他讲的不想听了,可能也是时间有点久了,就结束了。
    其中也问了点问题,比如为什么二阶泰勒展开就好就准了,我回答是一阶导确定方向,二阶导确定大小,反正大概应该就是这个意思的。
  3. 问Transformer
    我说我不太会。。。。。没想到当时投简历写了Transformer忘了删,就大概从头到尾讲了讲,但是说了我不做NLP所以mask的什么不太理解。
  4. 出个数学题
    54张扑克牌去掉大小王,给四个同学,每人13张,问有个人拿到1-13同花顺的概率是多少?
    我想了想也跟他讨论了一下,我感觉他也没做过怎么,也一块儿跟我想哈哈
    答案可能是 4 C 52 13 × 4 \frac{4}{C^{13}_{52}} \times 4 C52134×4,意思就是对于某个人,等于52张牌给了他13张,然后有四种同花顺可能拿到,然后因为是4个人,所以又乘4.
  5. 编程题
    leetcode原题做了一点修改4. 寻找两个正序数组的中位数
    把这里的中位数变成了上中位数,且两个数组长度相同,都是N,稍微降低了一下难度
    不过我还是拉胯了。。。。二分法没写对,大概思路是记得的,但是不完全记得,所以一直有bug,面试官就和我一起改bug。。。。。。最后也没改出来,但基本也差不多了,面试官看到点了就喊停了
  6. 反问
    就问部门业务、氛围、加班程度之类的。另外面试官也问了一下我为啥找CV,这其实倒是好说,毕竟去哪儿都得几乎重新学,而且我毕设跟CV算是有一丢丢相关。

二面 2021-0721 18:05-18:35 30min

一二面是一起的,可能照顾我吧,二面时间不长,也可能就根本不想要我随便应付一下 orz
面试官也有意思,吃这东西就进来了哈哈哈,好像是在家办公的。不过感觉遇到的这些面试官人都很好

  1. 自我介绍
  2. 讲毕设讲项目
    这位面试官可能大概能理解我做的毕设的内容,就听的比较多,然后也问了我毕设的一点细节
  3. 编程题
    剑指 Offer 04. 二维数组中的查找
    差不多是对这个题做了个修改,让每一行数组的开头都严格大于上一行数组的结尾,判断target在不在数组里就行了
    用两次二分法就可以,然后稍微有点小bug,调试的时候面试官也稍微给提了个醒,就通过了。
  4. 反问
    因为和一面面试官有了一些提问,就没提问什么内容。就结束了
    (一二面连着还是在晚饭点,讲的我精疲力尽。。。。。结束之后感觉想哭TAT,不过感觉面试过程还是可以的,面试官人也都很友善)

滴滴 牛客SP专场

7.6 投递 免笔试

一面 2021-0725 13:30-14:20 50min

  1. 自我介绍免了,直接介绍

    1. 介绍毕设
      问了一些细节
    2. 介绍中移动
  2. 算法题
    任务背景就是要找到所有拥堵的路,因为路网数据把路给打断了,要重新连接起来。
    给你一堆拥堵路段 road = [1,2,3,4,5,6]
    以及连通关系 dict = {1:[2,3], 4:[5,6]},大概是这意思
    要求返回 ans = [[1,2,3], [4,5,6]]
    意思就是把他们联通的给连起来

    方法应该就是dfs,每次开始dfs的时候用个list存就行了。。。一开始想的太复杂了还想着怎么合并集合。。。。。

  3. 反问
    问了业务,说这还没分具体部门呢,只是网约车部门这一个大部门下。

  4. 今天有点感冒头疼,状态不好,但面试官人很好,就是背景音有点嘈杂哈哈,能听到其他人也在面试。结束后五分钟收到二面通知,感谢面试官让我通过了一面!

二面 2021-0725 15:25-16:05 40min

  1. 直接介绍
    1. 毕设
      面试官也做过我的方向,问了一些细节,讨论了点问题,问的还算比较多,一直在问有没有跟其他方法做比较,非网格数据,具体到路段之类的。
    2. 项目
      中移动的就简单讲了一下,他了解了就过了
  2. 机器学习问题
    1. xgboost
      问我什么熟悉,我说xgb吧,问节点分裂的公式
    2. SVM的KKT条件的那几个不等式
  3. 算法题
    HOT100 300. 最长递增子序列
    太拉胯了今天。。。脑子完全不清醒,一上来给写了个单调栈,后来人家说不对,用动态规划。。。。。然后我重写了一下,差不多就结束了。
    面试官让我写上ACM输入的那个,我竟然突然给忘了,map那个东西写成lambda了。。。。唉
  4. 反问
    我都不知道问啥了,巨尴尬,脑子嗡嗡的。。。随便问了问科研氛围什么的,加班什么的,面试官倒是全程都很直接,问问题也是直接问关键点,提高速度,我反问的问题也是直接告诉我工作为主,科研分享想有可以有,但也得大家有时间,想科研别来互联网哈哈哈。加班互联网也都一样
  5. 结束后五分钟收到三面通知,再次感谢面试官!

三面 2021-0725 17:00-17:30 30min

  1. 介绍
    1. 介绍毕设
      问了些问题,问还尝试过其他模型么
    2. 中移动什么的一句话带过了没怎么关心
  2. 算法题
    剑指 Offer 55 - II. 平衡二叉树
    我一开始用了全局变量记录是不是True,面试官说不要用全局变量,优化一下,我就放到返回值里了
  3. 还了解什么深度学习模型
    我说那我RNN、LSTM、GRU这些准备挺充分挺熟的,就从头到尾介绍了一遍
  4. 介绍Transformer
    我说我没怎么了解NLP,不过给您介绍一下Transformer的结构,从头到尾讲了一下,不过其中mask这块儿的内容确实不太了解
  5. 反问
    1. 问了问有没有对新人培训的工作
    2. 目前技术上用什么语言比较多,说离线的话python、tensorflow,在线就是C++
    3. 三面的面试官级别是递增么,我就是好奇问了一下,面试官说是,我说您是部门主管吗,面试官顿了一下说不算是哈哈,应该是级别比较高
    4. 如果有后续的话大概是个什么流程,面试官说如果还有那就是一些类似hr的面试或者谈薪资待遇之类的
  6. 总结
    相比之下感觉三面的过程反而倒是顺利一些。。算法题做出来了,然后介绍RNN、Transformer这两套也一直在输出,面试官看起来也算是认可。整个过程中面试官也很nice,感谢面试官。今天虽然一口气面了三次,但二面时候面试官还跟旁边人说他已经面了五个,都不容易啊,超级辛苦。许愿成功拿到offer,嘻嘻。不过感觉今天整体面试上比较坎坷,也许整体评价不会很高,主要是算法题上的问题,还需要再加强。

OC+意向书 2021-0826

字节 提前批

7.20投递 免笔试

一面 2021-0726 17:00-18:20 80min

  1. 讲毕设
    这里问了我很多细节问题
    我的注意力机制是时间和空间分开算的,面试官问如果一起算会有什么问题,为什么效果没有提升,过拟合了还是什么原因
    问我后续有没有其他延伸,我说后续尝试做一种新的数据结构(后来得知面试官认为我的思考不够深入)
  2. 算法题
    428. 序列化和反序列化 N 叉树
    这题。。。还是个leetcode plus会员题。。根本没见过,思路和二叉树的又不太一样,在面试官的引导下最终算勉强完成。
    (但后来得知面试官认为这题挺简单,有一说一没见过这题我真不会)

阿里高德

7.19投递

笔试 7.20 19:00-20:00

一面 60min

二面 8.2 11:30-12:05 35min

用的阿里会议

  1. 自我介绍
  2. 讲毕设
    深入了解了每一个步骤是怎么操作的,对着论文讲的
    问我最大的困难
    问了我说用了attention能有什么好处,为什么不直接堆叠卷积
  3. 说出五个比较了解的机器学习深度学习模型
    CNN、RNN、LSTM等、XGB、LR、SVM
  4. LR的损失函数是什么
  5. 在三分类的情况下交叉熵的公式
  6. GBDT的梯度长度是多少
  7. 场景题
    1. ETA预测问题,不太熟就换了
    2. 上车点任务
      输入一个乘客的上车点(x,y),返回一个推荐的上车点(x,y),已知信息是全部历史数据(包括别人)、路网信息等
      我说就道路匹配之类的,然后可能把历史的所有附近上车点给聚个类
      (后面反问了一下方法,面试官说这个是个推荐算法,把历史上车点当类别,排序最高的作为推荐点)
  8. 未来规划
  9. 反问
    1. 场景题的方法
    2. 深度学习框架用什么,回答是tensorflow
    3. 用C++吗,答python+SQL,我还问不用spark吗。。。蠢了 - -

阿里达摩院

7.19投递

笔试 7.20 19:00-20:00

简历面 8.9 下午 21min

给我介绍了一下部门工作,做偏底层的图计算系统,问我简历内容

一面 8.11 16:00-17:00 60min

电话面,邮件给链接上伯乐写代码

  1. 自我介绍
    1. 讲毕设
    2. 讲两个项目
      问了我怎么处理的中移动数据,用的什么(spark),集群大小
  2. 会议问题
    一堆会议,有开始时间和结束时间,问怎么安排才能排下最多的会议
    答说按照结束时间进行排序,贪心算法。
    让证明。。。。。。。。。不会 - - 我就尝试举了个反例
  3. 两个鸡蛋100层楼问题,什么策略,为什么(我忘记了。。。推了半天也没推太明白,就说了个策略和答案)
  4. 编程题
    23. 合并K个升序链表
    问我合并所有链表和合并两个链表的分别的时间复杂度
    合并所有应该是log(k),合并两个应该是log(m+n)
  5. 反问
    讲解一下部门业务,问了问加班情况以及办公位置
  6. 感想
    估计是没了,感觉在为我降低难度。。。应该是照顾我的面试体验,面试似乎很注重原理,要能讲出来细节上的“为什么”。另外面试官小哥也有一丢丢交流困难的感觉哈哈哈,不太爱说话的样子,但这样的人更强啊 = =
    达摩院 体验卡结束~

腾讯

8.8投递

一面 8.12 17:00-18:00 60min

  1. 自我介绍
    1. 介绍毕设
    2. 介绍中移动
    3. 介绍虎门大桥
    4. 讲完面试官说:工作还不少啊(头一次听见有人肯定。。。。)
  2. 介绍CNN
    1. 中间问我模型里面都调哪些参了,都有哪些,还有哪些,直到问到了dropout。。。然后问我用没用,我说前面人都不用,大概是因为回归问题用了这个信息会丢失,并且实验效果也没什么提升。就一直问我怎么调模型解决过拟合的。。。
    2. 后来说到padding的问题也讨论了一下
    3. 问我了解感受视野么,又讲。。我说俩33的感受野就是55了,问我为啥要大感受野
  3. 介绍XGBoost
    我给他说了个大套餐。。。说到加权分位数的时候他好像有点不太了解,还问我确定不,我说就是这样。。
  4. 介绍LSTM
    三个门,解决什么问题,为什么提出
  5. LR写目标函数
  6. MLP的反向传播,一层的就行了(估计主要看sigmoid)
  7. spark数据倾斜怎么办
    我说不了解底层,就过了
  8. 编程题
    1. 5. 最长回文子串
    2. 剑指 Offer 07. 重建二叉树
  9. 反问
    部门是腾讯地图,说是跟我相关,不知道我愿不愿意来,我当即大喊当然愿意了这么相关!
    然后问工作压力,答:互联网嘛…
    不做科研,做算法落地,不做花里胡哨的

猿辅导

8.8投递

一面 8.13 16:00-16:45 45min

用的牛客,不让切出画面

  1. 自我介绍
    1. 科研
    2. 项目1
    3. 项目2
  2. 问隐马尔可夫的假设
    我只说了每一时刻仅和上一时刻相关
    面试官说还一个观测独立,然后还说后面有提出来解决啥啥啥的。。。不懂
  3. 问LSTM和RNN的区别
  4. 编程题
    面试经历记录~_第1张图片
    前缀和+字典,记录每个前缀和第一次出现的位置就可以了
    1. 124. 二叉树中的最大路径和
      面试经历记录~_第2张图片
  5. 反问
    部门业务,告诉我这是交叉面,面试官是NLP的

二面 8.20 16:00-16:45 45min

  1. 自我介绍
    就介绍了个毕设,后面没让讲项目了
  2. spark宽负载什么的,不会,过了
  3. XGB为什么快
    选数据集、选特征、分位数法、并行计算
  4. Transformer讲了一套,原理,结构,损失函数
  5. BN和LN
    后来问nlp里面用BN好还是LN好,开放性问题可能没有标答
  6. 算法题
    1. 543. 二叉树的直径
      输入一棵二叉树的根节点,求该树的最长路径。
    2. 221. 最大正方形
      做完了之后讲思路,然后拓展成矩形。。
      85. 最大矩形
      问我刚才的办法还能不能行,我说能,他想了想说应该没问题。。。没让我写完整过程了
      (其实好像根本不对)
  7. SVM的损失函数
  8. 正负样本数量差距很大的时候SVM有什么影响么
    没有,因为只和支持向量相关
  9. 如果不是SVM,正负样本数量差距大的话,这条线应该怎么画呢
    我说可以靠近数量多的那边,面试官说那不就有可能造成那边误分类,我说更有可能造成小样本那边误分类,就是那种准确率99%但小样本几乎没有对的的情况
  10. 反问
    1. 部门和规模
      说是三面可能会问意向部门,整个AI Lab大概200人
    2. 谈到了双减政策问题
      面试官说虽然线下受影响,但线上不受影响,因为家长可能对网课要求更多了。目前员工待遇依旧很好

三面 8.27 16:00-16:50 50min

  1. 自我介绍
    1. 毕设
      多了解了一下任务内容,方法上偶尔提问
    2. 中移动
      问为什么用信令数据
  2. 编程题
    面试经历记录~_第3张图片
    大概用了二十多分钟吧,应该就是个循环多次dfs。。。一开始有个bug,调整了一会儿,面试官说差不多,不过我的方法有点复杂,可以稍微优化一下
  3. 反问
    1. 部门分配
      进去的话就跟着这个面试官,四个子业务,其中有个自适应学习,是用来评估学生学习能力,分析哪里好哪里不好,从而推荐学习方向之类的。。
    2. 工作时间
      早10晚7
    3. 新人培养
      没有专门培养课程了,但是会每周论文分享,讨论之类的

hr面 9.2 15:00-15:30 30min

  1. 自我介绍
  2. 虎门大桥项目成就感在哪儿
  3. 为什么写了个四中还中间差了一年
  4. 怎么投的简历,大小厂都投吗还是就大厂什么的
  5. 怎么看待双减政策
  6. 反问
    1. 工作时间
      早10晚7不打卡不怎么加班,九点以后打车免费,周末加班可以调休,或者双倍工资
    2. 两周内出结果告知是否通过

意向书 9.16

美团骑行

8.6投递

一面 8.19 17:00-18:05 65min

  1. 自我介绍
    1. 毕设
      多了解了一些我的任务内容,最后说和他们的场景比较接近,但他们不用这种方法,用DNN推荐什么的
    2. 中移动
      问了我处理数据的时候有什么难点,我有点摸不着头脑,大概说了说可能遇到的问题,重点要分析数据,掌握数据全貌
    3. 虎门大桥
      问了问怎么设计的通行代价
    4. 问kaggle比赛,我说有点远。。。就记得用了xgb调参做数据补全什么的
  2. xgb和gbdt的区别
  3. 问xgb怎么看特征重要性,我就说我了解个输出分裂次数、还有个增益均值,另一个不记得了
  4. 文本等离散数据怎么处理,我说就one-hot。。。然后问还有啥么,我说不怎么接触
  5. xgb缺失值怎么处理
  6. LSTM的门
  7. 什么情况下使用神经网络,什么时候用其他的
    我不知道是不是问我那三句话,就看数据量和特征数量的。。。
  8. 两支球队,一个1000场赢100场,另一个10场赢了1场,你选哪个去参加比赛
    我以为是个什么极大似然什么的,憋了半天。。。。。
    面试官说你想复杂了,这就是个偏差方差,1000场的肯定更稳定,我说那就是偏差一样,但1000场的方差小,所以选这个
  9. 算法题
    121. 买卖股票的最佳时机
    没什么难度直接a了。。。
  10. 反问
    1. 部门业务
      给我讲了还挺多挺细致的
    2. 技术栈
      跟我说了说他们用到哪些方法,baseline可能是个树回归,然后他们主要使用DNN做推荐算法好像,然后不断优化提升,流量预测这种也有,除了流入流出还有个供给特征。
    3. 问我职业规划?我懵了怎么问这个。。。后来说是问我会不会考公什么的有没有户口需求,他发现我北京的,似乎还听过我高中。。。

二面 8.26 16:00-16:55 55min

这位面试官压迫感好强啊。。。感觉是个海归

  1. 自我介绍
    介绍毕设,根本没让我介绍完,疯狂打断,问各种细节,谈到attention还让我去讲Transformer去了,然后回来接着讲我的模型,感觉他对我模型的质疑有很多
  2. 编程题
    1. 93. 复原 IP 地址
      没完全做出来。。。。dfs没太写对,当时样例过了8/20,后来面试官说我看明白了就这样吧,然后就反问了。。。感觉可能也想早点结束的样子
  3. 反问
    1. 部门业务
    2. 工作强度
    3. 感觉这几个问题回答的都很敷衍,跟我说单车投放什么的只是其中一个业务,然后也不多说了就。。。似乎就是不想回答想赶紧结束 - -

贝壳找房

6.27投递

一面 8.22 16:30-17:20 50min

  1. 自我介绍
    1. 介绍毕设
    2. 介绍中移动
      问了不少细节
  2. 讲xgb
  3. 讲bagging
  4. 讲adaboost
  5. 问深度学习模型了解么,bert之类的,我说不了解,transformer还行,没展开
  6. 算法题
    1. 102. 二叉树的层序遍历
  7. 反问
    1. 业务
      NLP+推荐,做经纪人培训、推荐房源等工作
    2. 部门规模
      整个部门400人,面试官部门50人

二面 8.22 18:00:19:00 60min

  1. 自我介绍
    1. 介绍毕设
    2. 介绍中移动
      问维特比算法,还问和其他算法的区别,我不懂,就没深挖
  2. xgb和gbdt
  3. 过拟合的原因,体现,解决方式
    一直问然后呢,问挺多
  4. 线程和进程的关系
    差点没答出来。。
  5. 编程题
    判断a,b在不在一颗二叉树里,在的话输出他俩的距离,不在的话返回-1
    解决方案就是利用最近公共祖先算法,不过需要提前判断一下这俩在不在二叉树里,找到最近公共祖先之后要计算祖先分别到a和b的距离,用层次遍历即可。

hr面 8.22 19:05-19:30 25min

  1. 遇到的困难
  2. leader负责的内容,干了什么
  3. 有offer么,还在面其他的么,看重哪些,怎么选择
  4. 怎么看待996加班等情况
  5. 反问
    1. 部门位置
    2. 新人培养体系

许愿offer!

OC 9.5

意向书 9.10

阿里夸克

一面 8.24 10:00-11:00 60min

  1. 自我介绍
    1. 毕设
      问了问一些细节,包括注意力怎么算的
    2. 中移动
    3. 虎门大桥
      问了问通行代价计算
  2. 问xgb或者bert熟悉么
    我说bert不太熟,知道transformer,xgb比较熟,面试官还奇怪你怎么xgb这么熟。。。是用的多还是理论熟
  3. 介绍xgb
  4. xgb的参数
  5. xgb调参的时候哪些优先级比较高
  6. xgb的lr和nn的lr一样吗
  7. 编程题
    1. 704. 二分查找
    2. 智力题
      A B C D × 4 = D C B A ABCD \times 4 = DCBA ABCD×4=DCBA,求解 A B C D ABCD ABCD
      答案是2178
  8. Transformer的encoder结构,attention怎么算的,qkv是相同的嘛(不同,是同一个input经过三个线性映射得到的)
  9. 反问
    1. 部门业务和技术
      做搜索效果的,给定Query,进行各种分析、词切分、重要性计算、纠错改写等,还有对查询返回的结果进行各种排序算法

二面 8.25 14:10-15:00 50min

面试官紧急开会迟到了几分钟,才给我发视频面试链接,我还小着急了一下,不过面试官人真的很好

  1. 自我介绍
    1. 毕设
      深挖了两个模块的做法,提了很多问题,问具体怎么做的,到底有没有道理
  2. 智力题
    4 4 10 10四个数都要用,加减乘除还有括号,如何能够得到24
  3. 又问了我一下模型怎么想到的
  4. 反问
    1. 部门业务
      因为面试官说他紧急开会就是为了做一些大方向的修改,所以我又问了问业务,面试官的意思是夸克的搜索这块算法要做很大的创新修改
    2. 部门规模
      小组有六七人,整个部门的算法大概三四十人
    3. 有什么需要准备学习的
      多看看BERT,以及怎么应用在排序、召回中

hr面 8.26 14:00-14:50 50min

  1. 自我介绍
    1. 毕设
    2. 中移动
    3. 虎门大桥
  2. 有成就感的项目和自己的贡献
  3. 作为负责人承担的工作
  4. 学习成绩
  5. 遇到的困难
  6. 业余生活
  7. 最挫败的事情
  8. 为什么选择夸克
  9. 其他大厂的面试情况
  10. 能不能实习
  11. 反问
  12. 出结果时间,一到两周
  13. 工作加班情况
    有双休,大概995(也有走得晚的,估计是9105)

意向书 8.28

快手

一面 8.28 17:00-18:00 60min

  1. 自我介绍
    1. 毕设
      了解了数据量等,以及后面提到的一些扩展
  2. Attention介绍
  3. Attention相似性矩阵计算的方式
  4. CNN和RNN的区别等,说一通
  5. 梯度消失爆炸怎么缓解
  6. 各种优化器介绍
  7. BN介绍一下,以及测试的时候BN怎么操作的,因为测试的时候BN可能一条一条来,不能算整个Batch的均值方差了。答案是用训练集的均值方差,只不过有很多不同的策略,比如滑动窗口之类的。我说我不知道,不过估计就是用训练集均值方差
  8. XGB介绍
  9. LR和SVM的区别
  10. SVM的核函数都有什么,为什么有核函数
  11. 样本不均衡怎么办
  12. … 感觉可能还有点,反正就各种问题都问。。。几乎把整个机器学习深度学习重点难点都讲了感觉。。。然后每次还说嗯你掌握挺好。。。。。。
  13. 编程题
    剑指 Offer 38. 字符串的排列
    两三分钟就直接A了,做完再讲一下思路
  14. 反问
    1. 部门业务
      风控,跟百度的基本一样
    2. 部门分配
      可能如果能入职的话进去看个人意愿之类的
    3. 上班时间
      早10晚9,没有大小周了。“616”和“双十一”每年两个加班节点

二面 9.4 11:00-11:40 40min

  1. 自我介绍
    1. 毕设
    2. 移动
    3. 虎门大桥
  2. 问评价指标和损失函数怎么用,为什么不同设定下模型效果会有区别
    问的奇奇怪怪的。。。。。。
  3. 问dropout,为什么不用dropout
  4. 问BN,为什么BN能防止过拟合
  5. 编程题
    1. 122. 买卖股票的最佳时机 II
      我还用了动态规划。。似乎不是最优解,不过反正过了
  6. 反问
    1. 工作时间我又问了一遍。。
    2. 用不用pytorch,因为面试官刚才问了我一下,我以为不能用
    3. 面试流程
      如果过了还有hr面
    4. 面试体验一般,面试官有点奇奇怪怪,还一直在聊手机,感觉不是很上心,虽然彼此彼此吧。。

京东

一面 8.25 10:40-11:25 45min

忘了记了。。。。

二面 9.1 10:00-10:40 40min

  1. 自我介绍
    1. 毕设
      讲了讲就不听了。。。
  2. 问注意力还用在哪些模型有了解么,Transformer,那介绍一下结构
  3. RNN和LSTM区别什么的
    刚讲了几句,就说行我看你挺了解,不用讲了。。
  4. 问毕设这个遇到最大困难是什么
  5. 编程题
    1. 笔试的第二题 小熊猫吃竹子
      给定竹子能吃的长度A B C,竹子总长N,问最多能吃几段

      这面试官有点狠。。直接问个之前做过的。。。我就讲了一下动态规划的思路和状态转移,就行了

    2. 剑指 Offer 28. 对称的二叉树

    3. 200. 岛屿数量

  6. 有没有比赛经历什么的
  7. 从什么时候开始接触算法(深度学习,机器学习)的
  8. 为啥不实习
  9. 问我怎么选择公司,看重哪些方面,城市意象
  10. 反问
    1. 部门业务
    2. 新人培养
    3. 面试流程
      后面如果过了就hr
    4. 这面试官挺有意思,跟我说他在阿里和腾讯都待过,但是就认为京东现在发展特别好,人文关怀好,环境舒适。。。夸了一通哈哈

hr面 9.6 20:30-21:00 30min

  1. 自我介绍
  2. 最大的困难
  3. 选择公司的标准
  4. 怎么看待京东
  5. 问我怎么看待公司远
  6. 反问
    1. 工作时间
    2. 福利待遇
    3. 跟我说二面面试官很牛,能通过他的面试很不容易,hr本身对这次面试感觉也还不错,如果能给我offer希望能去

意向书 9.15

你可能感兴趣的:(面经,面试,算法,机器学习,深度学习)