一波NLP算法实习生面经(12月中旬)

平安金融一账通:

一面:(大概)

1.LSTM的结构

2.讲一下n-gram和词袋模型

二面:

1.将1234000翻译成0001234,或者讲一下seq2seq

答:听过,但是没深入了解(我项目上只写了情感分析啊,咋问的那么多其他方向的,回去好好准备下)

2.智力题,10个硬币,4正6反在一堆,闭眼分成两堆,每一枚硬币最多翻转一次,使两堆正面数量一样。

答:因为题目是口述的,一直理解成使两堆正反面都一样,无解啊,挣扎了10min后投降

小哥回答:4,6分两堆,将4的一堆全反转。

让等着,15min后直接让走了,卒。

通联数据:

一面:(总监?)

1.句子最大长度怎么选择

答:取总的平均即50%。

  大佬说我们这一般都是取的80%,不然损失太大

2.何时停止训练,可以开始测试集了

答:网上看到的按经验来说是训练集准确率到95%

再次被教育

3.怎么防止过拟合

答:加正则、加dropout

4.怎么提升项目效果

答:改进模型,改进loss函数

大佬说:这些都比较难实现,先得看数据集,保正数据是好的把(标签对,没有无效样本)

5.智力题:跑马场5条赛道,25批马,没有表,跑几场可以确定前三?

题目正好我看到过,(先编号1-25)先25匹跑5场,淘汰10匹(每场四五名),再取5个第一跑第六场,留下123 45 7。除了第一确定,剩下的5匹跑第七场取前二。

答完对方很满意,说你一定能做好算法岗,没几人做出我这题。

当我回去等offer时,一星期后卒。

平安科技:

要做PPT,因为项目少,讲了一会就没了。

回忆了下也没问啥,只记得算法题了。

1.算法题:乱序一维list,返回三数之和为100的数,不额外开空间,时间越快越好。

答:三重循环,直接爆炸。(就刷了剑指offer,还没刷leetcode啊!)

这题答案可以去leetcode自行查看。

 

你可能感兴趣的:(面经)