秋招记录-阿里

一面通过,拖了30天还是面试中,也是真的无语,可能是自己还太弱吧。

电面:
1、项目经验
2、能够介绍一下DQN的基本原理么?
3、你了解的CTR预估模型有哪些?
4、能讲一下GBDT的原理么?
5、GBDT和随机森林有什么区别?
6、随机森林的采样体现在哪方面?
7、Wide &Deep的原理简单介绍一下?
8、GBDT+LR是怎么做的?

一面:
1、介绍项目(项目的背景/如何评价/实现过程/算法更新/用户体验)
2、Seq2Seq模型介绍一下
3、Lstm为什么能解决梯度消失问题 ,
4、lstm里面的状态更新是怎样的,各个门是怎样的?
5、DQN模型为什么要做经验回放?
数据之间具有相关性
6、数据之间如果不是独立同分布的会怎样?
在不少问题中要求样本(数据)采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集,使用同分布假设能够使得这个做法解释得通。
机器学习就是利用当前获取到的信息(或数据)进行训练学习,用以对未来的数据进行预测、模拟。因此需要我们使用的历史数据具有总体的代表性。
7、AUC的原理介绍一下
8、PG的原理是怎样的
9、你们项目里面CTR预估模型的后续的改进方向有哪些
10、层次遍历二叉树
11、扑克概率问题:52张牌,去掉大小王,然后六个人每人发2张牌,剩40张牌,然后从40张里面放五张到牌面上,当放到3张时,你发现你手里是两张K,牌面上的三张都不是K,那么即将放到牌面上的两张牌中,只有一张K的概率是多少?
思路,我们已经知道了5张牌,里面有两张K,牌面上的三张都不是K,那么剩了47张牌,每张牌是K的概率都是2/47

二面内推人说通过了,过了三十天没有被捞简历,结果简历丢到池子里了。幸好被淘宝技术部的人捞起来了。

三面:
1、你为什么要写博客?举一个例子说明?
2、你认为实验室和公司工作,主要的区别是什么?
3、如何检验你CTR模型的,如何判断一个特征加入模型是否有效。
4、如果你想往模型中加入一个特征,如何判定这个特征是否有效?
5、LR和FM的区别?FM需要进行交叉特征的选择么?如果在LR选了一部分特征做交叉之后,取得了比FM更好的效果,这是为什么?如果FM变成DeepFM之后,效果超过了LR,这又是为什么?
6、为什么说LR模型是可解释的?如果一个离散特征有成千个维度,那么结果如何解释。

先记这么多吧,第一次视频面试,有些不习惯。

你可能感兴趣的:(秋招记录-阿里)