2019年秋招算法岗面试经验

  • CVTE-数据挖掘组

一面(8.20):

  1. 自我介绍一下,简单的说一下在校的项目和所学的课程。
  2. 怎么看待数据挖掘?为什么要进行数据挖掘?
  3. 数据挖掘过程是什么?
  4. 介绍自己的论文工作...
  5. 数据处理过程中:正态分布数据补全方式有中值和均值,各有什么异同,为什么要采用后者?
  6. 特征选择中,相关性分析是分析什么之间的相关性?什么原理?特征和ground truth的线性表的斜率和相关性大小有关系吗?
  7. 逐步回归原理,以及采用什么检验方法?T检验和F检验异同。
  8.  Boosting和Bagging原理,比较不同。Boosting对样本根据误差重加权在整个结果上体现在哪里(损失函数最小)?RF原理及其与Bagging的不同。
  9. 对数据挖掘组哪些方向比较感兴趣,为什么?
  10. 有什么想问的?

二面(8.21):

  1. 做个简短的自我介绍。
  2. 讲讲投会议的论文内容。
  3. 模型选的什么分类器?有没有对比算法?为什么选择SVM?为什么不用深度网络做实验(样本量有限)?
  4. 推导SVM,为什么采用拉格朗日乘子法?
  5. SVM优缺点,为什么会对缺失值敏感?
  6. 有哪些核函数?分别适用于什么场景?核的选择。
  7. 介绍一下Word2vector,Skip-gram和CBOW分别是什么?Word2Vec中负采样(negative sampling)介绍一下。采用什么平滑方法。
  8. 平滑操作目的是什么?平滑方法有什么?
  9. 是否愿意进行一个长期实习?
  • 中兴-算法岗

一面(9.14)

  1. 介绍下自己。
  2. 模式识别的模块有哪些?(监督学习,无监督学习,强化学习)
  3. 降维的方法有哪些?(无监督:PCA;监督:LDA)
  4. 聚类的算法有什么?(就说了一个k means)
  5. 日后想从事算法岗位还是数据挖掘岗位(因为是临时被调度)
  6. 回答两个C语言选择题,错了一题。

二面(9.19)

  1. 介绍下自己
  2. 用英文介绍一下自己的研究方向,然后互动聊了一些。
  3. 怎么看待无人驾驶。
  4. 很多人说阿法狗将取代人类大脑 你怎么想?
  5. 什么是数据挖掘,包含什么工作?
  6. 期望的工作地点
  7. 怎么看待加班,以后有孩子了怎么办
  8. 倾向于互联网公司还是通信公司
  9. 说一下自己的优缺点

三、美团

一面(凉)

  1. 介绍下自己
  2. 自己研究的东西框架是什么样子的
  3. 设定一个场景:微信被盗,非法给亲朋好友发送信息,怎么检测是垃圾信息?
  4. 目前工业上或者学术上做到什么程度
  5. 相比较现有的,觉得自己做的东西的新颖点和创新点是什么,精度提高多少
  6. 手撕:二叉树层次遍历。
  7. 100!有多少个0 讲思想。
  • 百信银行
  1. 什么是人工智能?
  2. 什么是大数据,和数据挖掘有什么区别?
  3. 什么是智能计算?
  • 吉利汽车
  1. 用英文自我介绍
  2. 介绍了研究生期间的项目
  3. 项目过程中的难点
  • 华为

一面

着重垃圾邮件过滤聊

  1. Word2Vec存在问题,关联性太强,导致词汇成对出现。。。
  2. 与TF-IDF对比 工业上TF-IDF用的多
  3. 以用户发件人作为判别信息容易导致集体误判
  4. 有没有考虑再过滤出错问题

二面

  1. 贝叶斯表达式,推导公式,结合你的问题,贝叶斯怎么实现分类
  2. 熟悉哪些算法(回答SVM),SVM的原理,公式,推导,怎么实现邮件分类
  3. 脑子有没有一个各种算法图谱?即有什么监督算法,非监督算法等
  4. 了解随机深林吗?
  5. 了解马尔科夫模型吗?
  6. 做过什么数据的处理?怎么处理的?
  7. K-means算法了解吗?
  8. 矩阵的推导公式知道吗(矩阵论)
  • Aibee

一面

  1. 讲了一下面试官感兴趣的项目情况
  2. 情景设置 描述难点
  3. 机器人在0坐标出向左右走,左走为负,右走为正,第一次走一步,第二次走两步,...,依次类推,说出要走到坐标X处最少需要发出多少次口令。

二面

  1. 主要项目介绍
  2. 两个情景设置描述

HR面

  1. 目前为止自己觉得比较成功的事情
  2. 家人朋友对自己的评价
  3. 总结自己优缺点
  4. 项目的可行性考虑哪些点:问题定性,考察现有方法能否实现,细节深入,遇到问题和别人讨论,换方法是否能完成,不行再放弃。
  5. 如果和同事观点不一致,怎么办?
  • 平安普惠

一面

  1. 数学:特征值和特征向量的关系,特征向量之间的关系;
  2. 统计问题:ROC曲线下的面积是什么;
  3. 机器学习:GBDT介绍;

图像的输出特征计算:500*500,stride(步长)为1,padding为0,卷积核为3*3,计算图像一层后的特征输出;

类不平衡情况的对应方法;

SVM核函数有哪些,KTT条件怎么来的,是什么;

为什么要平滑操作,什么是拉普拉斯平滑;

什么是多重共线性问题?

用什么对文本进行分词的,了解结巴分词吗?

TF-IDF中IDF是指的什么;

LR算法的原理;

  • 经卫视觉
  1. 介绍一下最熟悉的项目;
  2. 手撕代码:从列表中找出最大值和下标;找出所有最大和下标;(只遍历一遍)
  3. SVM的损失是什么,原理及其间隔最大化体现在哪。
  • CVTE校招

一面

  1. 操作系统:页面置换算法有哪些,为什么要进行页面置换;进程介绍;
  2. 数据结构:快排算法介绍一下,什么思想(二分法);堆排序介绍一下;
  3. 机器学习:LR和svm比较;

SVM中硬间隔和软间隔不同;

自助采样介绍了解;

XGBoost和GBDT介绍比较;

Boost和Bagging比较;

RF特性;

方差和偏差对应过拟合和欠拟合关系以及其对应模型的特性;

防止过拟合的方法;

正则化L1和L2了解,包括其原理和对应几何图形;

二面

  1. 介绍下自己
  2. 矩阵低秩分解

你可能感兴趣的:(面试经验)