机器学习(AI)工程师面试--复习要点

这段时间换工作,在家系统的准备了一下面试,从最开始没准备的时候,被面试官问的无地自容,这个也不知道,那个就算知道是什么意思但是也说不清楚,到准备之后,面试官问机器学习相关的东西完全招架的住。
这次复习重新读了西瓜书,好好研究了一下《统计学习方法》的第二版,然后把《百面机器学习》翻了一大半,外加上以前写的一些博客,知乎的一些收藏,总结了16页纸,现把要点罗列出来,供大家准备面试的时候参考一下。

以下每个部分都很重要!
以下每个部分都很重要!
以下每个部分都很重要!


Part0 关于面试

  1. 简历上写的一个字都用弄明白,尊重你在简历上写的每一个字,靠谱的公司的面试官也只会围绕简历问,如果不是,要么面试官水平不行要么公司业务不行,这种公司也不要去
  2. 面试会就会,不会就不会,可以和面试官交流,记下问题回去研究一下,结果出来之前不要放弃
  3. 针对不同岗位做不同的简历:如算法、NLP/CV、数据挖掘,项目经历展现不同侧重点
  4. 不可能什么都懂,但是懂得一定要想办法在面试的时候讲出来,不要让面试官猜你会什么东西

Part1 特征工程

  1. 归一化和标准化相关概念,有什么作用,几种不同归一化的公式
  2. 特征工程
  • filter:方差选择、相关系数、卡方检验、互信息
  • wrapper: 递归消除特征
  • embedded:L1筛选特征的原理(L1和L2的区别,对抗过拟合原理)、树模型进行特征筛选
  1. 文本表示:TF-IDF、LDA、word2vector原理(做NLP的要了解Elmo、Transformer、BERT相关)
  2. 特征缺失时处理 方法

Part2 模型评估

  1. 准确率和召回率
  2. P-R曲线
  3. ROC曲线、AUC面积
  4. P-R曲线和ROC曲线的区别
  5. 模型检验方法:holdout、k-fold、bootstrap(公式推导)
  6. 参数调优:网格搜索、随机搜索、贝叶斯优化
  7. 欠拟合、过拟合:概念、如何避免(这个一定要好好研究,一定会问)

这个部分很基础,但是如果面试官经验丰富,完全可以把你问崩溃,而且这些概念一定会在面试中出现,所以务必重视

Part3 经典算法

  1. SVM:公式推导、对偶和KKT的理解、优劣势
  2. LR:公式推导,和SVM的区别
  3. 决策树:
  • ID3:最大信息增益公式,举例说明
  • C4.5:最大信息增益率公式(最终信息划分选择),和ID3区别,举例说明
  • CART:基尼指数公式、回归树步骤,三种树的区别
  • 预剪枝和后剪枝:概念和作用

Part4 集成学习

  1. 随机森林:随机性、特点、参数
  2. Adaboost:步骤、特点
  3. GBDT:特点,推导过程
  4. Xgboost:和GBDT的区别、特点

把GBDT和Xgboost好好研究一番

Part5 主题模型

1.pLSA

  1. LDA:概念、原理

Part6 优化方法

  1. 平方差损失:概念、梯度下降公式推导
  2. 凸函数:概念
  3. 梯度下降
  4. 牛顿法
  5. 正则化和稀疏性:这和问题一定要搞透彻

Part7 深度学习

  1. CNN
  2. RNN
  3. Attention:self-attention
    (以上三点的基本内容一定要熟悉,做CV就好好理解CNN,包括BP推导,做NLP就好好理解LSTM和Transformer)
  4. dropout、BN、优化器选择等等trick
  5. 深度学习调参方法和步骤

你可能感兴趣的:(机器学习(AI)工程师面试--复习要点)