机器学习面试求职问题汇总

机器学习面试求职问题汇总

 

类型一:基础概念类问题

问题1:过拟合与欠拟合(定义、产生的原因、解决的方法各是什么)。

问题2:L1正则与L2正则(有哪些常见的正则化方法?作用各是什么?区别是什么?为什么加正则化项能防止模型过拟合)。

间题3:模型方差和偏差(能解释一下机器学习中的方差和偏差吗?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?举例说明一下)。

问题4:奥卡姆剃刀(说一说机器学习中的奥卡剪梯刀原理)。

问题5:模型评估指标(回归模型和分类模型各有哪些常见的评估指标?各白的含义是什么?解释一下AUC?你在平时的实践过程中用到过哪些评估捐标?为什要选择这些指标)。

问题6:风险函数(说一下经验风险和结构风险的含义和异同点)。

问题7:优化算法(机器学习中常见的优化算法有哪些?梯度下降法和牛顿法的原理推导)。

问题8:激活函放(神经网络模型中常用的激活函数有哪些?说一下各自的特点)。

问题9:核函数(核函数的定义和作用是什么?常用的核函数有哪些?你用过些核函数?说一下高斯核函数中的参数作用)。

问题10:梯度消失与梯度爆炸(解释一下梯度消失与梯度爆炸问题,各自有什么解决方案)。

问题11:有监督学习和无监督学习(说一下有监督学习和无监督学习的特点,举例说明一下)。

问题12:生成模型与判别模型(你知道生成模型和判别模型吗?各自的将点是什么?哪些模型是生成模型,哪些模型是判别模型)。

类型二:模型原理类

问题13:线性回归(线性回归模型的原理、损失函数、正则化项)。

问题14:KNN模型(KNN模型的原理、三要素、优化方案以及模望的优缺点)。

问题15:朴素贝叶斯(朴素贝叶斯模型的原理推导,拉普拉斯平滑,后验概率最大化的含义以及模型的优/缺点)。

问题16:决策树(决策树模型的原理、特征评价指标、剪枝过程和原理、几种常见的决策树模型、各自的优/缺点)。

问题17:随机森林模型(RF模型的基本原理,RF模型的两个“随机”。从偏差和方差角度说一下RF模型的优缺点,以及RF模型和梯度提升树模型的区别)。

问题18:AdaBoost(AdaBoost模型的原理推导、从偏差和方差角度说一下AdaBoost、Adaboost模型的优点)。

问题19:梯度提升树模型(GBDT模型的原理推导、使用GBDT模型进行特征组合的过程、GBDT模型的优缺点)。

问题20:XGBoost(XGBoost模型的基本原理、XGBoost模型和GBDT模型的异同点、XGBoost模型的优缺点)。

问题21:Logistic回归模型(LR模型的原理、本质,LR模型的损失函数,能否使用均方损失、为什么)。

问题22:支持向量机模型(SVM模型的原理,什么是“支持向量”?为什么使用拉格朗日对偶性?说一下KKT条件、软间隔SVM和硬间隔SVM的异同点。SVM怎样实现非线性分类?SVM常用的核函数有哪些?SVM模型的优缺点各是什么)

问题23:K-Means类(K-Means聚类的过程和原理是什么?优化方案有哪各自优缺点是什么)。

问题24:层次聚类(层次聚类的过程、原理和优缺点)。

间题25:密度聚类(密度聚类的基本原理和优缺点)。

问题26:谱聚类(谱聚类的基本原理和优缺点)。

问题27:高斯混合聚类(高斯混合滚类的原理和优缺点)。

问题28:EM算法(EM算法的导过程和应用场景)。

问题29:特征分解与奇异值分解(特征分解与奇外值分解的原理、异同点、应用场景)。

问题30:主成分分析(PCA模型的原理、过程、应用场景)。

问题31:线性判别分析(LDA模型的原理、过程、应用场景)。

问题32:局部线性嵌入(LLE模型的原理、过程、应用场景)。

问题33:词向量(Word2Vec模型和Doc2Vec模型的类别,各自原理推导、应用和参数调节)。

问题34:深度神经网络(深度神经网终模型的原理,反向传播的推导过程,常用的激活函数,梯度消失与梯度爆炸问题怎么解决?说一下深度神经网络中的Dropout、早停、正则化)。

类型三:模型比较类

问题35:LR模型与SVM模型的异同点。

问题36:LR模型与朴素贝叶斯模型的异同点。

问题37:K近邻模型与 K-Means模型的异同点。

问题38:ID3决策树、C4.5决策树、CART决策树的异同点。

问题39:PCA模型与LDA模型的异同点。

问题40:Bagging模型与 Boosting模型的异同点。

问题41:GBDT模型与 XGBoost模型的异同点。

问题42:Word2Vec模型中CWOB模式与Skip模式的异同点。

问题43:Word2Vec模型和 Doc2Vec模型的异同点。

类型四:模型技巧类

问题44:模型调参(随便选一个上述涉及的模型,说一下它的调参方式与过程)。

问题45:特征组合(常见的特征组合方式有哪些?各自特点是什么)。

问题46:特征工程(结合实践解释一下你所理解的特征工程)。

问题47:缺失值问题(说一下你遇到的缺失值处理问题,你理方式?你使用过哪些,效果怎样)。

问题48:样本不平衡问题(你知道样本不平衡问题吗?你是怎样处理的?效果怎么样?除上采样和下采样外,你还能自己设计什么比较新颖的方式吗?)。

问题49:特征筛选(特征师选有哪几种常见的方式?结合自己的实践经验说下各自的原理和特点。)

问题50:模型选择(你一般怎样挑选合适的模?有实际的例子吗?)。

问题51:模型组合(你知道哪些模型组合方式?除了运用 AdaBoost和R,你白己有使用过 Bagging和 Embedding方式组合模型吗?结合实际例子说明一下)。

问题52:A/B测试(了解AB测试吗?为什么要使用A/B测试)。

问题53:降维(为什么要使用降维?你知道哪些降维方法?你用过哪些降维方式?结合实际使用说明一下)。

问题54:项目(你做过哪些相关的项目?挑一个你觉得印象最深刻的说明一下)。

问题55:踩过的坑(你在使川机器学习模型中踩过哪些坑?最后你是如何解决的)。

类型五:求职技巧类

问题56:机器学习求职要准备哪些项?各项对应如何准备?

问题57:机器学习相关的学习内容有哪些?学习路线应该怎么定?有什么推荐的学习资料?

间题58:机器学习岗位求职的投递方式有哪些?什么时间投递最合适?投递目标应该怎样选择?

问题59:机器学习岗位求职的简历最好与哪些内容?所做的项目应该如何描述?

问题60:面试过程中自我介绍如何说比较合适?求职心态应该如何摆正?如果遇到压力该如何面对?面试过程中如何掌握主导权?怎样回答面试官最后的“你还有什么要间我的”问题?怎样面对最后的人力资源面试?

你可能感兴趣的:(人工智能)