360 智能城市-机器学习岗实习 面经2019 (已拿offer)

一面

主要了解项目相关内容

xgboost,lightGBM

机器学习评价指标

手撕代码:字符串的修改

小B最近迷上了字符串处理技术,他设计了各种处理方式,并计算字符串的属性。这次也不例外,他定义了一种新的字符置换方式。小B研究的字符串由ASCII码字母和“.”构成,这次的研究对象是“.”。他关心的对象是字符串中出现的连续两个“.”。若每次操作把其中最开始的连续两个“.”以一个“.”替代,则可以将函数f(s) 定义为使得串中不出现连续两个“.”的最小置换次数。现考虑m个字符替换操作,每次将指定位置的字符替换为给定的字符,求替换后函数f(s)的值。

二面

1.特征工程怎么做?
整体一个流程是怎么样的?
提到缺失值的处理,异常值处理,
问了DBSCAN与Kmeans的区别,问了Kmeans的复杂度

2.离散特征,连续特征,连续特征转离散特征怎么转,作用是什么(其实是在问分箱的原理,类型和作用)

3. one-hot编码怎么做的,有什么作用

4.特征选择的三类方法,
过滤法常见哪些指标,
信息增益怎么算的?
嵌入法L2正则与L1正则的区别,作用

5.熟悉的机器学习模型聊了一下LR和SVM
对比了一下
SVM的硬间隔和软间隔
损失函数HingleLoss

6.推荐系统的项目描述一遍
里面特征怎么弄的,
用了哪些模型,GBDT的特点与优势在哪里,xgboost和lightGBM呢
后续准备继续优化当前的模型,还是考虑新的模型(新模型 deep&cross,deepFM,DIN)

7.tensoflow与spark?马上说spark刚开始学,自己开始搭,然后问tensorflow有没有自己实现过模型,然后问了里面的estimators和feature_column,
feature_column是什么我一脸懵逼,然后他解释说是把数值型特征跟类别型特征串起来,不太懂

8. 手撕代码:最大子数组和

HR面

常规问题:优势与不足,有没有offer,实习时间等

你可能感兴趣的:(算法,机器学习,笔试面试)