奇虎360自然语言处理面试总结

奇虎360面试主要考察的知识点:

1.机器学习常用的分类算法,Logistic回归,SVM,Decision Tree,随机森林等相关分类算法的原理,公式推导,模型评价,模型调参。模型使用场景

2.机器学习常用的聚类算法,Kmeans,BDSCAN,SOM(个人论文中使用的算法),LDA等算法的原理,算法(模型)中参数的确定,具体到确定的方法;模型的评价,例如LDA应该确定几个主题,Kmeans的k如何确定,DBSCAN密度可达与密度直达。模型使用场景

3.特征工程:特征选择,特征提取,PCA降维方法中参数主成分的确定方法,如何进行特征选择

4.Boosting和bagging的区别

5.数据如何去除噪声,如何找到离群点,异常值,现有机器学习算法哪些可以去除噪声

6.HMM与N-gram模型之间的区别

7.梯度消失与梯度爆炸

8.奥卡姆剃须刀原理

9.TCP三次握手的原理,为什么是三次而不是其他次

10.进行数据处理时,如何过滤无用的信息(例如利用正则表达式提取或者其他方法),数据乱码的处理

11.交叉熵与信息熵,信息增益与信息增益率,gini系数,具体如何计算

12.BIC准则(贝叶斯信息准则)与AIC(赤池信息准则)

13.需要手写代码(此次面试:字符串的操作)

14.前向传播与反向传播

15.常见的损失函数

最后面试官给的建议:1.多看(看文献,看别人的成果)2.视野要打开,需要进一步扩宽知识面,在校期间更多关注理论,工作时没有太多的时间关注理论而更多是偏向业务,理论:数学,统计学,同时需要多读多练

向面试官提问时,尤其是技术类面试,尽量不要用短时间内这个词,毕竟技术是一个积累的过程。

原创申明:此博文为博主原创,未经允许不得转载

你可能感兴趣的:(机器学习)