2019-3-4 面试数据分析师(但是要求会挖掘算法)
面试问题(无序):
1 结巴分词用过,那说一下他的原理?
2 你们项目使用GBDT,为什么不使用XGBoost,他们的区别
3 公司不要求你都会公式推倒,只要会调包调参就行
4 js渲染或者xml怎么处理?python有个专门处理这个问题的包,你了解吗?(我还真没了解过)
5 爬虫会不会?xpath和re熟不熟?(我也不知道为什么问这个,可能要用到吧)
6 多进程 多线程 协程 会不会写,有没有实战经验?详细说一下协程的原理及代码实现?(学一下asynic包)
7 git版本控制有没有用过,基础命令有哪些,你还知道其他哪些命令?难道有公司不使用git?所以你必须熟!
8 后台项目上线你是否接触过?django访问量限制还是什么....这个记不清了.
9 flask简单问一下有没有用过,因为数据挖掘可能要写后台借口供调用.
10 傅里叶变换知道不?
11 说一下PCA和因子分析.(我因子分析不知道...)
12 大文本数据分析,怎么处理(不知道)
13 TF搭建神经网络会不会,有没有对照TF官网教程自己搭建过.(就是说不用实战项目,对着教程撸一遍熟悉入门即可)
14 样本数据不平衡怎么处理(过采样,欠采样)
15 你用过k-means,那为什么不用DBSCAN,说说区别.....
16 说一下什么是cross-validation ( 我特么把 cross-validation 和 grid search 说反了,这种低级错误,一个题就可以pass你....智障如我)
17 正则项知道不,怎么用?什么作用?
18 github有没有自己的项目,有没有参与过github开源项目.
19 随机森林 哪些参数,怎么调参,注意事项,评价方法,阈值,选参
20 numpy pandas matplotlib seaborn 根本没问 闭包没问
21 许多网络新式传销借助新概念P2P等去拉人头,求职注意
22 工资组成问清楚 说10K,有可能基础工资只有5K,五险一金按照什么标准交.
你有什么要问的?(这玩意得总结一下....)