算法数分面经

记录23届非常坎坷的找暑期实习之旅,应用统计菜鸡前后投递50+公司的面试进展

字节二面挂

阿里二面挂

网易一面挂

美团一面挂

联想一面挂

腾讯一面挂

oppo oc

货拉拉 oc

特斯拉二面挂

滴滴二面鸽了

快手一面挂

婚礼纪 二面鸽了

安恒信息 二面挂

tplink 三面挂

华为 oc

上面是参加过面试的,排面试的公司其实相对我投简历的公司比例较少了,有一堆简历挂(哔哩哔哩,深信服。。。),笔试挂(得物,广联达。。。),或者好多投递完(小米,思谋科技,顺丰,爱奇艺,小红书。。。)没消息的没有统计

主要投递的岗有推荐搜索,机器学习,技术向的数分,数据挖掘

面试常问的一些问题主要还是从每个人的简历入手,上面涉及到什么模型,或者自己写了什么技能,会追着问一些,直接汇总每家问了什么

面试常问

  1. 自我介绍
  2. 英语自我介绍,你遇到过的困难(特斯拉)
  3. 项目介绍,你在项目中的角色,负责的内容
  4. 你学过的课介绍一下
  5. 用什么计算机语言
  6. 成绩(tp-link)
  7. 为什么本科在哈尔滨,研究生来武汉
  8. 你对我们公司的了解,公司里有认识的人么
  9. 未来的职业规划
  10. 期望薪资
  11. 估计浙江有多少车(费米估算问题)
  12. 做过的项目如果再做一遍,会改进什么
  13. 怎么评估你模型的好坏,怎么教业务人员用你的模型
  14. 为什么用某个模型
  15. 你的优缺点
  16. 数据处理做了哪些工作
  17. 特征编码
  18. 多重共线性对模型的影响,是对所有模型都有影响么
  19. l1,l2正则
  20. attention机制了解么
  21. rnn,lstm,gru介绍一下,区别
  22. 梯度消失,梯度爆炸,怎么解决
  23. 激活函数介绍
  24. 优化器了解么
  25. 批归一化懂么
  26. dropout是前向传播还是反向传播时候起作用的
  27. 模型过拟合怎么解决
  28. 类别不均衡怎么解决(数据,模型,评价指标)
  29. 评价指标,recall,precision,roc,auc,分类模型为什么用roc,不用recall
  30. 用的什么可视化工具(面了某家数分问的)
  31. bagging和boosting的区别
  32. 介绍下xgboost
  33. 介绍下lightgbm,lightgbm怎么处理数据缺失
  34. 欠采样,过采样,他们适用的场合
  35. ID3,C4.5,CART如何计算特征重要性
  36. 什么是熵
  37. SVM核函数,适用场合
  38. 因为我写了时序的比赛,碰到过对时序感兴趣面试官,问了时序的特征工程,奇异谱分析是什么,时序分解的方法,为什么用深度学习的模型不用传统模型,了解前沿的时序模型么
  39. 损失函数说一下,交叉熵损失,hinge损失
  40. 灰度关联分析(因为我的数学建模用了这个)
  41. 分布式计算框架是什么,为什么采取分布式计算(tp-link)
  42. 介绍分类模型,和他们适用场合
  43. k折交叉验证
  44. stacking模型融合
  45. LR原理
  46. 最大似然原理
  47. 随机过程学什么了,统计计算学什么了
  48. EM算法
  49. kmean每次结果一样么,质心怎么初始化

手撕代码

  1. 顺时针打印矩阵
  2. 计算器(字节)
  3. 二叉树层序遍历(考了两遍,忘了哪家)
  4. 矩阵最大正方形
  5. 岛屿个数
  6. 二叉树里有无和为target的两个数(快手数分)
  7. 冒泡排序
  8. 最长公共子串
  9. 最长无重复子字符
  10. python写个混淆矩阵的函数(美团商业分析)
  11. sql考一些窗口函数,dense_rank(),row_number(),rank()的区别,累计求和

你可能感兴趣的:(面试,面试,算法)